朋友提供情感价值更重要还是工具价值更重要?
这是阿里的大模特“依桐·钱文”给出的答案。你怎么想呢?
ChatGPT发布后,几个月后全世界对AI的能力有了新的认识。科幻正在变成现实。既然我们人类迟早会与人工智能共存,不如先用依桐·钱文进行试验。AI是生活伴侣还是制作助理?你更擅长提供情感价值还是工具价值?
至于我们的结论,嗯,往下看吧。
聪明又健谈
阿里的AI有点“奇怪”?
在很多AI测试文章中,提问者会让AI先做自我介绍。我们决定玩点不一样的,让文欣说如何评价依桐·钱文。
我问的第一个问题:“评价依桐·钱文的问题”,文心一句话给出了如下回答:
有意思,文新直接把依桐钱文和ChatGPT搞混了。
把问题改成“介绍一下阿里巴巴推出的依桐千问”后,文心终于用一句话理解了问题:
以同样的形式提问。这是依桐·钱文介绍文心的话:
虽然回答很短,但并没有迷惑开发者,比文心的表现要好。
从目前的测试结果来看,依桐钱文在简答题的信息检索准确率上至少要高于文心伊彦。
接下来,我们来问童益谦一些比较难的问题。
对于一般人来说,面对“吃西瓜为什么不吐葡萄皮?”当这样的脑筋急转弯时,你会很快意识到常识性错误并指出逻辑问题,那么依桐·钱文会如何回答呢?
这里面好像没什么难度。第一句话说明西瓜和葡萄是不同的食物,不存在常识问题。但是,随后的解释似乎在一定程度上混淆了西瓜和葡萄的关系,最后的结论也有一些小瑕疵。似乎失去了很多!你为什么不少说点?
关于这个问题我也问过文的话:
首先,西瓜属于葫芦科…其次,我想没有人会不切就把肉咬掉吧?显然文心的话在处理逻辑和常识错误的诱导题上还是有很多问题的。它没有意识到人类是在故意“欺骗”自己,而是开始根据问题收集相关信息,并根据数据模型将信息强行组合在一起,最后给出了一个奇怪的答案。
在下面的常见问题中,我发现依桐钱文偶尔会出现一些奇怪的bug,比如重复同一个答案,很有表现力。你认为这就像一个孩子进行了一场糟糕的对话吗?
下一个问题,出道哲学的问题:
说实话,比我对人生的理解更深刻。只是因为…有点啰嗦,有些话一遍又一遍的重复,而且说的很快。我真的赶不上它疯狂输出的蓝色小光标。
我们来测试一下它的情商。当我告诉童益谦时,我非常难过:
这是一种积极的安慰,但是没有用。我不指望它所说的能真正安慰我。遇到困难没有人倾诉的时候,在我身边陪我说说话就好。
当我告诉它我恋爱了,即将结婚的时候,它的表现就像一个热情而精明的情感分析师+婚礼策划。
回答不错,给出的建议很实用,但是人情味好像少了点。“卖货”来的有点早,然后我按下了对话界面右下角的“停止生成”按钮,把它关了。
然而,接下来的考验让我坚信依桐·钱文很有潜力成为一名情感博主,因为它真的很健谈。
每次我跟它聊感情问题,它都忍不住长篇大论,给人一种“你也喜欢八卦”的感觉。比如我问他是怎么向喜欢的女生表白的,他写了几千字帮我出主意。AI狗头军师,你值得拥有。(傲娇脸。jpg)
鉴于篇幅问题,我就不放全部截图了,因为它字数太多。感兴趣的朋友可以在依桐钱文公测后尝试一下,这可能会结束你多年的单身生活,前提是你不觉得这很烦人。
常识和情感问题似乎很难理解,那么文学鉴赏呢?
不得不说,诗词和文学鉴赏的答案都很到位,甚至还做了一个形象的描述,这都是它(逼)出来的。
如果童译千千有画图功能,我毫不怀疑它会当场给我画一幅描述“空雨后”的画。毕竟它真的很爱表达自己。
事实上,当我把达摩院文圣图的大模型(我知道是依桐钱文的兄弟姐妹)给它时,它为我生成了一张与描述相符的照片。
达摩院相关负责人在最近的采访中表示,其实技术上没有问题,只是需要一些软件工程处理来完成。看来依桐·钱文将来可以用图片和文字来表达了。我很期待。毕竟以后我可以让它多画画少说话。
以上一系列测试主要是围绕生活/娱乐场景进行的,都是针对常识和知识的测试,那么它在生产力方面表现如何呢?
这不仅仅是一次对话
ChatGPT在生产力上的表现,不仅带来了新的生产力革命,也让很多人担心自己会被AI取代。作为一个类似ChatGPT的大AI模型,依桐钱文在生产力方面表现如何?
1。写一个脚本
虽然从剧情上看并不惊艳,但也有开篇、挫折、高潮、结局的结构,是一个完整的故事。
2。写一个脚本
其中一些很简单,但依桐·钱文显然有能力根据需要生成相应的脚本和脚本。
3。写一个提纲
从专业编辑的角度来看,这份提纲具有很强的可操作性,沿着提纲写文章足以给出一份完美而有深度的行业报告。
作为辅助作品来用似乎还不错。而且它不仅懂中文,还懂英语和法语。按照它自己的说法,它掌握了17种语言。每一个我都没有测试过(它的噪音给我留下了阴影),所以以后有机会参与测试的朋友不妨体验一下。
我请童益谦帮我给美国女孩苏茜写一封信。内容是介绍中国的,这里直接翻译一下:
从测试来看,只要你提供足够的信息,就可以写出一千道题。
4。SWOT分析
做市场分析的朋友对这个应该不陌生。
作为一个非常了解手机市场的科技数码编辑,我很赞同童益谦的分析。除了几个小问题,我还没挑出其他毛病。我甚至可以据此写一份详细的报告。好吧,给它点个赞。
最后
从实际表现来看,依桐钱文与领先的GPT4.0还有较大差距,但与之前的一些AI大模型相比,依桐钱文在问答逻辑、信息检索、句子理解等方面都有明显进步。现在我对中国AI大模型的未来充满信心。
而且国内最大的AI模型社区魔术集也是达摩院打造和维护的。企业和个人可以更容易地训练和调整他们的AI模型。阿里也在开放一些AI模型,供企业和个人使用。有现在的水平可能是大家共同努力的结果。
世界在变,一个全新的AI时代即将到来。不管你看不看,大语言模型的能力是有的。关键是怎么用。如果你有一个“万能问题”,你会怎么用?欢迎在评论区留言。