阿里版GPT测评,世界上怎么会有这么嘴碎的AI!你给我停止生成

朋友提供情感价值更重要还是工具价值更重要?

阿里版GPT测评,世界上怎么会有这么嘴碎的AI!你给我停止生成

这是阿里的大模特“依桐·钱文”给出的答案。你怎么想呢?

ChatGPT发布后,几个月后全世界对AI的能力有了新的认识。科幻正在变成现实。既然我们人类迟早会与人工智能共存,不如先用依桐·钱文进行试验。AI是生活伴侣还是制作助理?你更擅长提供情感价值还是工具价值?

至于我们的结论,嗯,往下看吧。

聪明又健谈

阿里的AI有点“奇怪”?

在很多AI测试文章中,提问者会让AI先做自我介绍。我们决定玩点不一样的,让文欣说如何评价依桐·钱文。

我问的第一个问题:“评价依桐·钱文的问题”,文心一句话给出了如下回答:

阿里版GPT测评,世界上怎么会有这么嘴碎的AI!你给我停止生成

有意思,文新直接把依桐钱文和ChatGPT搞混了。

把问题改成“介绍一下阿里巴巴推出的依桐千问”后,文心终于用一句话理解了问题:

阿里版GPT测评,世界上怎么会有这么嘴碎的AI!你给我停止生成

以同样的形式提问。这是依桐·钱文介绍文心的话:

阿里版GPT测评,世界上怎么会有这么嘴碎的AI!你给我停止生成

虽然回答很短,但并没有迷惑开发者,比文心的表现要好。

从目前的测试结果来看,依桐钱文在简答题的信息检索准确率上至少要高于文心伊彦。

接下来,我们来问童益谦一些比较难的问题。

对于一般人来说,面对“吃西瓜为什么不吐葡萄皮?”当这样的脑筋急转弯时,你会很快意识到常识性错误并指出逻辑问题,那么依桐·钱文会如何回答呢?

阿里版GPT测评,世界上怎么会有这么嘴碎的AI!你给我停止生成

这里面好像没什么难度。第一句话说明西瓜和葡萄是不同的食物,不存在常识问题。但是,随后的解释似乎在一定程度上混淆了西瓜和葡萄的关系,最后的结论也有一些小瑕疵。似乎失去了很多!你为什么不少说点?

关于这个问题我也问过文的话:

阿里版GPT测评,世界上怎么会有这么嘴碎的AI!你给我停止生成

首先,西瓜属于葫芦科…其次,我想没有人会不切就把肉咬掉吧?显然文心的话在处理逻辑和常识错误的诱导题上还是有很多问题的。它没有意识到人类是在故意“欺骗”自己,而是开始根据问题收集相关信息,并根据数据模型将信息强行组合在一起,最后给出了一个奇怪的答案。

在下面的常见问题中,我发现依桐钱文偶尔会出现一些奇怪的bug,比如重复同一个答案,很有表现力。你认为这就像一个孩子进行了一场糟糕的对话吗?

下一个问题,出道哲学的问题:

阿里版GPT测评,世界上怎么会有这么嘴碎的AI!你给我停止生成

说实话,比我对人生的理解更深刻。只是因为…有点啰嗦,有些话一遍又一遍的重复,而且说的很快。我真的赶不上它疯狂输出的蓝色小光标。

我们来测试一下它的情商。当我告诉童益谦时,我非常难过:

阿里版GPT测评,世界上怎么会有这么嘴碎的AI!你给我停止生成

这是一种积极的安慰,但是没有用。我不指望它所说的能真正安慰我。遇到困难没有人倾诉的时候,在我身边陪我说说话就好。

当我告诉它我恋爱了,即将结婚的时候,它的表现就像一个热情而精明的情感分析师+婚礼策划。

阿里版GPT测评,世界上怎么会有这么嘴碎的AI!你给我停止生成

回答不错,给出的建议很实用,但是人情味好像少了点。“卖货”来的有点早,然后我按下了对话界面右下角的“停止生成”按钮,把它关了。

然而,接下来的考验让我坚信依桐·钱文很有潜力成为一名情感博主,因为它真的很健谈。

每次我跟它聊感情问题,它都忍不住长篇大论,给人一种“你也喜欢八卦”的感觉。比如我问他是怎么向喜欢的女生表白的,他写了几千字帮我出主意。AI狗头军师,你值得拥有。(傲娇脸。jpg)

阿里版GPT测评,世界上怎么会有这么嘴碎的AI!你给我停止生成

鉴于篇幅问题,我就不放全部截图了,因为它字数太多。感兴趣的朋友可以在依桐钱文公测后尝试一下,这可能会结束你多年的单身生活,前提是你不觉得这很烦人。

常识和情感问题似乎很难理解,那么文学鉴赏呢?

阿里版GPT测评,世界上怎么会有这么嘴碎的AI!你给我停止生成

阿里版GPT测评,世界上怎么会有这么嘴碎的AI!你给我停止生成

不得不说,诗词和文学鉴赏的答案都很到位,甚至还做了一个形象的描述,这都是它(逼)出来的。

如果童译千千有画图功能,我毫不怀疑它会当场给我画一幅描述“空雨后”的画。毕竟它真的很爱表达自己。

事实上,当我把达摩院文圣图的大模型(我知道是依桐钱文的兄弟姐妹)给它时,它为我生成了一张与描述相符的照片。

阿里版GPT测评,世界上怎么会有这么嘴碎的AI!你给我停止生成

达摩院相关负责人在最近的采访中表示,其实技术上没有问题,只是需要一些软件工程处理来完成。看来依桐·钱文将来可以用图片和文字来表达了。我很期待。毕竟以后我可以让它多画画少说话。

以上一系列测试主要是围绕生活/娱乐场景进行的,都是针对常识和知识的测试,那么它在生产力方面表现如何呢?

这不仅仅是一次对话

ChatGPT在生产力上的表现,不仅带来了新的生产力革命,也让很多人担心自己会被AI取代。作为一个类似ChatGPT的大AI模型,依桐钱文在生产力方面表现如何?

1。写一个脚本

阿里版GPT测评,世界上怎么会有这么嘴碎的AI!你给我停止生成

虽然从剧情上看并不惊艳,但也有开篇、挫折、高潮、结局的结构,是一个完整的故事。

2。写一个脚本

阿里版GPT测评,世界上怎么会有这么嘴碎的AI!你给我停止生成

其中一些很简单,但依桐·钱文显然有能力根据需要生成相应的脚本和脚本。

3。写一个提纲

阿里版GPT测评,世界上怎么会有这么嘴碎的AI!你给我停止生成

从专业编辑的角度来看,这份提纲具有很强的可操作性,沿着提纲写文章足以给出一份完美而有深度的行业报告。

作为辅助作品来用似乎还不错。而且它不仅懂中文,还懂英语和法语。按照它自己的说法,它掌握了17种语言。每一个我都没有测试过(它的噪音给我留下了阴影),所以以后有机会参与测试的朋友不妨体验一下。

我请童益谦帮我给美国女孩苏茜写一封信。内容是介绍中国的,这里直接翻译一下:

阿里版GPT测评,世界上怎么会有这么嘴碎的AI!你给我停止生成

从测试来看,只要你提供足够的信息,就可以写出一千道题。

4。SWOT分析

做市场分析的朋友对这个应该不陌生。

阿里版GPT测评,世界上怎么会有这么嘴碎的AI!你给我停止生成

作为一个非常了解手机市场的科技数码编辑,我很赞同童益谦的分析。除了几个小问题,我还没挑出其他毛病。我甚至可以据此写一份详细的报告。好吧,给它点个赞。

最后

从实际表现来看,依桐钱文与领先的GPT4.0还有较大差距,但与之前的一些AI大模型相比,依桐钱文在问答逻辑、信息检索、句子理解等方面都有明显进步。现在我对中国AI大模型的未来充满信心。

而且国内最大的AI模型社区魔术集也是达摩院打造和维护的。企业和个人可以更容易地训练和调整他们的AI模型。阿里也在开放一些AI模型,供企业和个人使用。有现在的水平可能是大家共同努力的结果。

世界在变,一个全新的AI时代即将到来。不管你看不看,大语言模型的能力是有的。关键是怎么用。如果你有一个“万能问题”,你会怎么用?欢迎在评论区留言。

本文内容及图片均整理自互联网,不代表本站立场,版权归原作者所有,如有侵权请联系admin#jikehao.com删除。
(0)
极客号的头像极客号
上一篇 2023年 4月 10日
下一篇 2023年 4月 10日

相关推荐

合作联系:1152QQ041010