知乎大模型“知海图AI”来了,要与GPT-4掰掰手腕

之前一直被视为“ChatGPT概念股”的知乎,终于做出了自己的大模型。在日前举行的“2023知乎发现大会”上,知乎发布了与绵强智能共同打造的大型模型产品“智海图AI”,双方的合作将以联合研发和战略投资的形式进行。据悉,目前这个大模型的第一个功能——热榜汇总已经开始内测,将对知乎热榜上的问题答案进行抓取、整理、汇总,并将答案展示给用户。

“知图AI”作为在toC内容平台上推出的大型语言模型项目,是基于清华NLP实验室和智能CPM-Bee(10B)模型的技术支持。根据官方说法,针对知乎热榜中的所有答案,在“热榜汇总”这一具体场景中,将“知乎海图AI”模型的效果与GPT-4进行对比,发现两种模型的性能相差无几。

要知道,在王小川眼里,目前国内的大模特和GPT的差距就是三年。即使他像李彦宏一样乐观,也只是喊出了一句“百度的文心和OpenAI的差距是两个月”。而在智虎这里,智海图艾敢说在特定场景会和GPT-4打成平手。

从某种意义上来说,知乎似乎是在学习手机厂商的“好榜样”。毕竟,只要定语加的足够多,谁都可以是“第一”。在很多业内人士看来,知乎将《识图AI》首秀放在知乎的热播榜上,可谓恰到好处。毕竟如果拼出来技术背景和应用范围,可能不是百度文心的话和阿里童的义千问的对手。

事实上,知乎进入大语模圈,加入“百模大战”几乎是必然的。如今,在移动互联网红利几乎耗尽的环境下,未来无疑是混乱的,互联网厂商拥抱变革以抢占可能通向未来的船票是必然的。利用大语言模型改造业务层,赋能具体的业务落地场景,一直是很多互联网厂商的常用策略。而且在现在的股票市场上,效率的一点点变化已经可以实现为竞争优势。

知乎大模型“知海图AI”来了,要与GPT-4掰掰手腕

如今做大语言模式,不仅是为了赶潮流,也是内容平台属性突出的知乎保持市场竞争力的一种方式。无论老用户如何抱怨,知乎依然是国内数一数二的优质内容平台。大家有没有注意到,微软整合ChatGPT的新Bing回答用户提问时,大量的参考资料都来自知乎,这足以证明知乎的内容质量得到了海外科技巨头的认可。

要知道,像ChatGPT这样的大语言模型之所以比之前的人工智能产品更智能,是因为它靠的是“大力飞砖”,还需要海量的语料库作为支撑,而且语料库本身质量更好,输出结果也会更好。有了得天独厚的资源作为基础,知乎如果对大语言模式视而不见,那就太鲁莽了。

另一方面,大语言模型实际上也需要知乎的优质答案帮助其实现迭代,从而进一步升级大语言模型的文本理解和语境关联。

知乎大模型“知海图AI”来了,要与GPT-4掰掰手腕

众所周知,基于人类反馈的强化学习(RLHF)是ChatGPT爆发的秘密武器。虽然OpenAI目前没有开源的RLHF,但外界只知道它是强化学习(RL)的扩展,将人类的反馈融入训练过程,为机器提供了一个自然、人性化的交互学习过程。

ChatGPT自己的解释是,与传统的RL相比,RLHF的优势在于更符合人类的意图,允许机器掌握明显嵌入人类经验中的决策元素,从各种类型的反馈中学习,并根据需要整理反馈。

知乎大模型“知海图AI”来了,要与GPT-4掰掰手腕

所以人类的反馈无疑是智能ChatGPT的关键,那么知乎能起到这样的作用吗?答案显然是肯定的,因为知乎是一个基于“认知盈余”的问答社区。如果将AI生成的答案放在知乎上,经过不同领域的专业用户验证,可以在反复调整中优化AI的性能。反过来,优质的原创内容也更容易被AI发现,有助于改变在知乎如今泥泞的环境下,优质内容越来越难被用户发现的窘境。

至于为什么知乎AI的第一个应用场景要聚焦在“热门榜单汇总”上,知乎CEO周源在接受媒体采访时表示,是受到了早期产品“答案汇总”的启发。他说,“那个功能(答案汇总)是对所有用户开放的,每个人都可以像维基一样编辑。后来发现这个东西太难了。回答次数过多后,成本很高,效果也不好。现在我可以通过技术手段帮助人们完成这样的事情。”

知乎大模型“知海图AI”来了,要与GPT-4掰掰手腕

如果用大语言模型直接创作,在知乎上答题,结果几乎肯定是灾难性的。相信很多朋友在使用ChatGPT、文新伊彦、新必应的时候会发现,生成式人工智能有一个非常突出的问题,就是严重的扯淡。但用户之所以知道ChatGPT在胡说八道,是因为你在提问之前对答案有了一个大概的了解,你有能力判断他给出的结果是否正确。但是如果用户不知道问题的答案呢?

智海图AI在热榜汇总上尽力了,可以说是知乎因地制宜实现的,因为这个功能是针对内容消费者的,而不是生产者的。通过类似于“长话短说”的热榜汇总功能,用户可以在不仔细浏览具体答案的情况下,大致了解人们围绕热榜话题发表了哪些评论。对于以实时新闻为主的知乎中的热榜来说,最大的好处就是把信息浓缩起来,帮助用户提高效率。

在这个碎片化的内容消费时代,短视频的出现证明了用户对仔细“咀嚼”内容提取信息越来越不耐烦。虽然优质内容是知乎的根本,但随着邀请制的取消,降低门槛后的大众化策略在带来大量用户的同时,也让知乎的环境变得泥泞,越来越难发现有价值的内容。有了热榜汇总,用AI帮助用户发掘优质内容,自然会盘活资源。

但是,对于创作者来说,热榜的总结未必是福音。热门榜单问题的答案整理出来,整理在用户面前。虽然满足了用户无障碍获取信息的痛点,但代价是用户既然看了本质,是否还会继续查看具体答案。所以结果会是,做了高质量回答的回答者可能不会被用户发现和关注,这意味着属于高质量回答者的流量无形中变少了。

沿着这个思路发散,我们会发现,既然用户找答案的工作被AI取代,就意味着热榜汇总有减少用户使用时间的风险。当其他app都在努力让用户留下来的时候,知乎无疑反其道而行之。而对于一个依靠广告和商业内容解决方案的平台来说,用户停留时间短几乎等于流量差,所以这似乎不是一个好的结果。

本文内容及图片均整理自互联网,不代表本站立场,版权归原作者所有,如有侵权请联系admin#jikehao.com删除。
(0)
极客号的头像极客号
上一篇 2023年 4月 21日
下一篇 2023年 4月 21日

相关推荐

合作联系:1152QQ041010