知乎大模型“知海图AI”来了，要与GPT-4掰掰手腕

之前一直被视为“ChatGPT概念股”的知乎，终于做出了自己的大模型。在日前举行的“2023知乎发现大会”上，知乎发布了与绵强智能共同打造的大型模型产品“智海图AI”，双方的合作将以联合研发和战略投资的形式进行。据悉，目前这个大模型的第一个功能——热榜汇总已经开始内测，将对知乎热榜上的问题答案进行抓取、整理、汇总，并将答案展示给用户。

“知图AI”作为在toC内容平台上推出的大型语言模型项目，是基于清华NLP实验室和智能CPM-Bee(10B)模型的技术支持。根据官方说法，针对知乎热榜中的所有答案，在“热榜汇总”这一具体场景中，将“知乎海图AI”模型的效果与GPT-4进行对比，发现两种模型的性能相差无几。

要知道，在王小川眼里，目前国内的大模特和GPT的差距就是三年。即使他像李彦宏一样乐观，也只是喊出了一句“百度的文心和OpenAI的差距是两个月”。而在智虎这里，智海图艾敢说在特定场景会和GPT-4打成平手。

从某种意义上来说，知乎似乎是在学习手机厂商的“好榜样”。毕竟，只要定语加的足够多，谁都可以是“第一”。在很多业内人士看来，知乎将《识图AI》首秀放在知乎的热播榜上，可谓恰到好处。毕竟如果拼出来技术背景和应用范围，可能不是百度文心的话和阿里童的义千问的对手。

事实上，知乎进入大语模圈，加入“百模大战”几乎是必然的。如今，在移动互联网红利几乎耗尽的环境下，未来无疑是混乱的，互联网厂商拥抱变革以抢占可能通向未来的船票是必然的。利用大语言模型改造业务层，赋能具体的业务落地场景，一直是很多互联网厂商的常用策略。而且在现在的股票市场上，效率的一点点变化已经可以实现为竞争优势。

如今做大语言模式，不仅是为了赶潮流，也是内容平台属性突出的知乎保持市场竞争力的一种方式。无论老用户如何抱怨，知乎依然是国内数一数二的优质内容平台。大家有没有注意到，微软整合ChatGPT的新Bing回答用户提问时，大量的参考资料都来自知乎，这足以证明知乎的内容质量得到了海外科技巨头的认可。

要知道，像ChatGPT这样的大语言模型之所以比之前的人工智能产品更智能，是因为它靠的是“大力飞砖”，还需要海量的语料库作为支撑，而且语料库本身质量更好，输出结果也会更好。有了得天独厚的资源作为基础，知乎如果对大语言模式视而不见，那就太鲁莽了。

另一方面，大语言模型实际上也需要知乎的优质答案帮助其实现迭代，从而进一步升级大语言模型的文本理解和语境关联。

众所周知，基于人类反馈的强化学习(RLHF)是ChatGPT爆发的秘密武器。虽然OpenAI目前没有开源的RLHF，但外界只知道它是强化学习(RL)的扩展，将人类的反馈融入训练过程，为机器提供了一个自然、人性化的交互学习过程。

ChatGPT自己的解释是，与传统的RL相比，RLHF的优势在于更符合人类的意图，允许机器掌握明显嵌入人类经验中的决策元素，从各种类型的反馈中学习，并根据需要整理反馈。

所以人类的反馈无疑是智能ChatGPT的关键，那么知乎能起到这样的作用吗？答案显然是肯定的，因为知乎是一个基于“认知盈余”的问答社区。如果将AI生成的答案放在知乎上，经过不同领域的专业用户验证，可以在反复调整中优化AI的性能。反过来，优质的原创内容也更容易被AI发现，有助于改变在知乎如今泥泞的环境下，优质内容越来越难被用户发现的窘境。

至于为什么知乎AI的第一个应用场景要聚焦在“热门榜单汇总”上，知乎CEO周源在接受媒体采访时表示，是受到了早期产品“答案汇总”的启发。他说，“那个功能(答案汇总)是对所有用户开放的，每个人都可以像维基一样编辑。后来发现这个东西太难了。回答次数过多后，成本很高，效果也不好。现在我可以通过技术手段帮助人们完成这样的事情。”

如果用大语言模型直接创作，在知乎上答题，结果几乎肯定是灾难性的。相信很多朋友在使用ChatGPT、文新伊彦、新必应的时候会发现，生成式人工智能有一个非常突出的问题，就是严重的扯淡。但用户之所以知道ChatGPT在胡说八道，是因为你在提问之前对答案有了一个大概的了解，你有能力判断他给出的结果是否正确。但是如果用户不知道问题的答案呢？

智海图AI在热榜汇总上尽力了，可以说是知乎因地制宜实现的，因为这个功能是针对内容消费者的，而不是生产者的。通过类似于“长话短说”的热榜汇总功能，用户可以在不仔细浏览具体答案的情况下，大致了解人们围绕热榜话题发表了哪些评论。对于以实时新闻为主的知乎中的热榜来说，最大的好处就是把信息浓缩起来，帮助用户提高效率。

在这个碎片化的内容消费时代，短视频的出现证明了用户对仔细“咀嚼”内容提取信息越来越不耐烦。虽然优质内容是知乎的根本，但随着邀请制的取消，降低门槛后的大众化策略在带来大量用户的同时，也让知乎的环境变得泥泞，越来越难发现有价值的内容。有了热榜汇总，用AI帮助用户发掘优质内容，自然会盘活资源。

但是，对于创作者来说，热榜的总结未必是福音。热门榜单问题的答案整理出来，整理在用户面前。虽然满足了用户无障碍获取信息的痛点，但代价是用户既然看了本质，是否还会继续查看具体答案。所以结果会是，做了高质量回答的回答者可能不会被用户发现和关注，这意味着属于高质量回答者的流量无形中变少了。

沿着这个思路发散，我们会发现，既然用户找答案的工作被AI取代，就意味着热榜汇总有减少用户使用时间的风险。当其他app都在努力让用户留下来的时候，知乎无疑反其道而行之。而对于一个依靠广告和商业内容解决方案的平台来说，用户停留时间短几乎等于流量差，所以这似乎不是一个好的结果。

本文内容及图片均整理自互联网，不代表本站立场，版权归原作者所有，如有侵权请联系admin#jikehao.com删除。