马斯克将起诉微软，称其使用 Twitter 数据“非法”训练GPT，吃瓜网友：事情变得更有趣了！

北京时间4月20日上午，埃隆·马斯克(elon musk)表示，他将对微软提起诉讼，理由是微软利用Twitter数据“非法”训练其产品。

今天早些时候，微软宣布停止在其智能广告平台上支持Twitter。马斯克此举显然是对微软的报复。微软和马斯克是目前平台上的“顶流”，他们之间还是有一些竞争关系的。所以马斯克的言论引起了一大批吃瓜群众的关注。

1个事件通过

今年2月，Twitter宣布不再支持免费的API访问，取而代之的是收费使用。其套餐价格从每月4.2万美元到21万美元不等(约合人民币28.9万元到144.5万元)。

据外媒WIRED报道，Twitter在其开发者平台上提供了三个级别的企业软件包，其中最便宜的是一个小软件包，每月支付4.2万美元就可以访问5000万条推文。套餐级别越高，研究人员或企业获得的推文越多:每月支付12.5万美元可以获得1亿条推文，每月支付21万美元可以获得2亿条推文。使用免费API只会访问平台上1%的推文，不足以全面反映平台上的活跃度。这对很多科研人员甚至一些企业来说，都是一个“打击”。

因为马斯克改变了API政策，微软今天声称，面向广告商的社交媒体规划和调度工具不再支持Twitter。微软告诉客户:“从2023年4月25日起，拥有多个平台的智能广告系列将不再支持Twitter，从2023年4月25日起，数字营销中心(DMC)将不再支持Twitter”。这些措施意味着用户将不再能够通过微软的免费社交媒体管理服务访问他们的Twitter账户或创建、安排或管理推文。

凭借其2.15万亿美元的市值和去年底约1000亿美元的现金，微软显然有足够的资金向Twitter支付它想要的东西，所以微软想要表达的不仅仅是声明这么简单。

马斯克终于看到了扭亏为盈的希望，因此对微软的禁令非常不满。他发推文指责微软非法使用Twitter数据进行AI训练，声称要起诉微软。

目前还不清楚马斯克指控微软使用Twitter数据非法训练的是哪些AI产品，但很可能是针对ChatGPT的。根据微软与OpenAI的许可协议，OpenAI用“大量来自互联网的不同文本数据”训练了其强大的AI模型。

马斯克本人对微软感到不满，后者已经成为ChatGPT背后的公司OpenAI的主要合作伙伴。尽管马斯克帮助创建了OpenAI，但他后来批评旧金山实验室是一家“由微软有效控制的闭源、利润最大化的公司”。

不管马斯克会不会真的起诉，反正马斯克推文下的吃瓜群众都开心了:“爆米花好了！”“马斯克做得对，赶紧起诉，别光说不做！”“啊，见证历史，马斯克要把比利-布利的盖茨告上法庭了~”“马斯克和微软在Twitter数据上的争斗，将是一场值得关注的大战。”……

2马斯克与微软竞争OpenAI升级

马斯克起诉微软，有网友表示事情变得有趣了。“马斯克说要起诉微软。虽然我是OpenAI的粉丝…我认为马斯克的诉讼是合理的。1) OpenAI的资金来源是马斯克的钱+口碑。2)他创造了这个名字，得到了早期员工。3)他的名誉被利用了……”

2015年，马斯克参与了OpenAI的创建，并坚持OpenAI技术必须开源。2018年，马斯克从公司董事会辞职。2019年，马斯克宣布与OpenAI彻底分道扬镳，称因与OpenAI在一些发展观点上的分歧而选择退出。不久后，OpenAI宣布接受微软10亿美元注资，摆脱了非营利组织的身份。

马斯克曾明确表示，“我真的做了很多努力来创造OpenAI，以与谷歌竞争，”他说。”然后我转移了注意力。我猜他们现在是闭源了，明显是逐利的。他们与微软密切合作。在这一点上，微软即使不直接控制OpenAI，也很有发言权。”

虽然马斯克也称赞ChatGPT的表现“有点可怕”，但他更担心人工智能带来的安全威胁，认为微软和谷歌在这方面做得不够好:微软支持的OpenAI一直在“训练人工智能撒谎”，而谷歌联合创始人拉里·佩奇(Larry Page)并没有把人工智能安全当回事。

今年2月，马斯克在推特上表示，与ChatGPT相比，“我们需要的是TruthGPT”。至少从那以后，马斯克一直在积极寻找AI领域的人才，希望能与ChatGPT一较高下。他挖来的人才包括伊戈尔·巴布什金、曼努埃尔·克罗斯等。最近他还购买了10000个NVIDIA A 100 GPUs，这是训练大型模型必备的高性能芯片。就在几天前，马斯克在接受采访时宣布，他将推出一个名为“TruthGPT”的AI平台。

马斯克认为TruthGPT是对OpenAI的修正。OpenAI对利润的追求可能会干扰其在AI建模时的道德观念。相应的，“TruthGPT”是一个更透明的选项。TruthGPT团队还在其电报频道上解释说，TruthGPT的任务是“建立马斯克的愿景…..它的发展已经开始，很快它将成为一个诚实和真理的灯塔，全世界都可以看到。”

3反对大模特白嫖

数据是大模型训练中不可或缺的资源。但是最近有很多关于数据使用权的纠纷，认为大型模型侵犯了用户和企业的版权。

当马斯克威胁要起诉微软时，另一个社交媒体平台Reddit宣布计划向使用其API的用户收费，理由是Reddit用户的数据被用于训练人工智能模型。

Reddit是AI聊天机器人的重要数据资源，其API从2008年开始向开发者免费开放。4月18日，Reddit宣布将开始对过度使用其数据API的公司收费。

虽然OpenAI或谷歌等公司没有被直接点名，但Reddit的首席执行官兼联合创始人史蒂夫·霍夫曼(Steve Hoffman)表示，包括Reddit在内的社交媒体资源为训练大型语言模型(LLM)提供了一些资源，这些模型可以对人类的提示做出令人信服的回应。他强调，Reddit的数据语料库非常有价值，“它是一个真正对话的地方”，(人工智能公司)抓取Reddit产生价值，但不要向我们的用户返回任何价值，”霍夫曼认为。“现在是收紧政策的好时机。”

与此同时，generative AI正面临艺术家的集体诉讼，此前旧金山的三名艺术家表示，他们多年的作品风格被AI模仿，并要求绘图公司赔偿。全球画廊巨头Getty Images也对Stability扩散背后的公司Stability AI提起诉讼。Getty Images声称，超过1200万张版权图片被用于训练稳定扩散，并要求稳定AI支付1.8万亿美元的赔偿。

当其他公司开始要求大模特公司为此买单时，马斯克是第一个声称微软使用Twitter数据违法的人。此后，任何公司，只要其数据被微软和谷歌等公司用于构建生成式人工智能产品，就可以使用马斯克的论点。

我不确定Twitter和微软是否真的会在法庭上相遇，但是大模型背后的公司和那些在途中免费提供数据的公司之间的诉讼会越来越多。

参考链接:

https://bgr . com/tech/elon-musk-claims-微软-非法训练-its-ai-using-Twitter-data-threats-诉讼/

https://twitter.com/elonmusk/status/1648784955655192577

https://www . business insider . com/Reddit-to-charge-ai-companies-API-content-use-2023-4

本文内容及图片均整理自互联网，不代表本站立场，版权归原作者所有，如有侵权请联系admin#jikehao.com删除。