微软推出全新预训练模型phi-1.5 仅13亿参数常识推理碾压Llama2

极客号 • 2023年 9月 18日 12:19 • 业界 • 阅读 53

ChatGPT 国内免翻版！免费 AI写作! 史上最全 AI模型！ ECS服务器5折起！虚位以待

极客号（Daydx.com）9月18日消息:微软研究人员最近在一篇论文中提出了一个新的语言模型Phi-1.5，该模型的参数量仅有13亿。研究人员主要关注Phi-1.5在常识推理方面的表现，因为这是对语言模型能力的重要考验。

论文地址:https://arxiv.org/abs/2309.05463

项目地址:https://huggingface.co/microsoft/phi-1_5

结果表明，Phi-1.5在多个常识推理基准测试数据集上都取得了与参数量是其10倍以上的模型相当或更好的结果。例如在WinoGrande、ARC-Easy、ARC-Challenge、BoolQ和SIQA等数据集上的表现，都与Llama2-7B、Falcon-7B和Vicuna-13B相当甚至更好。

这说明模型的参数规模不是决定性因素，采用高质量合成数据进行预训练可能更为关键。研究中，Phi-1.5使用了微软之前提出的Phi-1模型的训练数据，以及新增的“教科书级”合成数据进行训练。

结果表明，Phi-1.5不仅展现出许多大模型所具有的语言理解和推理能力，在控制有害内容生成方面也具有一定优势，这对研究大型语言模型的社会影响意义重大。本研究表明，相比单纯追求模型规模，如何获取高质量训练数据可能更为重要，这为未来语言模型研究提供了新的思路。

本文内容及图片均整理自互联网，不代表本站立场，版权归原作者所有，如有侵权请联系admin#jikehao.com删除。

赞 (0)

999元一晚送飞天茅台？飞猪下架“酱香大床房”：茅台回应

上一篇 2023年 9月 18日

首批国行iPhone 15 Pro已“准备发货”：最快本周五拿到

下一篇 2023年 9月 18日

苹果公司印度首批两家零售店将于下周开业
4月12日消息，据国外媒体报道，苹果公司已经宣布，其在印度的首批两家零售店将于下周开业。苹果在线商店于2020年9月在印度推出，但直到现在该公司还没有在印度开设实体零售店。今天，…
极客号
2023年 4月 12日
0
医院招大学生捐粪：一次最高奖300元每周可捐5次
9月19日消息，陕西西安一家医院发起捐粪便志愿者招募活动。不是开玩笑，据说捐献一次最高可以获得300元补贴。据招募人员的介绍，他们会根据捐粪便的时长、粪便的质量，综合来确定每一次…
极客号
2023年 9月 19日
0
商汤发布基于“商汤日日新SenseNova”的AI遥感大模型
4月20日，基于“商汤SenseNova”模型体系，商汤科技发布了AI遥感模型。尚汤艾遥感模型以通用视觉模型为基础，借助通用视觉模型的10亿模型参数，实现了中国不同地貌、不同影像…
极客号
2023年 4月 23日
0
Redmi Note 13系列两款配色曝光素皮曲面屏
Redmi红米手机于9月14日正式宣布，其Note 13系列将于9月21日晚7点发布。然而，由于同一时间华为也宣布了新品发布会，因此许多人可能不知道Note 13系列已经定档。目前…
极客号
2023年 9月 15日
0
「欧洲版 OpenAI」初创公司 Mistral 正在洽谈融资以参与人工智能竞争
据消息人士透露，被视为欧洲版OpenAI的初创公司Mistral正在讨论筹集一轮实质性融资。这家法国初创公司是脸书人工智能部门研究科学家Guillaume Lample和谷歌De…
极客号
2023年 5月 6日
0
腾讯会议限制免费会议数：跨App加入会议改为付费功能
快科技7月6日消息，腾讯会议宣布自2023年7月6日起，部分功能将逐步进行调整，用户需要提前做好规划。从腾讯会议官方的说明可知，调整的功能主要有两个方面：一是企业内可同时召开在线…
极客号
2023年 7月 7日
0
一张图看懂 | 2022年主流科技公司裁员情况
大小豪(Daydx.com)12月13日消息:2022年，裁员成为科技行业的常态。下面这张来自visualcapitalist的图，展示了2022年一些主流科技公司的裁员情况。据…
极客号
2022年 12月 13日
0
8款新品齐发！Redmi Note 13系列发布会价格汇总：49元起
快科技9月21日消息，今晚由阔别已久的王腾召开了一场Redmi发布会，带来了中端市场卷王产品Redmi Note 13系列，同时还带来了平板、耳机、冰箱等多款产品。首先是手机方面…
极客号
2023年 9月 22日
0
全国各地古镇相似度高达99%？游客吐槽：“特色小吃”都一模一样
相信热爱旅游和游玩的朋友们一定都见过各种古镇，那么是不是觉得有点似曾相识呢？其实在社交平台、旅游平台等上。，朋友和网友早就各抒己见了。比如全国各地的古镇相似度高达99%，甚至特色…
极客号
2023年 3月 26日
0
AI人才争夺战：平均年薪40万，互联网大厂成加分项
年薪30万，居然是“白菜价”? 近来，国内外企业高薪寻求技术人员的招聘信息，将人工智能领域的就业热度刷新到了新高度。 9月21日，全球排名第一的求职网站Indeed发布的报告显示，…
极客号
2023年 10月 8日
0

合作联系：1152QQ041010