AI初创公司 Arthur 发布开源 AI 模型评估工具 Bench

极客号 • 2023年 8月 18日 12:15 • 业界 • 阅读 55

ChatGPT 国内免翻版！免费 AI写作! 史上最全 AI模型！ ECS服务器5折起！虚位以待

极客号（Daydx.com）8月18日消息:纽约人工智能创业公司 Arthur 发布了开源工具 Arthur Bench，用于评估和比较大型语言模型（LLM）的性能。

据了解，Arthur Bench 可以帮助企业在特定用例上测试不同语言模型的性能，并提供准确性、可读性、避险等指标进行比较。Arthur 首席执行官兼联合创始人 Adam Wenchel 在一份新闻声明中表示:“通过 Bench，我们创建了一个开源工具，帮助团队深入了解 LLM 提供商之间的差异、不同的激励和增强策略以及定制培训制度。”

Arthur 包含了许多用于比较 LLM 绩效的入门标准，但由于该工具是开源的，因此使用它的企业可以添加自己的标准来满足自己的需求。该工具加速了评估过程，并将学术指标转化为实际业务影响。

目前，已经有金融服务公司已经开始使用 Arthur Bench 来快速生成投资论点和分析报告。车辆制造商利用该工具创建了能够从设备手册中快速准确提取信息并回答客户问题的语言模型。

媒体平台 Axios HQ 在产品开发方面也开始使用 Arthur Bench。Arthur 开源了 Bench，任何人都可以免费使用和贡献，他们相信开源的方式可以带来最好的产品，并通过团队仪表盘来实现商业化。

Arthur 还与亚马逊网络服务（AWS）和 Cohere 合作举办黑客马拉松，鼓励开发人员为 Arthur Bench 构建新的指标。

本文内容及图片均整理自互联网，不代表本站立场，版权归原作者所有，如有侵权请联系admin#jikehao.com删除。

赞 (0)

2023年爆火的热门短剧开源版SAAS系统它来了！

上一篇 2023年 8月 18日

库克良心了！iPhone 15充电速度终于达到了安卓的1/7

下一篇 2023年 8月 18日

公测至今不到一年！腾讯开放世界手游《玄中记》宣告停服
2022年2月18日，由凯赢网络旗下嘉兴盛游开发，腾讯游戏代理发行的开放世界手游《玄中记》正式内测。由于玄中姬的渲染风格接近原神，且在宣传期间被指出宣传图模仿了原神，这部作品一度…
极客号
2022年 12月 13日
0
日本2040年单身比例将达47% 男性单身比例更高
根据日本国家社会保障和人口研究所的预测，到2040年，53%的日本成年人将结婚，而47%的人将单身，这意味着两者的比例几乎相等。相比之下，已婚人口自2000年达到顶峰以来逐年下降，…
极客号
2023年 4月 21日
0
文波进行曲是什么歌
最近网上关于文波进行曲的歌曲也是超级火的，有不少小伙伴在看过相关视频之后对这里的背景音乐感兴趣。文波进行曲是什么歌？这首歌曲叫什么名字呢？这类的问题近期在网上也有不少人咨询，下面来…
极客号
2023年 8月 24日
0
开源版GPT-4代码解释器Open Interpreter 让语言模型在本地运行代码
极客号（Daydx.com）9月6日消息:Open Interpreter是一个开源的项目，可以让语言模型在本地环境中运行代码。它提供了一个类似ChatGPT的自然语言界面，用户…
极客号
2023年 9月 6日
0
攒够200万提前退休 24岁女孩：毕业一年多就存了40万买黄金赚翻倍
近日，长沙一位24岁的姑娘因为发布了一份4500天退休倒计时日历而火了，详细分享了自己的提前退休计划和平时的理财技巧，希望攒够200万的目标金额，以后过上到处过日子的生活。前不久…
极客号
2023年 3月 30日
0
李诞交到新朋友，脱口秀演员直播间再就业
“虾米系”男友李生日开始在淘宝直播工作室笑。 12月10日，是李在厦门过生日的第一个晚上。当晚与交友王牌主播王拓合作，直播6小时，上架292款产品，吸引超1100万人观看。淘宝数据…
极客号
2022年 12月 13日
0
百度文心一言软件著作权获批
极客号（Daydx.com）9月18日消息:中国版权保护中心显示，9月13日，北京百度网讯科技有限公司“文心一言软件” 著作权获登记批准，当前版本号为V1.0.0。 8月31日，…
极客号
2023年 9月 18日
0
OpenAI CEO 创立的核裂变初创公司 Oklo 宣布将与 AltC 合并上市
Oklo 公司是一家先进的裂变技术和核燃料回收公司，AltC 是一家特殊目的收购公司，今天宣布它们已签署了一份最终的业务合并协议。交易完成后，合并后的公司将以 Oklo 的名义运营…
极客号
2023年 7月 12日
0
新的全国铁路列车运行图实行：石家庄至北京将实现一小时通达
据河北省发改委消息，根据中国国家铁路集团有限公司统一安排部署，自12月26日起实施新的全国铁路列车运行图。届时，省会石家庄1小时到达首都北京，到承德的运行时间将进一步优化压缩，开…
极客号
2022年 12月 25日
0
国屏之光！京东方首发三百色域切换显示技术
快科技5月1日报道，由BOE首创的300色域切换显示技术亮相第六届数字中国建设峰会成果展。据悉，所谓三百色域切换显示技术，是指100% DCI-P3、100% Adobe RGB…
极客号
2023年 5月 1日
0

合作联系：1152QQ041010