按照竞技场评分的排名情况,排名第一的是马斯克的Grok-3
排名1:模型名为chocolate (Early Grok-3),由xAI组织开发,竞技场评分为1402分,95%置信区间为+7/-6,获得了7829票。
排名2:有两个模型并列第二,分别是:
Gemini-2.0-Flash-Thinking-Exp-01-21,由Google开发,评分为1385分,95%置信区间为+5/-5,获得了13336票。
Gemini-2.0-Pro-Exp-02-05,同样由Google开发,评分为1379分,95%置信区间为+5/-6,获得了11197票。
排名3:模型名为ChatGPT-4o-latest (2025-01-29),由OpenAI开发,评分为1377分,95%置信区间为+5/-6,获得了10529票。
排名4:模型名为DeepSeek-R1,由DeepSeek开发,评分为1361分,95%置信区间为+8/-7,获得了5079票。
排名5:有两个模型并列第五,分别是:
Gemini-2.0-Flash-001,由Google开发,评分为1356分,95%置信区间为+6/-5,获得了9092票。
o1-2024-12-17,由OpenAI开发,评分为1353分,95%置信区间为+6/-5,获得了15437票。
排名6:模型名为o1-preview,由OpenAI开发,评分为1335分,95%置信区间为+4/-4,获得了33169票。
排名7:模型名为Qwen2.5-Max,由Alibaba开发,评分为1332分,95%置信区间为+7/-7,获得了7370票。
排名8:有两个模型并列第八,分别是:
DeepSeek-V3,由DeepSeek开发,评分为1317分,95%置信区间为+4/-4,获得了17717票。
Qwen-Plus-0125,由Alibaba开发,评分为1313分,95%置信区间为+8/-10,获得了3682票。
从排名中可以看出,xAl的chocolate (Early Grok-3)模型在竞技场评分中表现最佳,其次是Google和OpenAI开发的模型。DeepSeek和Alibaba也有多个模型进入前十名,显示出较强的竞争力。
本页面所涉私募基金内容仅对合格投资者展示!因擅自转载、引用等行为导致非合格投资者获取本文信息的,由转载方自行承担法律责任和可能产生的一切风险。
本页内容不构成任何投资建议,相关数据及信息来自基金管理人、托管估值机构、外部数据库,并可能援引内外部榜单、其他专业人士/或机构撰写制作的相关研究成果或观点,我司对所载资料的真实性、准确性、时效性及完整性不作任何实质性判断,对所涉产品/机构/人员不作任何明示或暗示的预测、保证,亦不承担任何形式的责任。
版权声明:未经许可,任何个人或机构不得进行任何形式的修改或将其用于商业用途。转载、引用、翻译、二次创作(包括但不限于以影音等其他形式展现作品内容)或以任何商业目的进行使用的,必须取得作者许可并注明作品来源为私募排排网,同时载明内容域名出处