星空app下载大家华文大模子战力榜发布：前三被外洋包揽国产有惊喜

星空体育app官方网站

热点资讯

星空app注册国度统计局：一季度金融业产值同比增长6.5%

星空守住钱袋子吉祥好过年—贵州银行天柱支行开展“今冬明春

星空app注册登录难忘的提督街上的阿谁老文化宫

星空app下载超等三叉戟！“凯奥迪”一东说念主一球助拜仁晋

星空app注册为什么女东说念主都想嫁给唐僧？

星空app下载《Overwatch season 2》更新

星空app注册以色列撑捏，英国、土耳其、西班牙王人声反对！

星空app注册姆巴佩被肘出血未获点！贝林赛后找到裁判抗议：

星空app下载无后弯，不瑜伽！这两个后弯局面时时练，东说念

星空app登录晴朗寄哀想英魂耀征途好汉精神生生络续

星空app下载大家华文大模子战力榜发布：前三被外洋包揽国产有惊喜

发布日期：2026-02-06 00:55 点击次数：106

星空app下载大家华文大模子战力榜发布：前三被外洋包揽国产有惊喜

快科技 2 月 4 日讯息，今天，SuperCLUE 发布 2025 年年度华文大模子基准测评阐明。

23 个国表里模子参与角逐，诡秘数学推理、科学推理、代码生成等六大中枢维度。

从恶果来看，外洋闭源模子依旧占据头部位置，Anthropic 旗下的 Claude-Opus-4.5-Reasoning 以 68.25 分位居榜首。

谷歌的 Gemini-3-Pro-Preview 和 OpenAI 的 GPT-5.2 ( high ) 诀别以 65.59 分、64.32 分紧随自后，包揽前三名。

不外，国产大模子正加快从跟跑向并跑迈进。国内开源最好模子 Kimi-K2.5-Thinking 和闭源最好模子 Qwen3-Max-Thinking，星空app下载诀别以 61.50 分、60.61 分位列大家第四和第六。

在部分细分界限，国产模子进展亮眼，比如 Kimi-K2.5-Thinking 在代码生成任务中以 53.33 分夺冠，Qwen3-Max-Thinking 在数学推理任务中与 Gemini-3-Pro-Preview 同获 80.87 分，并排大家第一。

从整形体局看，海表里开闭源模子相反显赫。闭源阵营呈现外洋逾越、国产追逐态势，开源阵营则是国产主导、外洋式微，国内开源模子 Top5 均大幅逾越外洋开源模子。