星空体育app官方网站

星空app下载 大家华文大模子战力榜发布:前三被外洋包揽 国产有惊喜
发布日期:2026-02-06 00:55    点击次数:101

星空app下载 大家华文大模子战力榜发布:前三被外洋包揽 国产有惊喜

快科技 2 月 4 日讯息,今天,SuperCLUE 发布 2025 年年度华文大模子基准测评阐明。

23 个国表里模子参与角逐,诡秘数学推理、科学推理、代码生成等六大中枢维度。

从恶果来看,外洋闭源模子依旧占据头部位置,Anthropic 旗下的 Claude-Opus-4.5-Reasoning 以 68.25 分位居榜首。

谷歌的 Gemini-3-Pro-Preview 和 OpenAI 的 GPT-5.2 ( high ) 诀别以 65.59 分、64.32 分紧随自后,包揽前三名。

不外,国产大模子正加快从跟跑向并跑迈进。国内开源最好模子 Kimi-K2.5-Thinking 和闭源最好模子 Qwen3-Max-Thinking,星空app下载诀别以 61.50 分、60.61 分位列大家第四和第六。

在部分细分界限,国产模子进展亮眼,比如 Kimi-K2.5-Thinking 在代码生成任务中以 53.33 分夺冠,Qwen3-Max-Thinking 在数学推理任务中与 Gemini-3-Pro-Preview 同获 80.87 分,并排大家第一。

{jz:field.toptypename/}{jz:field.toptypename/}

从整形体局看,海表里开闭源模子相反显赫。闭源阵营呈现外洋逾越、国产追逐态势,开源阵营则是国产主导、外洋式微,国内开源模子 Top5 均大幅逾越外洋开源模子。



友情链接:

Copyright © 1998-2026 星空体育app官方网站™版权所有

mrmbc.com 备案号 备案号: 

技术支持:®星空体育  RSS地图 HTML地图