
快科技 2 月 4 日讯息,今天,SuperCLUE 发布 2025 年年度华文大模子基准测评阐明。
23 个国表里模子参与角逐,诡秘数学推理、科学推理、代码生成等六大中枢维度。
从恶果来看,外洋闭源模子依旧占据头部位置,Anthropic 旗下的 Claude-Opus-4.5-Reasoning 以 68.25 分位居榜首。
谷歌的 Gemini-3-Pro-Preview 和 OpenAI 的 GPT-5.2 ( high ) 诀别以 65.59 分、64.32 分紧随自后,包揽前三名。
不外,国产大模子正加快从跟跑向并跑迈进。国内开源最好模子 Kimi-K2.5-Thinking 和闭源最好模子 Qwen3-Max-Thinking,星空app下载诀别以 61.50 分、60.61 分位列大家第四和第六。
在部分细分界限,国产模子进展亮眼,比如 Kimi-K2.5-Thinking 在代码生成任务中以 53.33 分夺冠,Qwen3-Max-Thinking 在数学推理任务中与 Gemini-3-Pro-Preview 同获 80.87 分,并排大家第一。
{jz:field.toptypename/}从整形体局看,海表里开闭源模子相反显赫。闭源阵营呈现外洋逾越、国产追逐态势,开源阵营则是国产主导、外洋式微,国内开源模子 Top5 均大幅逾越外洋开源模子。

备案号: