您现在的位置是:商讯1 >>正文
最新一期权威大模型榜单:豆包1.5、商汤日日新V6并列国内第一
商讯133人已围观
简介5月28日,权威大模型测评机构SuperCLUE《中文大模型基准测评2025年5月汇报》全新出炉!豆包1.5·深度思索模型(Doubao-1.5-thinking-pro)和商汤日日新 ...
5月28日,权威大模型测评机构SuperCLUE《中文大模型基准测评2025年5月汇报》全新出炉!
豆包1.5·深度思索模型(Doubao-1.5-thinking-pro)和商汤日日新 V6多模态模型(SenseNova-V6 Reasoner)一同摘得金牌,超越Gemini 2.5 Flash Preview,在国内大模型第一梯队领跑。
位居第二梯队的大模型包含DeepSeek-R1、NebulaCoder-V6、Hunyuan-T1另有DeepSeek-V3。
来自SuperCLUE
汇报指出,国内外第一梯队大模型在中文领域的通用实力差距正在缩小。在国产大模型中,Doubao-1.5-thinking-pro-250415、SenseNova V6 Reasoner体现最为亮眼。国内推理模型角逐格局初露端倪。
SuperCLUE是产业权威的通用大模型的综合性测评基准。本次2025年5月汇报聚焦通用实力测评,涵盖数学推理、科学推理、代码生成、智能体Agent、精确指令遵循、文本领会与创作六大任务,总量为1579道多轮简答题。
Tags:
相关文章
人保寿险常州中心支公司开展金融教育宣传周行动
商讯1为提升花费者金融素养,增强金融危机防范实力,增强花费者权益维护工作,人保寿险常州中心支公司围绕“保证金融权益 助力美好生存”主题开展宣传行动。9月13日,人保寿险常州中支党委委 ...
【商讯1】
阅读更多教育部艺术策划类专门教学指导委员会 2025年职教周行动圆满收官
商讯12025年5月28日至6月3日,由教育部职业院校艺术策划类专门教学指导委员会以下简称“艺指委”)主办,浙江中南卡通股份有限公司联合承办,以“新动漫·随 ...
【商讯1】
阅读更多豪门盛宴!2025世俱杯要来了,你家电视还顶得住吗?
商讯12025年注定有一个难忘的夏天,球迷心心念的“超级世俱杯”来了!32支球队,个个都是狠角色,皇马、曼城、拜仁……足球界豪门整体集结完毕。不过,先别急 ...
【商讯1】
阅读更多