商汤国产中文大模型全面领先ChatGPT 部分接近GPT-4_焦点关注
快科技 2023-06-21 22:00:07

快科技6月21日消息,在AI大模型领域,OpenAI的ChatGPT成为当前最火的大模型,也是标杆性的,多个国产大模型都要对标它,今天商汤科技公布了自己的大模型测试结果,三个测试项目中都超越了ChatGPT。

商汤科技自研中文语言大模型名为“商量SenseChat 2.0”,日前公布的测试显示,MMLU、AGIEval、C-Eval三个权威大语言模型评测基准的成绩。

根据评测结果,“商量SenseChat 2.0”在三个测试集中表现均领先ChatGPT,部分已十分接近GPT4的水平,实现了我国语言大模型研究的重要突破。


(资料图片仅供参考)

这三个测试分别如下:

由美国加州大学伯克利分校等高校构建的多任务考试评测集MMLU;

微软研究院推出的学科考试评测集AGIEval(含中国高考、司法考试及美国SAT、LSAT、GRE和GMAT等);

由上海交通大学、清华大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集C-Eval;

在MMLU测试中,“商量SenseChat 2.0”综合得分为68.6,远超GLM-130B(45.7分)的得分,同时还超过了ChatGPT(67.3分)、LLaMA-65B(63.5分)仅落后GPT-4(86.4分),位居第二。

在AGIEval测试中,“商量SenseChat 2.0”测出49.91的分数,遥遥领先GLM-130B(34.2分)、LLaMMA-65B(34.0分),并再次超越ChatGPT(42.9分),仅次于GPT-4的56.4分。

在其中的AGIEval(GK)评测子集中,“商量SenseChat 2.0”以58.5分全面领先,仅微弱差距落后GPT-4(58.8分)。

在C-Eval测试中,“商量SenseChat 2.0”拿到了66.1的分数,在参评的18个大模型中,仅次于GPT-4(68.7分),全面领先ChatGPT、Claude、Bloom、GLM-130B、LLaMA-65B等一众海内外大模型。

截至目前,已有近千家企业客户通过申请,应用和体验“商量SenseChat 2.0”超强的长文本理解、逻辑推理、多轮对话、情感分析、内容创作、代码生成等综合能力,并且“商量SenseChat 2.0”还在服务客户过程中,持续实现着快速迭代和提升,以及知识的实时更新。

商汤国产中文大模型全面领先ChatGPT 部分接近GPT-4_焦点关注

2023-06-21

英科医疗: 关于2020年限制性股票激励计划第三个解除限售期公司层面业绩未达标暨回购注销部分限制性股票的公告 天天动态

2023-06-21

国泰君安子公司国泰君安创投拟出资不超12亿元参与设立浦东引领区科创一号基金_微速讯

2023-06-21

美国南部遭热浪侵袭:部分地区断电近100小时 居民被要求自愿减少用电|环球热议

2023-06-21

浪潮信息预警业绩风险,AI概念龙头股涨不动了?_热点评

2023-06-21

【天天新视野】群智咨询:“6·18”期间中国独立显示器线上销售同比增约1.4%

2023-06-21

6月21日下午,又有5名贪官陆续落网,反腐斗争形势一片大好

2023-06-21

6月21日山东地区顺酐市场行情整理

2023-06-21

世界报道:端午将至,艾草、菖蒲需求旺

2023-06-21

当前热点-2023年6月21日广东省柠檬酸价格最新行情预测

2023-06-21

火眼金睛识诈骗 见义智为挽损失——建行南京福建路支行柜员荣获南京市见义勇为专项奖励 观察

2023-06-21

快报:吕莘一匹出色的马_吕莘

2023-06-21

最初的梦想歌词完整版歌谱_最初的梦想歌词

2023-06-21

邵阳县政务服务中心:服务暖心,粽香聚情-今日聚焦

2023-06-21

世界今热点:九个月宝宝牛肉搭配什么菜吃?

2023-06-21

张恒远葬礼结束:遗体不火化直接土葬,家人悲痛欲绝跪地大哭_环球时讯

2023-06-21

美味佳肴致敬荣休 薪火相传激发健康力量_报道

2023-06-21

word打不开怎么恢复_word打不开怎么办 今日最新

2023-06-21

今日聚焦!永安林业股东减持股份达到1% 2023一季度净利润同比增长382.08%,利好索赔

2023-06-21

小学生防溺水图片大全(小学生防溺水安全教育图片大全)-今亮点

2023-06-21