金牌! 商汤 日日新 权威中文大模型10月榜单出炉 (商汤比赛)
模型表现好,金牌少不了。
刚刚,中文大模型测评基准SuperCLUE发布《中文大模型基准测评2024年10月报告》:
商汤日日新·商量大模型(SenseChat5.5)凭借出色的能力表现,总得分位列国内大模型第一梯队,获得金牌。
本次SuperCLUE10月报告覆盖23个国内模型,聚焦语言大模型的通用能力评估,分为三大维度:除了考察“文科”、“理科”基础能力外,还有考察模型更高阶能力的“Hard”附加任务,总共2900+道题:
【理科任务】分为计算、逻辑推理、代码、工具使用测评集;
【文科任务】分为知识百科、语言理解、长文本、角色扮演、生成与创作、安全六大测评集;
【Hard任务】分为精确指令遵循测评集,复杂任务高阶推理测评集。
商汤SenseChat5.5在多项评测任务中均位列第一梯队,文科中语言理解、安全等维度表现突出,也是理科中逻辑推理、代码学科的“尖子生”。
值得注意的是,在【Hard】的两项任务——精准指令遵循和高阶推理中,商汤SenseChat5.5是唯一两项任务均位于国内第一梯队的大模型,体现了模型优秀的复杂推理智能。
SuperCLUE本次报告显示,国内大模型的能力与chatgpt-4o-latest表现接近,o1-preview则在复杂任务中更为突出。未来,商汤将继续坚持基础大模型的持续研发与投入,不断提升真正高阶推理及“慢思考”能力。
版权文章,未经授权禁止转载。详情见 转载须知 。
本文地址: https://www.gpxz.com/article/50b7c4dcc8ce3cf7c121.html
临海市金宇油压器材厂创建于二OO一年,位于江南历史文化名城临海。主要生产液压软管总成、液压钢管总成、特氟龙软管总成、树酯管总成、过渡接头及其他非标定制流体连接件,企业建筑面积3000平方米,5条现代化生产线,年产液压油管总成可达100万套。产品广泛应用于工程机械、农业机械、注塑机械、车辆、起重机械等工业自动化液压系统。目前拥有德国UNIFLEX(优力福莱克斯)、芬兰FINNPOWER(芬宝)世界一流软管总成生产线,德国MAXIMATOR(麦格斯维特)测试台等齐全的检测和试验设备,先进的设备和技术及严格的生产过程控制管理,在吸取国内外先进技术、工艺的基础上,集多年来在液压行业的丰富经验与日趋完善的产品种类,以确保产品质量的标准及可靠性达到一流水准。目前已与多家知名主机厂配套合作。我们将以优质的产品和专业的全面服务来真诚的与各界朋友展开广泛的合作,一如既往秉承质量第一、客户至上、严谨认真的工作态度,致力于每一位客户得到价值和满意。





























