测试总成绩全球第二,商汤大模型“商量”向公众开放服务

09-25 手机 投稿:隆静枫
测试总成绩全球第二,商汤大模型“商量”向公众开放服务

时间:2023-09-25 07:28:23 出处:阅读(143)

今天,商量商汤科技研发的测试自然语言大模型“商量SenseChat”向广大用户开放服务。它的总成基模型是商汤联合国内多家科研机构发布的“书生·浦语InternLM-123B”,有1230亿参数,绩全在51个知名评测集共计30万道问题集合上的球第测试总成绩排名全球第二,并且在主要评测中有12项成绩超越了GPT-4,商汤排名第一。大模

“商量SenseChat”今年4月正式推出,公众是开放国内最早发布的千亿参数大语言模型之一,此后不断迭代更新。服务目前,商量它在语言、测试知识、总成理解、绩全推理和学科五大能力上均处于行业领先水平,球第可以处理各类文本和信息,成为随身综合知识库、高效文本编辑器、数理计算器和简单易用的编程助手。

据介绍,“商量”背后依托的是商汤人工智能大装置SenseCore,其上线GPU数量已由今年3月底的27000块提升至30000块左右,算力规模提升了20%,达到6 ExaFLOPS,能有效支持语言大模型的训练、升级迭代和服务。

在训练数据方面,商汤每月可产出约2万亿token的高质量数据,以支持基模型训练。预计今年底,高质量数据储备将突破10万亿token。同时,公司还投入数百台服务器,它们搭载了千卡GPU的计算资源,采用算法结合人工的方法,对原始语料数据进行分门别类的精细化清洗,以确保数据的质量、安全性和价值观都符合要求。

“书生·浦语InternLM-123B”在主要评测集上的表现

截至目前,“商量”在金融、医疗、汽车、地产、能源、传媒、工业制造等众多行业,与超过500家客户建立了合作关系,通过多种灵活的API接口和服务,为客户提供大模型的各项人工智能技术和服务,低门槛、高效率地实现各类生成式AI应用。

据悉,“商量”是商汤“日日新SenseNova”大模型体系和生成式AI产品系列中的一个,其他产品还包括“秒画”“如影”“琼宇”“格物”。它们分别对应自然语言交互、AI文生图、数字人、3D大场景重建、3D小物体生成等5个主流的生成式AI应用。

今后,这家企业将依托强大的基模型,以及在算力、数据、算法基础上的技术积累,持续升级“日日新”大模型体系下的各种生成式AI产品。

公众可访问https://chat.sensetime.com,完成注册即可使用“商量SenseChat”,或通过访问商汤官网,体验与AI大模型“商量”解决问题的效果。

分享到: 温馨提示:以上内容和图片整理于网络,仅供参考,希望对您有帮助!如有侵权行为请联系删除!
声明:生活头条网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系admin@gdcyjd.com