首个基于全国产化算力平台“飞星一号”的开源大模型正式发布!
发布时间:2024-01-30 23:13:52|来源:搜狐新闻|作者:

  首个基于全国产算力训练的全民开放大模型讯飞星火V3.5在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能力七个方面进行了全面升级。其中语言理解、数学能力超过GPT-4 Turbo,代码达到GPT-4 Turbo 96%,多模态理解达到GPT-4V 91%。大模型全新赋能万物互联时代人机交互体验,超拟人合成效果惊艳。讯飞星火V3.5不仅在语义理解、指令跟随和多轮对话的演示中,展现出优异的能力,更是在情绪感知和拟人合成方面表现出色。

  1月30日,科大讯飞发布会上,科大讯飞董事长刘庆峰、研究院院长刘聪正式发布讯飞星火认知大模型V3.5,在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能力七个方面实现升级。会上,首个基于全国产化算力平台“飞星一号”的开源大模型——星火开源-13B正式发布,在处理复杂的自然语言任务时更加得心应手,展示了国产算力的能力。

  发布演示现场。科大讯飞供图

  讯飞星火自去年5月诞生以来,不断迭代升级大模型能力,深耕教育、工业、汽车、保险、科研等行业应用刚需。去年10月24日,科大讯飞携手华为启用首个支撑万亿参数大模型训练的国产算力平台“飞星一号”。启用后的90多天里,“飞星一号”开始了对标GPT-4的更大参数规模的大模型训练,最终实现星火V3.5的语言理解和数学能力超过GPT-4 Turbo模型。

  “在更好的数据、更强的人机协同训练中,我们不能只看单个的‘原子’能力,而是要以技术进步来解决真实世界的刚需。”刘庆峰说,让机器具备学习、推理和决策的能力,就是认知大模型的主要工作。而大模型发展,应用才是硬道理,企业要将大模型技术的创造力转化为促进产业高质量发展的新质生产力。

  展望2024年,刘庆峰指出三点:“第一,要清醒理智看到差距,在通用大模型的底层能力上持续对标国际最先进水平,在算法研究上做出相对更优效果;真正让大模型量质齐飞,不仅是行业应用,还要在很多关键技术创新上联动大模型;高楼大厦要建立在安全可控的平台之上,要实现自主可控平台上的生态繁荣。”

编辑:菲菲
免责声明:文章转载自网络。文章内容不代表本站观点,本站不对其内容的真实性、完整性、准确性给予任何担保、暗示和承诺,仅供读者参考,风险自己甄别并承担后果;如有侵权请及时联系本站,我们会及时删除处理!

图文推荐

相关阅读

资讯

产业

新闻排行