阿里云通义千问720亿参数模型Qwen-72B开源 能更好地被下游应用集成
发布时间:2023-12-02 14:03:44|来源:搜狐新闻|作者:

  2023年三季度,阿里云营收276.48亿元,同比增长2%,经调整EBITA利润14.09亿元。对于这份业绩,阿里云的评价是:“我们通过减少利润率较低的项目制合约类收入,以持续提升收入质量。与此同时,本季度公共云产品及服务收入增长,带动盈利能力的优化。”

  不久前,IDEA研究院创院理事长沈向洋提出,第一名毫无疑问会闭源、第二名会纠结开源还是闭源,第三名一定会开源。

  12月1日,阿里云CTO周靖人听到这个观点时微笑着回应:“Harry(沈向洋)是有点玩笑话,过去十年以来,整个开源社区已经蓬勃发展起来。”

  当天,通义千问开源了多个大模型,实现全尺寸开源,这一场景就发生在通义千问发布会后。4月,通义千问启动邀测,8月以来开源了Qwen-14B和视觉理解模型Qwen-V,10月底发布通义千问2.0版闭源模型。大模型竞赛大半年,开源闭源之争常谈常新,不时还会以Android和iOS系统类比。现实是,百度的文心大模型目前尚未开源,OpenAI在开源闭源之间横跳。差异化的路线反映了企业的不同策略,对阿里云而言,开源大模型不光牵扯到社区、生态,或许还关系到放缓的营收和整个阿里系的未来。

从1.8B到72B

  12月1日,阿里云通义千问720亿参数模型Qwen-72B开源。该模型可以处理最多32k的长文本输入,在长文本理解测试集LEval上取得了超越ChatGPT-3.5-16k的效果。研发团队优化了Qwen-72B的指令遵循、工具使用等技能,能更好地被下游应用集成。比如,Qwen-72B搭载了强大的系统指令能力,用户只用一句提示词就可定制AI助手,要求大模型扮演某个角色或者执行特定的回复任务。

  通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。截至目前,通义千问共开源18亿、70亿、140亿、720亿参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。

  “我们希望把各种模型的参数、所消耗的资源、拥有的能力等清晰地展示给开发者、企业,让它们根据自己的场景做更好的选择”,谈到为何推出720亿参数大模型时,周婧人说。

  据不完全统计,目前国内市场已发布约200多个大模型。易观分析高级分析师陈晨告诉北京商报记者,“国内主流大模型的竞争领域主要集中在百亿级别以上参数档,几家头部厂商的大模型参数量达到千亿级以上,在工业制造、医疗、金融、智慧城市领域,需要借助AI进行大量的识别分析、计算和推理任务,能充分发挥超大规模模型的性能。目前百亿级别以下的模型相对较少,这类模型在计算资源有限的情况下,比如在移动端、边缘设备的应用场景下有很好的表现”。

不光为生态

  “这段时间,已经有不少硬件厂商在跟我们洽淡,我们的心态是非常开放的”,周靖人透露。他还多次表示,开源生态对促进中国大模型的技术进步与应用落地至关重要,通义千问将持续投入开源,希望成为“AI时代最开放的大模型”。

  大模型开源社区创新平台魔搭是阿里云频繁提及的另一个词。根据阿里集团创始人、董事长蔡崇信一个月前披露的数据,魔搭汇聚了280万开发者、2300多个优质模型,模型下载量超过1亿。

  在陈晨看来,开源有利于大模型厂商形成更开放的生态,吸引更多研究者或开发者来丰富基于这些模型的应用和服务,也能推动模型持续地优化迭代,“尽管大模型本身是开源的,但仍然可以在这个基础上提供多种形式的服务,包括定制开发、技术支持、培训等。大模型的原始开发者在模型理解、技术细节、创新能力、可持续性上都更具优势,能够更有效提供定制化解决方案,这也就为开源大模型厂商带来了更多的商业化机会”。

  2023年三季度,阿里云营收276.48亿元,同比增长2%,经调整EBITA利润14.09亿元。对于这份业绩,阿里云的评价是:“我们通过减少利润率较低的项目制合约类收入,以持续提升收入质量。与此同时,本季度公共云产品及服务收入增长,带动盈利能力的优化。”

第一名不开源?

编辑:菲菲
免责声明:文章转载自网络。文章内容不代表本站观点,本站不对其内容的真实性、完整性、准确性给予任何担保、暗示和承诺,仅供读者参考,风险自己甄别并承担后果;如有侵权请及时联系本站,我们会及时删除处理!

图文推荐

相关阅读

资讯

产业

新闻排行