腾讯混元升级模型矩阵

时间:2024-05-20 10:37:46 推荐 517

5月17日,腾讯云生成式AI产业应用峰会在北京召开,公布大模型研发、应用产品的系列进展。

腾讯混元大模型能力持续升级,多个版本模型通过腾讯云对外开放,满足企业客户、开发者在不同场景下的模型需求,落地最优性价比模型方案。腾讯云大模型知识引擎、图像创作引擎、视频创作引擎三大工具发布,打造大模型时代原生工具链,通过PaaS(平台即服务)服务简化数据接入、模型精调、应用开发流程,助力企业更高效、简单地用大模型开发AI原生应用,快速接入生产场景。

以“产业实用”作为发展大模型的核心战略,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示,通过打造高性能的模型、高效率的工具平台、高敏捷的场景应用、高可用的算力基础设施,以及强安全的模型环境,构建离产业最近的AI。

在此次产业峰会上,腾讯混元介绍了其多尺寸的LLM模型矩阵,其中,最大模型已拓展至万亿级参数规模,并在1B、3B、7B、13B等不同参数量下,均有布局。

升级后的腾讯混元,在国内率先采用混合专家模型(MoE)结构,模型总体性能相比上一代提升了50%,部分中文能力已追平GPT-4,在“时新”问题的回答表现上,数学、推理等能力上均有较大提升。

在腾讯云上,混元大模型也提供了万亿参数hunyuan-pro、千亿参数hunyuan-standard、百亿参数hunyuan-lite等多种尺寸的模型服务,目前已面向企业及个人开发者全量开放。

其中,hunyuan-standard最新上线了支持256k超长上下文窗口的长文模型,具备单次处理超过38万字符的超长文本能力,在长文档的阅读理解和大规模数据分析方面展现出强大性能,能够为金融、医疗、教育、出行等行业的专业人士提供强有力的工作支持,显著提高工作效率。

在多模态能力方面,混元大模型也持续迭代升级。在生图领域,腾讯混元文生图基础架构已全面升级至Sora同款的DiT架构,支持中英文双语输入及理解,具备多轮绘图能力,测评结果国内领先;在生视频领域,腾讯混元支持文生视频、图生视频、图文生视频、视频生视频等多种视频生成能力,已经支持16s视频生成;在生3D层面,腾讯混元已布局文/图生3D,单图仅需30秒即可生成3D模型。

根据沙利文评测结果,腾讯混元的通用基础能力和专业应用能力,都处于国内大模型领跑梯队,高于国际大模型均线。权威评测机构SuperCLUE的报告也显示,腾讯混元大模型位列国内大模型第一梯队,在基础和场景应用上均处于领先位置,位于卓越领导者象限。

会上,腾讯集团副总裁蒋杰宣布,腾讯混元大模型将拥抱开源。此前,混元文生图大模型已全面开源,仅3天时间就在Github上获得超千位开发者关注。多种尺寸的腾讯混元MoE模型也即将对外开源,可分别支持手机端、PC端、云/数据中心等多样化的部署场景。

作为实用级的大模型,目前混元大模型已经在600多个腾讯内部业务和场景中落地测试,并在腾讯丰富的生态中持续迭代能力。蒋杰表示,对外,腾讯混元也将开启智能体生态,上线一站式AI智能体创作与分发平台“腾讯元器”。未来,用户不仅可以在平台上创建专属AI智能体,使用腾讯官方的插件和知识库,还能将这些智能体一键分发到QQ、微信客服、腾讯云等渠道上。

调研显示,超过60%的中国企业计划在未来12至24个月内部署生成式AI。但如何找准场景,快速部署,缩短从基础模型到产业应用的距离?为此,腾讯云全新推出大模型原生工具链,以三款PaaS产品——“大模型知识引擎”、“大模型图像创作引擎”和“大模型视频创作引擎”,助力企业在知识服务、图像和视频创作上提质提效。

腾讯云副总裁、腾讯云智能负责人吴运声表示,腾讯云从产业的实际需求出发,打造出大模型时代的原生工具链,依托三大AI大模型引擎工具,实现数据工程、模型精调、应用开发的流程简化,助力企业更高效、方便地用上大模型。

2023年以来,腾讯云与1500家合作伙伴紧密协同,依托领先和丰富的生成式AI产品,累计服务超过2万家企业客户,初步构建起围绕生成式AI产品的生态体系。

在此次峰会上,腾讯云正式推出生成式AI生态计划。腾讯云副总裁、产业生态合作负责人杨晨表示,腾讯云聚焦做强生成式AI技术和平台底座,通过开放平台能力与服务、提供技术与市场支持的方式,在未来联合千家解决方案提供商,培育千家服务商和万家代理商,共同推动生成式AI技术深入产业全链条,加速产业智能化升级。