文心大模型5.0发布,百度全模态AI能力全面升级

前沿资讯 1763031391更新

0

导读: 今天,2025百度世界大会在北京国家会议中心举办,百度正式发布了文心大模型5.0,这是一次全模态能力的重大升级。新模型不仅在文本理解和创意写作上表现突出,还支持图像、音频、视频等多模态输入与输出,同时强化了智能体规划和工具应用能力,为企业与个人提供更强大的生产力支持。

文心大模型5.0采用原生全模态统一建模技术,不仅能处理文本,还能理解和生成图像、音频和视频内容,实现多种信息的无缝交互。

百度官方表示,现在,模型在复杂任务中的表现更自然、更高效,更接近人类理解与表达方式。

新模型在多个核心能力上实现突破:

  • 多模态理解:能够同时理解文本、图像和音视频信息,提高信息处理效率;
  • 指令遵循:支持智能助理和任务执行场景,用户可通过自然语言下达复杂指令;
  • 创意写作:在文章生成、营销文案、剧本创作等方面表现突出,ERNIE-5.0-Preview-1022在LMArena全球大模型竞技场文本榜单中创意写作得分位列国内第一;
  • 智能体规划与工具应用:可协助生成PPT、进行数据分析、代码生成,并支持多智能体协作,满足企业办公和研发需求;
  • 理解、逻辑、记忆与说服力:在处理复杂长问题和多层逻辑任务时表现出色,使模型更适合学术问答、报告分析等专业场景。

文心5.0采用超稀疏混合专家架构,参数规模超过2.4万亿。该架构在提升全模态理解能力的同时,实现了计算资源的高效利用,为大规模任务提供强大算力保障。

本次大会发布的其他产品概览:

  1. 实时互动型数字人(慧播星)新一代数字人交互技术,特点是:实时响应、声情并茂、明察善断,互动性增强。可应用于:直播电商、企业展示、互动演示等场景。
  2. 秒哒2.0无代码开发工具:•全栈应用,一键生成:一句话完成开发、调试、部署、上线•一站式开发与分发:可发布到公网或微信小程序
  3. GenFlow 3.0全球最大通用智能体(Agent):•自主调用Office Agent:Excel、Word、PPT复杂操作一键完成•全模态内容生成:跨模态理解、生成与编辑•记忆中心:记录用户历史信息,更精准满足需求
  4. 自我演化智能体——伐谋全球首个可自我演化、寻找“全局最优解”的智能体,特点是:自动建模、迭代优化、动态生成最优方案。
  5. 昆仑芯M系列与天池超节点

    昆仑芯:

    • M100:针对大规模推理,性价比极高,2026年上市
    • M300:支持超大规模多模态模型训练与推理,2027年上市

     天池超节点:256与512型号,单个512超节点可训练万亿参数模型


参考资料:https://mp.weixin.qq.com/s/2XEYkwD2tnEKhYXUhXk2nw