2025人工智能计算大会在京召开 百度CTO王海峰解读大模型技术与产业应用
9月26日,以“筑基 开放 燎原”为主题的2025人工智能计算大会(AICC 2025)在北京召开。百度首席技术官王海峰出席大会主论坛,现场解读大模型技术及产业应用。
王海峰表示,从技术角度,通用人工智能的曙光,可以从人工智能技术的通用性和能力的全面性来理解。技术的通用性方面,大模型在解决不同任务、语言、模态、场景上的通用性都变得越来越好;能力的全面性方面,理解、生成、逻辑、记忆是人工智能的四项基础能力,其他各项人工智能的典型能力基本上都是这四项基础能力的综合运用。这四项能力越强,越接近通用人工智能。
以文心大模型为例,自2019年3月发布文心大模型1.0版本以来,现已升级到文心大模型4.5 Turbo。9月初,百度还发布了文心大模型X1.1深度思考模型,并开源文心思考模型ERNIE-4.5-21B-A3B-Thinking。
大会现场,王海峰介绍,文心大模型X1是基于文心大模型4.5训练而来的深度思考模型,升级后的X1.1主要采用了迭代式混合强化学习训练框架,一方面通过混合强化学习,同时提升通用任务和智能体任务的效果;另一方面通过自蒸馏数据的迭代式生产及训练,不断提升模型整体效果。相比文心X1,X1.1的事实性提升34.8%,指令遵循提升12.5%,智能体提升9.6%。
现场,王海峰分享了基于文心大模型的最佳实践——剧本驱动多模协同的数字人技术。文心大模型4.5系列支持多模态能力,以剧本驱动,语言、语音与视觉协同,实现超拟真数字人生成。通过大语言模型生成剧本,再驱动语音与视觉输出,数字人可自然播报台词、表现表情和动作。百度基于剧本驱动的多模协同技术,实现了语言、声音和形象的高度协调,为数字人及虚拟内容创作提供了强大支撑。
早前有公开报道显示,在百度数字人应用实践中,数字人直播的线上表现超过了真人。而罗永浩数字人直播首秀GMV更是突破行业新纪录,部分核心品类带货量超过真人直播。
随着技术的不断演进和生态的日益完善,人工智能将在更多领域释放潜力,推动产业智能化迈向更深、更广的发展阶段。
(编辑:王胜男)






