2025年9月9日,在WAVE SUMMIT深度学习开发者大会2025上,百度发布了文心大模型X1.1,并公布了文心和飞桨的一系列技术、产品、生态最新成果。以下是具体情况:文心大模型X1.1的特点及提升: 训练框架:文心大模型X1.1主要采用了迭代式混合强化学习训练框架,一方面通过混合强化学习,同时提升通用任务和智能体任务的效果;另一方面通过自蒸馏数据的迭代式生产及训练,不断提升模型整体效果。 能力提升:相比文心大模型X1,X1.1的事实性提升34.8%,指令遵循提升12.5%,智能体提升9.6%。在处理复杂写作任务时,能运用内化知识、调用联网搜索工具准确查找知识,深度思考用户创意写作的立意和要求,输出事实准确、结构逻辑强且文辞优美的内容。在长程任务场景中,如面对共享单车用户带有情绪的问题时,能严格遵循业务流程,自主调用工具,结合用户情绪,短时内解决问题。 模型对比:在多个权威基准评测中,文心大模型X1.1整体表现超越DeepSeek R1-0528,在部分任务上展现出领先优势,与国际顶尖模型GPT-5和Gemini 2.5 Pro相比,效果持平。 使用途径:用户可以在文心一言官网、文小言APP使用文心大模型X1.1,该模型也已正式上线百度智能云千帆平台,对企业客户及开发者全面开放使用。飞桨文心生态最新成果: 飞桨框架v3.2:百度发布了飞桨核心框架v3.2,在大模型训练、硬件适配和生态支持上全面升级。依托计算优化、并行策略和原生容错能力三大核心升级,在ERNIE-4.5-300B-A47B模型上实现预训练MFU达47%。同时,强化了类CUDA芯片适配能力,实现了最高92%的算子内核复用率,并全面兼容Safetensors权重及生态加速库一键接入,显著降低部署成本。 文心快码3.5S:百度智能代码助手文心快码全新升级至3.5S版本,强化多智能体自协同能力,实现“一人即团队”开发新模式。文心快码目前已服务超过1000万的开发者,在百度内部,整体新增代码中已经有45%由AI生成,其中前10%的Agent用户,AI完成的部分甚至超过了75%。 生态数据:最新数据显示,飞桨文心生态开发者达到2333万,服务企业达到76万家。此外,大会现场还发布了剧本驱动多模协同的数字人技术,该技术包含剧本驱动的数字人多模协同、融合多模规划与深度思考的剧本生成等五项创新技术;还发布了“文心导师 |
|