找回密码
 立即注册
搜索
日产 讴歌 福特 极氪 林肯 阿尔法 保时捷 奔腾 长城 东风 哈弗 Jeep 捷途 岚图 理想 兰博基尼 名爵 马自达 玛莎拉蒂 欧拉 奇瑞 smart 沙龙 坦克 特斯拉 蔚来 沃尔沃 小鹏 雪佛兰 高合 奥迪 丰田 本田 雷克萨斯 英菲尼迪 捷达 捷豹路虎 阿斯顿 马丁 罗密欧 标致 宾利 长安 法拉利 红旗 几何 凯迪拉克 领克 劳斯莱斯 路特斯 MINI 迈凯伦 哪吒 起亚 荣威 三菱 斯巴鲁 腾势 魏牌 五菱 现代 雪铁龙 宝骏 大众 宝马 比亚迪

Kimi深夜整活,开源了首个万亿参数模型

[XinWen.Mobi 原创复制链接分享]
xinwen.mobi 发表于 2025-7-12 15:25:40 | 显示全部楼层 |阅读模式
2025年7月11日晚,月之暗面宣布正式发布新一代基础模型Kimi K2,并同步开源。以下是该模型的相关介绍:模型参数:Kimi K2采用稀疏激活(MoE)架构,总参数达1万亿,激活参数为320亿。性能表现:在SWE Bench Verified(编程)、Tau2(智能体)、AceBench(工具调用)等多项基准测试中取得当前开源模型中的最佳成绩(SOTA)。在自主编程、工具调用和数学推理这三个能力维度上,超过了DeepSeek-V3-0324、Qwen-235B-A22B等模型,且在部分能力上紧逼Claude 4 Opus、OpenAI GPT-4.1等闭源模型。技术创新:训练过程中采用MuonClip优化器,有效解决大参数量模型的稳定训练问题,提升token利用效率。同时,结合大规模Agentic Tool Use数据合成、自我评价机制下的通用强化学习等方法,构建起更具泛化能力的推理引擎。模型版本:开源了Kimi-K2-Base和Kimi-K2-Instruct两个版本,前者适合科研与自定义场景,后者可用于大多数问答与Agent任务。应用场景:具备复杂指令解析能力,可将需求自动拆解为一系列格式规范、可直接执行的ToolCall结构。开发者可将其接入owl、Cline、RooCode等Agent/Coding框架,完成复杂任务或自动化编码。例如,它可以分析远程办公比例对薪资的影响,自动生成统计图表与回归模型解读;还能帮忙制定追星计划,完成演唱会所在城市的机酒与旅游规划等。API服务:Kimi K2 API已同步上线,兼容OpenAI与Anthropic的Chat接口,最长支持128K上下文窗口,费用为每百万输入tokens 4元,输出tokens 16元。用户也可在无问芯穹Infini - AI异构云平台以同样价格调用该模型。
回复

使用道具 举报

日产 讴歌 福特 极氪 林肯 阿尔法 保时捷 奔腾 长城 东风 哈弗 Jeep 捷途 岚图 理想 兰博基尼 名爵 马自达 玛莎拉蒂 欧拉 奇瑞 smart 沙龙 坦克 特斯拉 蔚来 沃尔沃 小鹏 雪佛兰 高合 奥迪 丰田 本田 雷克萨斯 英菲尼迪 捷达 捷豹路虎 阿斯顿·马丁 罗密欧 标致 宾利 长安 法拉利 红旗 几何 凯迪拉克 领克 劳斯莱斯 路特斯 MINI 迈凯伦 哪吒 起亚 荣威 三菱 斯巴鲁 腾势 魏牌 五菱 现代 雪铁龙 宝骏 大众 宝马 比亚迪

QQ|标签|爬虫xml|爬虫txt|新闻魔笔科技XinWen.MoBi - 海量语音新闻! ( 粤ICP备2024355322号-1|粤公网安备44090202001230号 )

GMT+8, 2025-11-4 05:47 , Processed in 0.126231 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

消息来源网络

快速回复 返回顶部 返回列表