阿里开源最强 AI 编程模型 Qwen3-Coder,性能比肩 Claude4
7 月 23 日清晨,阿里开源全新的通义千问 AI 编程大模型 Qwen3-Coder,编程能力登顶全球开源模型阵营,并超越 GPT4.1 等闭源模型,比肩全球最强的编程模型 Claude4。Qwen3-Coder 是千问系列模型中首个采用混合专家 MoE 架构的代码模型,总参数达 480B,激活 35B 参数,原生支持 256K token 的上下文并可扩展至 1M 长度。Qwen3-Coder 在代码占比 70% 的 7.5T 数据上预训练,在后训练阶段进行了编程任务及智能体任务的强化学习,最终实现了通用能力、代码能力及 Agent 能力的飞升:在浏览器调用(WebArena)、工具调用(BFCL)等Agent能力评测中,Qwen3-Coder 刷新开源模型纪录,超越 GPT4.1;在考察模型自主规划解决编程任务的SWE-Bench评测中,Qwen3-Coder取得了开源最佳效果,可媲美Claude4。
原创文章,作者:网站编辑,如若转载,请注明出处:https://www.devcn.xin/1101.html