7月23日消息,阿里巴巴旗下通义千问团队正式开源全新AI编程大模型Qwen3-Coder,其代码生成、智能体调用及复杂任务规划能力超越GPT-4.1等闭源模型,比肩全球顶尖编程模型Claude4,成为开源领域“性能天花板”。
据悉,Qwen3-Coder是通义千问系列首个采用混合专家(MoE)架构的代码模型,总参数达4800亿(480B),激活参数350亿(35B),支持原生256K token上下文,并可通过YaRN技术扩展至1M token,处理超长代码和复杂任务时表现卓越。该模型在7.5T数据(代码占比70%)上预训练,结合编程任务与智能体任务的强化学习,实现了代码生成、调试、工具调用等能力的全面飞跃。
为降低使用门槛,通义千问同步开源Qwen Code命令行工具,基于Gemini Code二次开发,适配Qwen3-Coder的prompt协议与工具调用逻辑,可一键调用模型完成代码生成、单元测试等任务。此外,Qwen3-Coder的API已接入阿里云百炼平台,支持与Claude Code、Cline等工具协同,开发者可灵活组合使用。
目前,模型已在魔搭社区、HuggingFace等平台开放下载,全球开发者可免费获取。