最強開源編程模型,來了。
7月23日清晨,阿里正式發(fā)布并開源全新的通義千問AI編程大模型Qwen3-Coder。據(jù)悉,這是阿里迄今為止最具代理能力的代碼模型,編程能力登頂全球開源模型陣營,并超越GPT4.1等閉源模型,比肩全球最強的編程模型Claude 4。
作為千問系列模型中首個采用混合專家MoE架構(gòu)的代碼模型,Qwen3-Coder的總參數(shù)達到480B,激活參數(shù)為35B,原生支持256K上下文并可擴展至1M長度。據(jù)通義千問團隊介紹,Qwen3-Coder是在代碼占比70%的7.5T數(shù)據(jù)上進行預(yù)訓(xùn)練,在后訓(xùn)練階段進行了編程任務(wù)及智能體任務(wù)的強化學(xué)習(xí),最終實現(xiàn)了通用能力、代碼能力及智能體能力的飛升。
Qwen3-Coder擁有多個尺寸,其中最強大的版本Qwen3-Coder-480B-A35B-Instruct在基準測試中,在編程和智能體任務(wù)上擁有優(yōu)秀的性能,在Agentic Coding(智能體編程)、Agentic Browser-Use(智能體瀏覽器使用)和Agentic Tool-Use(智能體工具調(diào)用)三類任務(wù)中獲得了開源SOTA(“StateoftheArt”,意思是最先進的水平),可以與Claude Sonnet 4媲美。實測數(shù)據(jù)顯示,在執(zhí)行任務(wù)時,Qwen3-Coder能夠調(diào)用的工具數(shù)量比Claude多幾倍,效果非常出色。
值得注意的是,今年以來在程序員圈子中非常火爆的“氛圍編程”,Qwen3-Coder也具備相關(guān)功能。Qwen3-Coder能幫助程序員完成基礎(chǔ)編程任務(wù),比如寫代碼、補全代碼、修Bug等,編程工作效率大幅提升,代碼測試、查詢生成等工作從人工編寫的數(shù)小時驟降至數(shù)分鐘。據(jù)阿里官方介紹,借助Qwen3-Coder,剛?cè)胄械某绦騿T一天就能完成資深程序員一周的工作,生成一個品牌官網(wǎng)最快只需5分鐘。此外,借助Qwen3-Coder,普通人用一句話也能生成精妙復(fù)雜的3D物理模擬過程,極大降低了入門編程的門檻。
Qwen3-Coder已在魔搭社區(qū)、HuggingFace等平臺開源,全球開發(fā)者都可以免費下載使用。價格方面,Qwen3-Coder采用階梯計費的方式,根據(jù)輸入token量調(diào)整價格。在256K—1M一檔,其輸入價格為6美元/百萬token,輸出價格為60美元/百萬token。業(yè)內(nèi)人士指出,開源的Qwen3-Coder有望取代昂貴的Claude,成為Agent領(lǐng)域最受歡迎的編程模型。
在當(dāng)前的AI全球競爭中,代碼推理和編程成為了檢驗?zāi)P托阅艿闹匾I(lǐng)域,AI編程助手也正成為科技巨頭角力的新戰(zhàn)場。今年以來,無論是微軟、谷歌等大廠,還是OpenAI、Anthropic等大模型明星創(chuàng)業(yè)公司,都在加大AI編程領(lǐng)域的投入與布局。最近,谷歌以24億美元引入初創(chuàng)公司W(wǎng)indsurf核心團隊及技術(shù)的消息,更進一步凸顯了科技巨頭間在代理式編程與AI人才上的激烈競爭。
SensorTower數(shù)據(jù)顯示,今年3至4月,ChatGPT用戶請求中有近29%與編程相關(guān),反映出企業(yè)用戶對AI輔助開發(fā)的興趣。業(yè)內(nèi)人士分析指出,對于微軟和谷歌等大廠,AI編程有利于補強云服務(wù)生態(tài)黏性。對于同時提供B端和C端服務(wù)的大模型公司,提供擅長編碼任務(wù)的模型+下探到Agent,可能是在大模型商業(yè)化路徑上的一次重大機會點。
在這樣的背景下,阿里的Qwen3-Coder編程能力登頂全球開源模型陣營,是國產(chǎn)編程模型的一次新突破。同時,阿里云表示將繼續(xù)提升Coding Agent效果,并計劃推出更多模型尺寸版本,在保證效果的同時降低部署成本。
據(jù)阿里方面的最新數(shù)據(jù),截至目前,阿里千問系列編程模型全球下載量已突破2000萬次,是全球最受歡迎的開源編程模型。據(jù)悉,阿里巴巴內(nèi)部已開始大量使用AI編程。一汽集團、中國石油、建設(shè)銀行、平安集團、南方航空、小鵬汽車等各行業(yè)頭部企業(yè)也已接入千問AI編程模型。
校對:趙燕