國內大模型領域的先鋒企業月之暗面,近日震撼發布了其最新力作——Kimi K2,一款總參數量高達1萬億(1T)的MoE架構基礎模型,并慷慨地選擇了開源。這款模型已在Kimi的Web端和App端上線,供用戶體驗。
Kimi K2作為月之暗面的旗艦之作,首次開源便交出了亮眼的成績單。在SWE Bench Verified(編程)、Tau2(智能體)、AceBench(工具調用)三大基準測試中,它均取得了開源模型中的頂尖成績。這一表現,無疑為月之暗面在國內乃至全球的大模型舞臺上贏得了更多關注。
在具體能力上,Kimi K2在自主編程、工具調用和數學推理方面均展現出了強大的實力。盡管在某些基準測試中,它略遜于Claude 4 Opus、OpenAI GPT-4.1等頂尖模型,但相較于DeepSeek-V3-0324、Qwen-235B-A22B等模型,Kimi K2的優勢依然明顯。
月之暗面在Kimi K2的訓練過程中,采用了創新的“MuonClip”優化器,這一優化器有效提高了Token的利用效率,并緩解了高質量人類數據短缺的問題。他們還引入了大規模Agentic Tool Use數據合成技術和通用強化學習機制,進一步提升了模型的通用智能能力。
Kimi K2的API服務也同步上線,支持最長128K的上下文長度,為用戶提供了極大的便利。在計費方案上,Kimi K2采取了每百萬輸入tokens 4元、每百萬輸出tokens 16元的策略,這一價格雖然較DeepSeek V3翻倍,但考慮到其強大的功能和性能,依然具有極高的性價比。
為了滿足不同用戶的需求,Kimi K2系列提供了兩個模型版本供用戶選擇。其中,Kimi-K2-Base是基礎預訓練模型,未經指令微調,適合科研與自定義場景;而Kimi-K2-Instruct則是經過通用指令微調的版本,可用于大多數問答與Agent任務。這兩個版本均已開源,用戶可根據自己的需求進行下載和使用。
用戶還可以通過無問芯穹Infini-AI異構云平臺以與官方API同樣的價格調用Kimi K2,這無疑為用戶提供了更多的選擇和便利。
在編程能力方面,Kimi K2展現出了驚人的實力。它能夠生成具有設計感和視覺表現力的代碼,支持粒子系統、可視化和3D場景等多種形式。在官方Demo中,Kimi K2成功開發了一個支持晝夜循環的山川峽谷3D景觀和粒子特效銀河,令人嘆為觀止。然而,在實際測試中,雖然Kimi K2交付的網頁渲染效果并未完全達到官方Demo的水平,但其交互性和功能豐富度依然令人印象深刻。
在個人網站開發任務上,Kimi K2同樣展現出了不俗的規劃能力。它能夠主動梳理網站的目錄結構,打造出可擴展性更好的網站。與Kimi K1.5相比,Kimi K2在UI審美水平上有了一定的提升,雖然進步有限,但足以看出月之暗面在模型優化上的不懈努力。
除了編程能力外,Kimi K2的Agent工具調用能力也得到了顯著增強。它能夠解析復雜指令,將需求自動拆解為一系列格式規范、可直接執行的ToolCall結構。這意味著開發者可以將Kimi K2接入各種Agent/Coding框架,完成復雜任務或自動化編碼。在實際演示中,Kimi K2展現出了強大的Agentic能力,如分析遠程辦公比例對薪資的影響、自動生成統計圖表和回歸模型解讀等。
Kimi K2還具備了更強的風格化寫作能力。它能夠模仿各種風格的文案,如蘋果廣告文案等,為用戶提供了更多的創作靈感。在通用知識推理、數學、規劃等任務中,Kimi K2的表現同樣出色,能夠輕松應對各種挑戰。