網路 2026-06-02

導讀:昨天凌晨,當大多數人還在睡夢中時,一則公告在開發者圈子裏炸開了鍋。 小米MiMo大模型團隊正式宣布:MiMo-V2.5系列API永久降價,最高降幅達到驚人的99%,而且不再區分上下文窗口長度。 雷軍隨後轉發並配文:“歡迎更多開發者接入Xiaomi MiMo大模型!” 這不是一次普通促銷,這是一場蓄謀已久的“掀桌”。

01 DeepSeek出題,小米光速交卷

四天前,DeepSeek率先“動刀”。樑文鋒團隊宣布,V4-Pro模型的臨時折扣轉爲永久有效,輸入緩存命中價格壓到0.025元/百萬tokens,成爲名副其實的“價格屠夫”

當時很多人以爲,其他廠商至少會觀望一陣。畢竟算力和存儲芯片價格正在瘋漲,阿裏雲、騰訊雲上個月剛宣布漲價,智譜華章甚至漲了83%,API價格已經看齊GPT和Claude

沒想到,小米只用了四天。

5月27日凌晨,小米的降價公告準時發出,價格幾乎是“復制粘貼”式對標

具體來看,MiMo-V2.5-Pro調價後,輸入緩存命中價格僅爲0.025元/百萬tokens,比原價最高降了99%;輸出價格6元/百萬tokens,較原價最高降了86%

更值得關注的是,小米取消了此前按上下文窗口長度區分價格的做法——無論是256K還是1M窗口,統一按同一價格計費

雷軍昨天還說,未來三年要在AI領域投入600億元,預計全年研發投入超400億元。顯然,降價只是開胃菜。

02 Token Plan同步升級:加量不加價

除了API降價,小米還同步升級了Token Plan套餐體系。

同等價格下,Token用量提升到了原來的5到8倍。以最便宜的Lite套餐爲例,39元的月費,在高緩存命中場景下,實際可用Token可以達到5億以上

這是什麼概念?一個普通開發者,每月花39元,可以調用相當於幾百萬次對話的算力,成本幾乎可以忽略不計。

小米還披露了一個數據:此前推出的“百萬億Token創造者激勵計劃”,100T Tokens已經提前發放完畢。顯然,開發者對低價Token的需求是真實的,而且是飢渴的。

小米甚至對所有仍在有效期內的Token Plan用戶“反向操作”——不管之前用到什麼程度,Credits額度全部重置,按新規則執行。這種“老用戶與狗”的擔憂直接被扼殺在搖籃裏。

03 別人在漲價,小米憑什麼敢降價?

最有意思的地方在於:小米降價的時機,恰恰是整個行業成本壓力最大的時候。

今年3月以來,阿裏雲、騰訊雲相繼宣布部分模型API價格上調,智譜華章更是經過多輪漲價,API價格已看齊GPT和Claude

爲什麼小米和DeepSeek敢逆勢而爲?

答案不在於硬件成本下降,而在於推理效率的工程優化

很多人不知道,大模型在生成回答時是逐字逐句進行的。如果沒有緩存機制,每次生成都要重新回溯所有歷史信息,既消耗算力,又拖慢速度。

小米這次的關鍵技術突破是SGLang HiCache和SWA(滑動窗口注意力)——簡單說,就是把多級存儲間的緩存數據搬運量降到了優化前的七分之一,可緩存Token數量提升了近5倍

當別人還在拼硬件的時候,小米已經開始拼“巧勁”了。

技術優化帶來的成本下降,最終轉化成了定價的自由度。

04 價格一樣,誰更有“含金量”?

當價格被抹平到同一水準線,決定勝負的唯一指標就變成了Token的生產力價值

DeepSeek是個偏科生,編程和邏輯推理能力領先,但多模態是它的短板——目前的識圖功能也只能算“聊勝於無”。

小米則是個全能選手,從一開始就強調“全模態”。同樣的API價格下,小米的Token能處理圖像、音頻和視頻等多種復雜交互形式

這一點在智慧體時代尤爲重要。當AI不再只是“聊天”,而是需要“看”“聽”“理解”時,多模態能力的價值會越來越突出。

花同樣的錢,能買到更多功能,這個賬開發者算得明白。

05 行業格局正在被重構:從“技術差”到“成本戰”

小米的快速跟進,驗證了一個殘酷的邏輯:當智慧水準無法產生代差時,性價比就成了唯一的護城河

國內模型在“最頂尖的智慧”領域與國際頂尖水準仍有差距,但在“非復雜任務”的規模化應用場景下,各廠商之間的智慧水準其實拉不開絕對差距

那還能拼什麼?拼價格,拼生態,拼誰能先讓開發者“用上癮”。

花旗也在最新研報中指出,小米此項激進的定價策略將推動Token使用量激增,同時也有助於訓練和提升其大語言模型的性能

“用戶規模與緩存命中形成正向迴圈”——用的人越多,緩存命中率越高,推理成本越低,價格還可以更低

這就是小米要構建的“成本護城河”。

06 更大的局:國產芯片正在悄悄“上位”

還有一個細節值得關注。

小米和DeepSeek敢於降價,底層還有一個重要支撐——國產芯片的替代正在加速。

DeepSeek首次將華爲昇騰與英偉達並列寫入硬件驗證清單。結果顯示,DeepSeek-V4在昇騰芯片上的推理速度較初期版本提升了35倍,華爲CANN與英偉達CUDA的代碼相容性已逼近95%

小米MiMo-V2.5同樣適配了阿裏平頭哥、天數智芯、燧原科技、沐曦、昆侖芯等多家國產推理芯片,幾乎覆蓋了所有國產主流產品

“國模+國芯”正在從口號變成現實。

當國產芯片的性價比優勢進一步釋放,API價格還有可能繼續下探。

寫在最後

從DeepSeek到小米,價格戰的大幕已經拉開。

這對開發者來說是好事——算力成本正在變得像水電一樣便宜,更多創意可以低成本落地。對整個行業來說,這也是一個分水嶺:靠“賣算力”賺錢的時代正在結束,真正能活下來的,是那些能把技術效率做到極致、能在同等價格下提供更高“含金量”的玩家。

小米用技術優化換來了定價自由,DeepSeek用激進策略搶佔了用戶心智。

這場牌局,才剛剛開始。

下一篇: 很抱歉沒有了

免責聲明:凡注明來源中國制造網的所有作品,均爲中國制造網合法擁有版權或有權使用的作品,歡迎轉載並注明出處。非本網站作品均來自互聯網,僅代表作者本人的觀點,中國制造網轉載目的在於傳遞信息,並不代表本網贊同其觀點或對其真實性負責。因作者信息不明等原因,中國制造網使用的部分作品報酬未及時支付,相關權利人可與本網聯系。

分享到: