打開

首頁
黨政
- 黨網(wǎng) · 時政
- 人事
- 反腐
- 理論
- 黨史
- 黨建
要聞
人民銳評
互動
觀點
可視化
地方
- 京
- 津
- 冀
- 晉
- 蒙
- 遼
- 吉
- 黑
- 滬
- 蘇
- 浙
- 皖
- 閩
- 贛
- 魯
- 豫
- 鄂
- 湘
- 粵
- 桂
- 瓊
- 渝
- 川
- 黔
- 滇
- 藏
- 陜
- 甘
- 青
- 寧
- 新
- 鵬
- 雄安
民文
English
合作網(wǎng)站
人工智能
客戶端
無障礙
舉報
登錄

退出

人民網(wǎng)>>經(jīng)濟(jì)·科技

技術(shù)突破驅(qū)動成本下降多款國產(chǎn)大模型宣布降價

袁傳璽

2026年06月16日09:07 | 來源：證券日報222

訂閱已訂閱已收藏

小字號

點擊播報本文，約

原標(biāo)題：技術(shù)突破驅(qū)動成本下降多款國產(chǎn)大模型宣布降價

近期，DeepSeek、小米、騰訊云等頭部國產(chǎn)大模型運營主體接連宣布下調(diào)API（應(yīng)用程序編程接口）調(diào)用費用，多款主流模型降價幅度突破90%。

有行業(yè)分析師對《證券日報》記者表示，大模型API價格的接連下探，本質(zhì)上是技術(shù)紅利釋放與市場競爭博弈共振的結(jié)果。一方面，底層模型架構(gòu)的不斷迭代與推理系統(tǒng)效能的深度挖掘，正推動單位詞元（Token）的計算成本實現(xiàn)階梯式下降，為價格體系的重塑提供了底層支撐；另一方面，白熱化的市場角逐進(jìn)一步加速了這一進(jìn)程，使得降價成為廠商在激烈競爭中搶占身位的現(xiàn)實選擇。

降價動作頻頻

本輪國產(chǎn)大模型降價周期集中在5月下旬至6月中旬，降價力度逐層加碼，接連打破全球商用大模型API底價紀(jì)錄。

5月22日，DeepSeek率先啟動調(diào)價，其旗下旗艦級通用大模型V4-Pro開啟永久性降價，整體降幅達(dá)到75%；依托緩存加速技術(shù)，該模型輸入側(cè)緩存命中單價跌至0.025元/百萬詞元，成為當(dāng)前全球公開報價最低的頂級能力大模型。

僅僅5天后，小米緊隨其后完成調(diào)價動作，其旗下MiMo-V2.5全系列API接口永久下調(diào)資費，部分細(xì)分調(diào)用場景降價比例逼近99%，成為本輪降價潮中單次降幅最高的廠商。

頭部公有云廠商也快速跟進(jìn)。6月2日騰訊云發(fā)布服務(wù)調(diào)價公告，明確自6月3日起，平臺內(nèi)上線的DeepSeek-V4全系列模型同步下調(diào)調(diào)用價格，最高降幅達(dá)到97.5%。騰訊云同時強調(diào)，本次調(diào)整僅修改計費標(biāo)準(zhǔn)，模型推理速度、上下文窗口、輸出準(zhǔn)確率等核心服務(wù)參數(shù)不做任何改動，用戶使用體驗不受影響。

騰訊云后續(xù)還在6月12日推出第二輪差異化調(diào)價，覆蓋自研與第三方兩類商用模型。首先落地調(diào)價的是自研多語言翻譯模型Hy-MT2-Pro，輸入詞元計費下調(diào)66.67%、輸出詞元計費下調(diào)55.56%；針對第三方入駐模型MiniMax-M3，則設(shè)定延后調(diào)價節(jié)點，定于6月15日統(tǒng)一下調(diào)推理輸入、推理輸出、緩存命中三項費用，各項降幅均為50%。

值得關(guān)注的是，本輪降價完全背離上游算力市場走勢。2026年上半年，AI硬件供應(yīng)鏈供需矛盾持續(xù)激化，核心存儲部件HBM（高帶寬內(nèi)存）半年內(nèi)市價漲幅超500%，英偉達(dá)高端GPU（圖形處理器）現(xiàn)貨長期供不應(yīng)求，海外亞馬遜云、微軟Azure以及國內(nèi)少量中小型云廠商早已啟動漲價，部分海外廠商API最高漲幅甚至達(dá)到463%。

一漲一跌的反向走勢，讓國產(chǎn)大模型的競爭策略差異徹底凸顯。

廣州艾媒數(shù)聚信息咨詢股份有限公司CEO張毅對《證券日報》記者表示，國內(nèi)大模型行業(yè)已經(jīng)走完前期燒錢試錯的技術(shù)驗證階段，全面邁入商業(yè)化落地攻堅期。對于中小開發(fā)者、垂直小微企業(yè)而言，本次大范圍降價直接降低AI創(chuàng)業(yè)試錯成本。在預(yù)算不變的前提下，團(tuán)隊可調(diào)用的模型詞元總量能夠提升數(shù)倍至近百倍，原本受資金限制無法落地的輕量化AI工具、行業(yè)定制插件，如今具備了商業(yè)化測試條件，小眾創(chuàng)新團(tuán)隊的生存空間得到明顯拓寬。

多重因素形成支撐

拋開市場競爭因素，業(yè)內(nèi)人士普遍認(rèn)為，多級存儲緩存優(yōu)化、稀疏算力架構(gòu)迭代、國產(chǎn)算力適配三大技術(shù)突破，是廠商能夠逆勢降價的核心支撐，上游硬件漲價的壓力已經(jīng)被推理層技術(shù)優(yōu)化所對沖。

小米官方披露了MiMo模型的降本技術(shù)路徑：研發(fā)團(tuán)隊基于SGLang（結(jié)構(gòu)化生成語言）框架配套HiCache（配套高速）緩存方案，完整兼容滑動窗口注意力（SWA）算法。通過重構(gòu)詞元緩存調(diào)度邏輯，將KV（鍵值）緩存在GPU顯存、CPU（中央處理器）內(nèi)存、固態(tài)硬盤三級存儲之間的數(shù)據(jù)遷移量壓縮至原先的1/7，同時把系統(tǒng)可長效緩存的詞元容量提升5倍。除此之外，團(tuán)隊還優(yōu)化了混合專家模型的并行調(diào)度邏輯，新增輸入文本長度分桶匹配策略，解決了超長文本并發(fā)調(diào)用時集群算力浪費問題，集群整體吞吐效率提升后，單詞元的平均推理成本自然下降。

DeepSeek則從模型原生架構(gòu)和算力國產(chǎn)化兩條路徑實現(xiàn)降本。架構(gòu)層面，自研輕量化稀疏注意力機(jī)制搭配動態(tài)混合專家結(jié)構(gòu)，讓V4系列模型處理十萬級至百萬級超長上下文時，算力資源消耗僅為上一代版本的27%，KV緩存顯存占用直接壓縮90%；算力適配層面，該模型完成了昇騰系列國產(chǎn)算力芯片的深度底層適配，擺脫了對海外高端GPU的單一依賴。一方面降低了硬件采購與長期租賃成本，另一方面也補齊了國產(chǎn)算力生態(tài)的商用落地案例，實現(xiàn)技術(shù)與成本雙向收益。

張毅表示，未來大模型價格將呈現(xiàn)兩極分化走勢：基礎(chǔ)推理服務(wù)價格因技術(shù)迭代和規(guī)模效應(yīng)持續(xù)下探，逐步接近公用事業(yè)定價；而高端定制化服務(wù)將維持溢價。行業(yè)競爭焦點正從算力堆砌轉(zhuǎn)向效率優(yōu)化與生態(tài)構(gòu)建，具備自主架構(gòu)創(chuàng)新能力和國產(chǎn)算力適配能力的企業(yè)有望勝出，缺乏技術(shù)護(hù)城河的廠商將面臨出清壓力。

(責(zé)編：羅知之、陳鍵)

關(guān)注公眾號：人民網(wǎng)財經(jīng)