技術(shù)突破驅(qū)動成本下降 多款國產(chǎn)大模型宣布降價
222
訂閱已訂閱已收藏
收藏點擊播報本文,約
近期,DeepSeek、小米、騰訊云等頭部國產(chǎn)大模型運營主體接連宣布下調(diào)API(應(yīng)用程序編程接口)調(diào)用費用,多款主流模型降價幅度突破90%。
有行業(yè)分析師對《證券日報》記者表示,大模型API價格的接連下探,本質(zhì)上是技術(shù)紅利釋放與市場競爭博弈共振的結(jié)果。一方面,底層模型架構(gòu)的不斷迭代與推理系統(tǒng)效能的深度挖掘,正推動單位詞元(Token)的計算成本實現(xiàn)階梯式下降,為價格體系的重塑提供了底層支撐;另一方面,白熱化的市場角逐進(jìn)一步加速了這一進(jìn)程,使得降價成為廠商在激烈競爭中搶占身位的現(xiàn)實選擇。
降價動作頻頻
本輪國產(chǎn)大模型降價周期集中在5月下旬至6月中旬,降價力度逐層加碼,接連打破全球商用大模型API底價紀(jì)錄。
5月22日,DeepSeek率先啟動調(diào)價,其旗下旗艦級通用大模型V4-Pro開啟永久性降價,整體降幅達(dá)到75%;依托緩存加速技術(shù),該模型輸入側(cè)緩存命中單價跌至0.025元/百萬詞元,成為當(dāng)前全球公開報價最低的頂級能力大模型。
僅僅5天后,小米緊隨其后完成調(diào)價動作,其旗下MiMo-V2.5全系列API接口永久下調(diào)資費,部分細(xì)分調(diào)用場景降價比例逼近99%,成為本輪降價潮中單次降幅最高的廠商。
頭部公有云廠商也快速跟進(jìn)。6月2日騰訊云發(fā)布服務(wù)調(diào)價公告,明確自6月3日起,平臺內(nèi)上線的DeepSeek-V4全系列模型同步下調(diào)調(diào)用價格,最高降幅達(dá)到97.5%。騰訊云同時強調(diào),本次調(diào)整僅修改計費標(biāo)準(zhǔn),模型推理速度、上下文窗口、輸出準(zhǔn)確率等核心服務(wù)參數(shù)不做任何改動,用戶使用體驗不受影響。
騰訊云后續(xù)還在6月12日推出第二輪差異化調(diào)價,覆蓋自研與第三方兩類商用模型。首先落地調(diào)價的是自研多語言翻譯模型Hy-MT2-Pro,輸入詞元計費下調(diào)66.67%、輸出詞元計費下調(diào)55.56%;針對第三方入駐模型MiniMax-M3,則設(shè)定延后調(diào)價節(jié)點,定于6月15日統(tǒng)一下調(diào)推理輸入、推理輸出、緩存命中三項費用,各項降幅均為50%。
值得關(guān)注的是,本輪降價完全背離上游算力市場走勢。2026年上半年,AI硬件供應(yīng)鏈供需矛盾持續(xù)激化,核心存儲部件HBM(高帶寬內(nèi)存)半年內(nèi)市價漲幅超500%,英偉達(dá)高端GPU(圖形處理器)現(xiàn)貨長期供不應(yīng)求,海外亞馬遜云、微軟Azure以及國內(nèi)少量中小型云廠商早已啟動漲價,部分海外廠商API最高漲幅甚至達(dá)到463%。
一漲一跌的反向走勢,讓國產(chǎn)大模型的競爭策略差異徹底凸顯。
廣州艾媒數(shù)聚信息咨詢股份有限公司CEO張毅對《證券日報》記者表示,國內(nèi)大模型行業(yè)已經(jīng)走完前期燒錢試錯的技術(shù)驗證階段,全面邁入商業(yè)化落地攻堅期。對于中小開發(fā)者、垂直小微企業(yè)而言,本次大范圍降價直接降低AI創(chuàng)業(yè)試錯成本。在預(yù)算不變的前提下,團(tuán)隊可調(diào)用的模型詞元總量能夠提升數(shù)倍至近百倍,原本受資金限制無法落地的輕量化AI工具、行業(yè)定制插件,如今具備了商業(yè)化測試條件,小眾創(chuàng)新團(tuán)隊的生存空間得到明顯拓寬。
多重因素形成支撐
拋開市場競爭因素,業(yè)內(nèi)人士普遍認(rèn)為,多級存儲緩存優(yōu)化、稀疏算力架構(gòu)迭代、國產(chǎn)算力適配三大技術(shù)突破,是廠商能夠逆勢降價的核心支撐,上游硬件漲價的壓力已經(jīng)被推理層技術(shù)優(yōu)化所對沖。
小米官方披露了MiMo模型的降本技術(shù)路徑:研發(fā)團(tuán)隊基于SGLang(結(jié)構(gòu)化生成語言)框架配套HiCache(配套高速)緩存方案,完整兼容滑動窗口注意力(SWA)算法。通過重構(gòu)詞元緩存調(diào)度邏輯,將KV(鍵值)緩存在GPU顯存、CPU(中央處理器)內(nèi)存、固態(tài)硬盤三級存儲之間的數(shù)據(jù)遷移量壓縮至原先的1/7,同時把系統(tǒng)可長效緩存的詞元容量提升5倍。除此之外,團(tuán)隊還優(yōu)化了混合專家模型的并行調(diào)度邏輯,新增輸入文本長度分桶匹配策略,解決了超長文本并發(fā)調(diào)用時集群算力浪費問題,集群整體吞吐效率提升后,單詞元的平均推理成本自然下降。
DeepSeek則從模型原生架構(gòu)和算力國產(chǎn)化兩條路徑實現(xiàn)降本。架構(gòu)層面,自研輕量化稀疏注意力機(jī)制搭配動態(tài)混合專家結(jié)構(gòu),讓V4系列模型處理十萬級至百萬級超長上下文時,算力資源消耗僅為上一代版本的27%,KV緩存顯存占用直接壓縮90%;算力適配層面,該模型完成了昇騰系列國產(chǎn)算力芯片的深度底層適配,擺脫了對海外高端GPU的單一依賴。一方面降低了硬件采購與長期租賃成本,另一方面也補齊了國產(chǎn)算力生態(tài)的商用落地案例,實現(xiàn)技術(shù)與成本雙向收益。
張毅表示,未來大模型價格將呈現(xiàn)兩極分化走勢:基礎(chǔ)推理服務(wù)價格因技術(shù)迭代和規(guī)模效應(yīng)持續(xù)下探,逐步接近公用事業(yè)定價;而高端定制化服務(wù)將維持溢價。行業(yè)競爭焦點正從算力堆砌轉(zhuǎn)向效率優(yōu)化與生態(tài)構(gòu)建,具備自主架構(gòu)創(chuàng)新能力和國產(chǎn)算力適配能力的企業(yè)有望勝出,缺乏技術(shù)護(hù)城河的廠商將面臨出清壓力。
關(guān)注公眾號:人民網(wǎng)財經(jīng)
分享讓更多人看到
熱門排行
- 1多地港口經(jīng)濟(jì)穩(wěn)步增長 產(chǎn)業(yè)動能持續(xù)壯大
- 2文旅場景持續(xù)創(chuàng)新 沉浸式體驗釋放消費活力
- 3錢袋子保衛(wèi)戰(zhàn)之——《黃金算盤》第六集:…
- 4錢袋子保衛(wèi)戰(zhàn)之——《黃金算盤》第四集:…
- 5 科研成果從實驗室加速邁向生產(chǎn)線(“十…
- 6錢袋子保衛(wèi)戰(zhàn)之——《黃金算盤》第五集:…
- 7聽說街坊們“上頭”了?鞏立姣喊你來追這…
- 8生態(tài)賦能康養(yǎng)文旅 多元融合激活市場新動能
- 9錢袋子保衛(wèi)戰(zhàn)之——《黃金算盤》第九集:…
- 102026人民數(shù)據(jù)大會專題活動亮點紛呈 …
微信掃一掃提供新聞線索


































第一時間為您推送權(quán)威資訊
報道全球 傳播中國
關(guān)注人民網(wǎng),傳播正能量