91亚洲国产AⅤ精品一区二区,国产伦精品一区二区三区,四川少妇搡bbbb搡bbbb,国产全黄A一级毛片96
DeepSeek“鲇魚(yú)效應(yīng)” 2025年大模型價(jià)格戰(zhàn)或?qū)⒊掷m(xù)

DeepSeek“鲇魚(yú)效應(yīng)” 2025年大模型價(jià)格戰(zhàn)或?qū)⒊掷m(xù)

lulan 2025-03-04 新聞 12 次瀏覽 0個(gè)評(píng)論

本報(bào)記者 曲忠芳 北京報(bào)道

“性?xún)r(jià)比”是商業(yè)社會(huì)中的制勝法寶之一,從消費(fèi)電子到零售服務(wù),從傳統(tǒng)制造業(yè)到互聯(lián)網(wǎng)經(jīng)濟(jì),高性?xún)r(jià)比在撬動(dòng)市場(chǎng)、贏得用戶(hù)方面屢試不爽。而如今,在“規(guī)模法則”(Scaling Law)主導(dǎo)下、“大力出奇跡”的大模型“燒錢(qián)”競(jìng)賽中,來(lái)自中國(guó)杭州的大模型初創(chuàng)企業(yè)深度求索(DeepSeek)憑借高性?xún)r(jià)比迅速出圈,被冠以“AI界的拼多多”稱(chēng)號(hào),吸引了國(guó)內(nèi)外的廣泛關(guān)注。

截至1月10日,深度求索的最新大模型產(chǎn)品DeepSeek V3已發(fā)布并開(kāi)源半個(gè)月之久,如同“鲇魚(yú)”般給原本卡在“瓶頸”中的全球大模型市場(chǎng)注入了新的活力,《》記者通過(guò)采訪業(yè)內(nèi)人士,希望深度探討DeepSeek這條“鲇魚(yú)”將攪起市場(chǎng)的哪些變化。

“AI界的拼多多”驗(yàn)證新思路?

DeepSeek被冠以“AI界的拼多多”稱(chēng)號(hào),主要是因?yàn)樗鼧O高的性?xún)r(jià)比,與拼多多在電商領(lǐng)域以高性?xún)r(jià)比著稱(chēng)的模式相似。有趣的是,在DeepSeek V3生成的“自我介紹”中也使用了這一稱(chēng)謂。

深度求索公司創(chuàng)立于2023年7月,是由中國(guó)量化私募公司“幻方量化”創(chuàng)始人梁文峰創(chuàng)立,2024年5月推出了第二代開(kāi)源模型DeepSeek V2,到2024年12月26日又推出最新的開(kāi)源模型DeepSeek V3。DeepSeek官網(wǎng)顯示,在多項(xiàng)基準(zhǔn)測(cè)試——涵蓋英語(yǔ)、中文、數(shù)學(xué)、代碼等結(jié)果中,DeepSeek V3的成績(jī)超過(guò)了阿里的千問(wèn)“Qwen2.5-72B”、Meta公司的Llama3.1-405B等開(kāi)源模型,而且與OpenAI的GPT-4o、Anthropic公司的Claude3.5-Sonnet兩大閉源模型的表現(xiàn)也不相上下。更為重要的是,DeepSeek方面披露,其訓(xùn)練成本僅為557.6萬(wàn)美元和2000塊英偉達(dá)H800 GPU(圖形處理器)。

與之形成鮮明對(duì)比的是,據(jù)斯坦福大學(xué)HAI研究院發(fā)布的《2024年人工智能指數(shù)報(bào)告》預(yù)估,OpenAI于2023年3月發(fā)布的GPT-4模型訓(xùn)練成本約在7800萬(wàn)美元,同年發(fā)布的谷歌Gemini Ultra的計(jì)算成本花費(fèi)預(yù)估為1.91億美元。據(jù)Meta官方信息,2024年7月面世的開(kāi)源模型Llama3.1-405B,訓(xùn)練使用了1.6萬(wàn)塊英偉達(dá)H100 GPU。超級(jí)富豪埃隆·馬斯克同樣曾在2024年7月宣布建立孟菲斯超級(jí)AI集群,使用10萬(wàn)個(gè)英偉達(dá) H100 GPU。另?yè)?jù)美國(guó)媒體報(bào)道,GPT-4o的訓(xùn)練成本約在1億美元,GPU數(shù)量預(yù)計(jì)在萬(wàn)個(gè)級(jí)別;而Claude3.5-Sonnet的訓(xùn)練成本或略低于1億美元,使用的GPU數(shù)量推測(cè)為數(shù)千至上萬(wàn)個(gè)。從這些直觀的數(shù)據(jù)對(duì)比中不難看出,DeepSeek大幅度降低了模型訓(xùn)練和推理成本。

關(guān)于DeepSeek如何實(shí)現(xiàn)高性?xún)r(jià)比的問(wèn)題,本報(bào)記者咨詢(xún)了數(shù)名來(lái)自高校、企業(yè)的技術(shù)專(zhuān)家,他們做出了一些專(zhuān)業(yè)技術(shù)方面的解釋?zhuān)婕岸囝^潛在注意力機(jī)制(MLA架構(gòu))、稀疏專(zhuān)家混合模型(MoE)架構(gòu)、FP8混合精度訓(xùn)練、數(shù)據(jù)蒸餾與算法優(yōu)化等。簡(jiǎn)單來(lái)說(shuō),DeepSeek沒(méi)有“堆砌算力”,而是在算力限制下轉(zhuǎn)而探索效率優(yōu)先的途徑。

“DeepSeek V3出現(xiàn)后,對(duì)于一些中小型團(tuán)隊(duì)來(lái)說(shuō)是有利的?!币晃粯I(yè)內(nèi)人士如是說(shuō)道。近兩年來(lái),規(guī)模法則被視為大模型發(fā)展的黃金定律,大模型的性能指數(shù)與模型參數(shù)、數(shù)據(jù)量、算力的增加正相關(guān),因此全球范圍內(nèi)呈現(xiàn)一場(chǎng)“大力出奇跡”的競(jìng)賽。然而,隨著模型規(guī)模的不斷膨脹,規(guī)模法則的邊際效益逐漸遞減。一方面,超大規(guī)模模型的訓(xùn)練成本高昂,算力需求呈幾何級(jí)數(shù)增長(zhǎng);另一方面,數(shù)據(jù)質(zhì)量和模型架構(gòu)的優(yōu)化空間有限,導(dǎo)致性能提升逐漸趨緩。在這種趨勢(shì)下,大模型日漸成為巨頭與資本的游戲,直到DeepSeek驗(yàn)證了大模型性能提升的新思路。

深度科技研究院院長(zhǎng)張孝榮指出,DeepSeek的“出圈”是對(duì)其在大模型技術(shù)上的突破和創(chuàng)新的認(rèn)可,其通過(guò)優(yōu)化算法和工程實(shí)踐,實(shí)現(xiàn)了高性能與低成本的平衡,為大模型的發(fā)展提供了新的思路和可能性,降低了大模型對(duì)先進(jìn)算力的依賴(lài)程度。DeepSeek為整個(gè)行業(yè)的發(fā)展注入了活力,也對(duì)大模型的技術(shù)路徑和工程實(shí)踐產(chǎn)生了積極影響,推動(dòng)了高效訓(xùn)練、輕量化模型和工程優(yōu)化。

DeepSeek“鲇魚(yú)效應(yīng)” 2025年大模型價(jià)格戰(zhàn)或?qū)⒊掷m(xù)

價(jià)格戰(zhàn)或持續(xù),AI加速普惠落地

“DeepSeek加速了AI和大數(shù)據(jù)技術(shù)的普及,有望使更多企業(yè)和開(kāi)發(fā)者能夠接觸并應(yīng)用這些技術(shù)。同時(shí),也迫使競(jìng)爭(zhēng)對(duì)手重新評(píng)估定價(jià),這可能引發(fā)行業(yè)內(nèi)的價(jià)格戰(zhàn),推動(dòng)整體價(jià)格下降,使更多企業(yè)能夠采用先進(jìn)技術(shù)?!睆埿s說(shuō)道。

事實(shí)上,早在DeepSeek V2發(fā)布開(kāi)源之時(shí),深度求索這條“鲇魚(yú)”引發(fā)了2024年國(guó)產(chǎn)大模型的第一波降價(jià)熱潮,參與其中的包括智譜AI等大模型初創(chuàng)公司以及字節(jié)跳動(dòng)、阿里巴巴、百度、騰訊等科技大廠。其中,智譜AI公司CEO張鵬此前接受本報(bào)記者采訪時(shí)回應(yīng)稱(chēng),降價(jià)并非出于市場(chǎng)壓力,而是因?yàn)榧夹g(shù)的進(jìn)步帶來(lái)了成本的降低,由此讓利給用戶(hù),同時(shí)也是為了更好地拓展市場(chǎng)。深度求索創(chuàng)始人梁文峰在接受媒體記者采訪時(shí)也表示:“我們不是有意成為一條‘鲇魚(yú)’,只是不小心成了一條‘鲇魚(yú)’。我們只是按照自己的步調(diào)來(lái)做事,然后核算成本定價(jià)。原則是不貼錢(qián),也不賺取暴利,在成本之上稍微有點(diǎn)利潤(rùn)?!?/p>

到了2024年年底,即在DeepSeek V3發(fā)布前后,國(guó)產(chǎn)大模型在2024年的第二波降價(jià)潮再起。2024年12月中旬,字節(jié)跳動(dòng)旗下豆包大模型率先更新價(jià)格,豆包視覺(jué)理解模型的輸入價(jià)格為0.003元/千tokens,相比行業(yè)平均價(jià)格降低了85%。按照這一價(jià)格,1元錢(qián)可以處理284張720ppi的圖片。抖音集團(tuán)副總裁李亮稱(chēng),此次降價(jià)不是“價(jià)格戰(zhàn)”,而是豆包大模型在算法、軟件工程和硬件方案上進(jìn)行了大量?jī)?yōu)化,有效降低了成本,目前的定價(jià)仍能保持可觀的毛利。而DeepSeek官方信息顯示,最新的DeepSeek V3輸入價(jià)格為0.5元/百萬(wàn)tokens,輸出價(jià)格最低為8元/百萬(wàn)tokens,遠(yuǎn)低于Claude3.5-Sonnet、GPT-4o等。

在海外社交媒體中,DeepSeek的高性?xún)r(jià)比已引起了大模型競(jìng)爭(zhēng)對(duì)手的高度關(guān)注,而在國(guó)內(nèi)市場(chǎng),記者從多位消息人士處了解到,國(guó)產(chǎn)大模型廠商也在密切關(guān)注DeepSeek的訓(xùn)練方案,盡管還沒(méi)有公開(kāi)的動(dòng)作,但一個(gè)行業(yè)性的共識(shí)在于,算力堆砌或許仍能“大力出奇跡”,但同時(shí)在數(shù)據(jù)質(zhì)量、訓(xùn)練模式、架構(gòu)優(yōu)化方面仍有可挖掘的創(chuàng)新空間,大模型正在加速朝著普惠落地的方向前進(jìn)。

謙詢(xún)智庫(kù)創(chuàng)始合伙人龔斌指出,其他大模型廠商或許會(huì)通過(guò)技術(shù)追趕和資源投入快速跟進(jìn),不排除復(fù)制甚至超越DeepSeek高性?xún)r(jià)比優(yōu)勢(shì)的可能性,DeepSeek能否持續(xù)建立起優(yōu)勢(shì)壁壘還有待觀瞻。另有業(yè)內(nèi)人士提到,DeepSeek開(kāi)發(fā)過(guò)程中利用已有的模型進(jìn)行訓(xùn)練,也存在一些漏洞。

除此之外,學(xué)術(shù)委員、DCCI-未來(lái)智庫(kù)與FutureLabs-未來(lái)實(shí)驗(yàn)室首席專(zhuān)家胡延平發(fā)文提醒道,盡管DeepSeek V3在效率和性能上表現(xiàn)出色,但“不宜過(guò)高評(píng)價(jià)”其創(chuàng)新性。在他看來(lái),該模型的成功主要依賴(lài)于已有技術(shù)的有效整合,如合成數(shù)據(jù)、知識(shí)蒸餾等,而缺乏底層原理的創(chuàng)新,呈現(xiàn)的是“又一次是我們一直最擅長(zhǎng)的性?xún)r(jià)比”。“DeepSeek V3能不能持續(xù)有流量不太好說(shuō)?!?/font>

關(guān)于AI大模型未來(lái)價(jià)格的進(jìn)一步下降、商業(yè)化應(yīng)用,以及深度求索公司后續(xù)的發(fā)展,本報(bào)記者將持續(xù)關(guān)注報(bào)道。

(編輯:吳清 審核:李正豪 校對(duì):顏京寧)

轉(zhuǎn)載請(qǐng)注明來(lái)自浙江中液機(jī)械設(shè)備有限公司 ,本文標(biāo)題:《DeepSeek“鲇魚(yú)效應(yīng)” 2025年大模型價(jià)格戰(zhàn)或?qū)⒊掷m(xù)》

百度分享代碼,如果開(kāi)啟HTTPS請(qǐng)參考李洋個(gè)人博客
每一天,每一秒,你所做的決定都會(huì)改變你的人生!

發(fā)表評(píng)論

快捷回復(fù):

驗(yàn)證碼

評(píng)論列表 (暫無(wú)評(píng)論,12人圍觀)參與討論

還沒(méi)有評(píng)論,來(lái)說(shuō)兩句吧...

Top
91亚洲国产AⅤ精品一区二区,国产伦精品一区二区三区,四川少妇搡bbbb搡bbbb,国产全黄A一级毛片96