DeepSeek-V3訓(xùn)練過程算力消耗僅ChatGPT-4的16%,實(shí)際成本僅557.6萬美元,展現(xiàn)出強(qiáng)大的技術(shù)優(yōu)勢。
2.然而,在智能駕駛行業(yè),數(shù)據(jù)成為決定競爭力的關(guān)鍵,頭部企業(yè)通過大量真實(shí)路況數(shù)據(jù)形成壁壘。
必一運(yùn)動官網(wǎng)
3.由于DeepSeek的崛起,智駕行業(yè)競爭加劇,二線企業(yè)面臨出局風(fēng)險(xiǎn)。
4.事實(shí)上,資本和人才已經(jīng)開始向頭部五強(qiáng)企業(yè)流動,數(shù)據(jù)寡頭時(shí)代即將來臨。
5.對于落伍者,只剩下資本市場雪崩般的估值重構(gòu)和全新警示,技術(shù)可以彎道超車,但產(chǎn)業(yè)生態(tài)的進(jìn)化從不等待遲到者。
“我甚至說所有行業(yè)、所有應(yīng)用、所有軟件、所有服務(wù)都值得基于新型人工智能技術(shù)、基于AIGC各方面技術(shù)支撐、大模型支撐重做一遍……”
2023年4月中旬,張勇在阿里云峰會上如此暢言。這番講話的背景,正是當(dāng)時(shí)風(fēng)頭正勁的ChatGPT大語言模型。
張勇口中的“所有行業(yè)、所有應(yīng)用、所有軟件”,自然也包含了當(dāng)時(shí)正陷入理論和落地泥潭的智能駕駛概念。并非沒有企業(yè)對此躍躍欲試,然而算力的制約卻也是顯而易見的。
以目前的視角看,OpenAI采用“從人類反饋中強(qiáng)化學(xué)習(xí)”訓(xùn)練方式,實(shí)際上頗有幾分日常大家戲謔那種“力大磚飛”的味道。
通過堆砌大量算力不惜能耗去訓(xùn)練大模型,最終受益了能源企業(yè),以及英偉達(dá)這種算力芯片供應(yīng)商。直到DeepSeek-V3的橫空出世。
與ChatGPT-4相比,DeepSeek-V3的訓(xùn)練過程,算力消耗僅前者的16%,實(shí)際成本僅557.6萬美元,折合前者(7800萬美元)的區(qū)區(qū)7%。但兩個(gè)大模型在實(shí)際部署運(yùn)用上,能力卻是近似的。
站在2025年初這個(gè)時(shí)間節(jié)點(diǎn),值此國內(nèi)乃至全球智駕行業(yè)進(jìn)入收束狀態(tài)迎接收官階段的關(guān)鍵時(shí)刻,這是否意味著新的變數(shù)?
延續(xù)自本世紀(jì)第二個(gè)十年中期的自動駕駛技術(shù),已經(jīng)明確了依賴深度神經(jīng)網(wǎng)絡(luò)(DNNs)來處理特定任務(wù),如感知、預(yù)測和規(guī)劃等。這些系統(tǒng)一般采用模塊化設(shè)計(jì)——每個(gè)模塊負(fù)責(zé)解決一個(gè)特定的問題,例如物體檢測、路徑規(guī)劃或速度控制。
這種架構(gòu)的優(yōu)點(diǎn)在于它允許工程師針對每一個(gè)子任務(wù)進(jìn)行優(yōu)化,并且便于調(diào)試和驗(yàn)證。同樣的邏輯也體現(xiàn)在智駕系統(tǒng)的傳感器系統(tǒng)設(shè)計(jì)上,而前述優(yōu)點(diǎn)也是少部分企業(yè)堅(jiān)決反對激光雷達(dá),一直堅(jiān)持所謂“純視覺路線”的根本原因。
然而,隨著大模型——即使用Transformer架構(gòu)構(gòu)建的模型的流行,尤其是那些具有大量參數(shù)的大規(guī)模預(yù)訓(xùn)練模型,自動駕駛技術(shù)迎來了新的可能性。
大模型的基本特性之一,是能夠捕捉數(shù)據(jù)中的復(fù)雜模式,并通過大規(guī)模的數(shù)據(jù)集進(jìn)行訓(xùn)練,從而在多種任務(wù)上展現(xiàn)出強(qiáng)大的泛化能力,可以被用來增強(qiáng)系統(tǒng)的感知能力和決策制定過程。
在感知能力方面,能夠充分融合與處理更復(fù)雜的圖像、雷達(dá)和激光雷達(dá)數(shù)據(jù),識別行人、車輛、道路標(biāo)志等。傳統(tǒng)多傳感器融合所面臨的難題,在大模型面前得到了很好地解決,而且可以提升系統(tǒng)在極端天氣或復(fù)雜路況下的魯棒性。
此外,大模型在持續(xù)學(xué)習(xí)能力方面的優(yōu)勢,這意味著其可以根據(jù)新收集的數(shù)據(jù)不斷改進(jìn)自身的性能,適應(yīng)不同的駕駛條件和環(huán)境變化。
更因?yàn)榇竽P兔魑牧_列邏輯推導(dǎo)過程的特性,使得開發(fā)人員在分析系統(tǒng)決策時(shí),徹底告別了以往的黑箱狀態(tài)。
通過透明化決策邏輯幫助調(diào)試和優(yōu)化,并引入冗余系統(tǒng)和風(fēng)險(xiǎn)預(yù)測機(jī)制,確保在突發(fā)情況下的安全性。
▲2023年初ChatGPT的橫空出世,可以被視為AI技術(shù)的一次重要突破。盡管其是一種“大語言模型”,但也啟發(fā)了相鄰的各賽道
然而在2023年,ChatGPT的出世,并沒有立即對智駕行業(yè)帶來特別的觸動。究其原因,若是以ChatGPT為模板來倒推的話,以Transformer架構(gòu)把現(xiàn)有的智駕系統(tǒng)“重做一遍”,重新訓(xùn)練的代價(jià)將會非常巨大。
英偉達(dá)配備80GB緩存的A100 GPU算力卡單卡的理論算力是 312TFLOPS,但考慮到tensor/pipeline parallel并行技術(shù)算力利用率僅略超過一半,則完成一個(gè)月訓(xùn)練量需要接近千張80G內(nèi)存規(guī)格A100算力卡。
而在2023年的時(shí)候,1000張80G A100的采購價(jià)格大約1.5億人民幣。
DeepSeek之所以被視為重大突破,乃是通過混合專家架構(gòu)(MoE)與多頭潛在注意力(MLA)機(jī)制,不但提高預(yù)訓(xùn)練中的算力利用率,還有效地降低了推理成本。
簡單粗暴描述大致可認(rèn)為,是以O(shè)penAI訓(xùn)練ChatGPT所需代價(jià)的五分之一,實(shí)現(xiàn)了大致一樣效果。
必一運(yùn)動官網(wǎng)
然而這一切發(fā)生在2024年末,資本密集投資智駕企業(yè)的機(jī)會窗口已經(jīng)關(guān)閉,甚至整個(gè)市場也被初步瓜分。
幾天前,曾經(jīng)被譽(yù)為國內(nèi)智能駕駛第一股的圖森未來,在去年初宣布轉(zhuǎn)換娛樂以及影視制作賽道之后,終究是沒有能夠扛住壓力,企業(yè)因?yàn)椤皟?nèi)訌”而解散。
往前推,在這個(gè)春節(jié)長假剛結(jié)束那會兒,2024年末已宣布進(jìn)入“低功耗模式”的縱目科技,也傳出人去樓空的消息。
而僅僅兩年半之前,這家企業(yè)曾一度因?yàn)槟孟聠柦鏜5/7智能泊車解決方案訂單,一時(shí)成為行業(yè)矚目的焦點(diǎn)。
往前追溯,去年的11月27日,成功登陸美國的小馬智行在首個(gè)交易日即跌破發(fā)行價(jià)。盡管這家企業(yè)在國內(nèi)曾經(jīng)有過“行業(yè)獨(dú)角獸”的光環(huán),但在美譽(yù)之下卻是企業(yè)自2016年成立以來,已經(jīng)連續(xù)虧損八年的事實(shí)。實(shí)際此番上市,多少也有點(diǎn)最后一搏的味道。
也是在去年的年末,曾經(jīng)得到過長城汽車大力扶持的毫末智行,也傳出了裁員的消息。而若是追溯到2024年的年初,便是圖森未來從美股退市的大新聞——其市值最高時(shí),曾經(jīng)達(dá)到160億美元規(guī)模。
在2023年末,國內(nèi)智駕行業(yè)有了所謂“地大華魔”的說法。并且在去年年末的時(shí)候,又進(jìn)一步完善為頭部供應(yīng)商的“華元魔大地”,外加自研整車廠的“蔚小理極米”之說。
在這個(gè)大趨勢下,DeepSeek的崛起如同給這股變革的浪潮注入了強(qiáng)大的動力。在訓(xùn)練效率方面,經(jīng)過其優(yōu)化能進(jìn)一步縮短推理響應(yīng)時(shí)間。
這意味著在實(shí)際的智駕場景中,車輛對于各種復(fù)雜路況的判斷和決策速度會大大提高。
例如,當(dāng)車輛在高速行駛中突然遇到前方有障礙物或者車輛變道時(shí),能夠更迅速地作出反應(yīng),避免事故的發(fā)生。
另外,在數(shù)據(jù)標(biāo)注這個(gè)環(huán)節(jié),DeepSeek通過其獨(dú)特的跨模態(tài)遷移能力,有效地降低了訓(xùn)練過程中對人工數(shù)據(jù)標(biāo)注的依賴。
后者看似是對中小廠商的機(jī)遇,然而頭部企業(yè)憑借自身已經(jīng)積累的大規(guī)模數(shù)據(jù),仍然在這個(gè)領(lǐng)域形成了一定的壁壘。
例如,頭部企業(yè)可能已經(jīng)擁有了海量的真實(shí)路況數(shù)據(jù),這些數(shù)據(jù)經(jīng)過長時(shí)間的積累和整理,包含了各種各樣的駕駛場景,這是中小廠商短期內(nèi)難以企及的。
通過模型蒸餾這種技術(shù)手段,一些廠商有可能實(shí)現(xiàn)“彎道追趕”。但是這僅限于那些具有大量自主數(shù)據(jù)的廠商來說,畢竟對于這行來說,算法的性能不僅僅取決于模型本身,還與數(shù)據(jù)的質(zhì)量和數(shù)量密切相關(guān)。
沒有足夠的自有數(shù)據(jù),就很難對模型進(jìn)行有效地優(yōu)化和調(diào)整,從而導(dǎo)致在算法性能上與其他廠商存在差距。
這種差距在行業(yè)競爭日益激烈的今天,可能會進(jìn)一步被拉大,使得這些廠商在市場競爭中處于更加不利的地位。
既然提到了數(shù)據(jù)對于當(dāng)前智駕技術(shù)發(fā)展的重要性,相信大家也能理解車企直接入場的理由了。
特別是隨著DeepSeek的橫空出世,又進(jìn)一步降低了門檻。而這種已經(jīng)呈現(xiàn)大趨勢的發(fā)展?fàn)顩r,進(jìn)一步?jīng)_擊了第三方供應(yīng)商模式,使得所有未能擠入頭部行列的二線企業(yè)面臨出局的風(fēng)險(xiǎn)。
實(shí)際上,整個(gè)趨勢在2024年就已經(jīng)啟動,其集中體現(xiàn)在資本和人才的流動上。
據(jù)統(tǒng)計(jì),去年在所有投向智駕供應(yīng)商的融資中,有超過八成流向了上述提到的頭部五強(qiáng)企業(yè)。
世人將DeepSeek,視為一場算力的平權(quán)運(yùn)動。然而這場始于2023年,爆發(fā)于2024年末,并于不久前廣為人知的技術(shù)革新,映射到智能駕駛行業(yè),卻幾乎成為了產(chǎn)業(yè)的“陷阱”。
當(dāng)新架構(gòu)將訓(xùn)練成本壓縮到不足頭部企業(yè)年度電費(fèi)支出的零頭時(shí),真正的戰(zhàn)場早已從算法研發(fā)轉(zhuǎn)向數(shù)據(jù)沉淀。
華為ADS積累的3000萬公里城區(qū)道路數(shù)據(jù)、小鵬汽車構(gòu)建的3000小時(shí)極端天氣場景庫、比亞迪天神之眼系統(tǒng)背后200萬輛車的實(shí)時(shí)反饋,這些用真金白銀和時(shí)間壁壘堆砌的護(hù)城河,正在將后發(fā)者死死擋在門外。
即便有企業(yè)能通過開源框架快速搭建原型系統(tǒng),缺乏實(shí)際道路數(shù)據(jù)的模型也終究是實(shí)驗(yàn)室里的“電子游戲”。
產(chǎn)研閉環(huán)的碾壓優(yōu)勢,使得博世、大陸等傳統(tǒng)Tier1供應(yīng)商不得不將業(yè)務(wù)收縮至執(zhí)行端,而曾經(jīng)風(fēng)光無限的算法公司則陷入是否要賣身甚至是賣身無門的窘境。
站在2025年的門檻回望,智駕行業(yè)的終局輪廓已然清晰:這注定是一場屬于數(shù)據(jù)寡頭的游戲。
當(dāng)特斯拉宣布FSD北美訂閱成本降至每車99美元,當(dāng)華為ADS3.0開始向第三方車企開放訂閱,當(dāng)蔚小理的用戶每天持續(xù)貢獻(xiàn)的智駕里程突破八位數(shù),那些曾以“顛覆者”自居的初創(chuàng)企業(yè)終于明白,真正的革命從來不會發(fā)生在聚光燈下,早已在數(shù)據(jù)洪流的奔涌中完成了對舊秩序的審判。
留給落伍者的,只剩下資本市場雪崩般的估值重構(gòu),以及可以被書寫進(jìn)商業(yè)教科書的全新警示——