1月13日,國家發(fā)展改革委、國家數(shù)據(jù)局、財政部、人力資源社會保障部聯(lián)合印發(fā)《關(guān)于促進數(shù)據(jù)標(biāo)注產(chǎn)業(yè)高質(zhì)量發(fā)展的實施意見》(以下簡稱《實施意見》)。
其中提出,到2027年,我國數(shù)據(jù)標(biāo)注產(chǎn)業(yè)專業(yè)化、智能化及科技創(chuàng)新能力顯著提升,產(chǎn)業(yè)規(guī)模大幅躍升,年均復(fù)合增長率超過20%。培育一批具有影響力的科技型數(shù)據(jù)標(biāo)注企業(yè),打造一批產(chǎn)學(xué)研用聯(lián)動的創(chuàng)新載體,建設(shè)一批成效明顯、特色鮮明的數(shù)據(jù)標(biāo)注基地,形成相對完善的數(shù)據(jù)標(biāo)注產(chǎn)業(yè)生態(tài)。
數(shù)據(jù)標(biāo)注,也被稱為數(shù)據(jù)標(biāo)定、數(shù)據(jù)注釋,是指對文本、圖像、語音、視頻等待標(biāo)注數(shù)據(jù)進行歸類、整理、編輯、糾錯、標(biāo)記和批注等操作,為機器學(xué)習(xí)和人工智能算法提供訓(xùn)練樣本。
大模型時代,AI開發(fā)以數(shù)據(jù)為核心,數(shù)據(jù)的多寡與質(zhì)量直接關(guān)系到大模型的智能水平。數(shù)據(jù)標(biāo)注作為人工智能產(chǎn)業(yè)和數(shù)據(jù)產(chǎn)業(yè)發(fā)展的基礎(chǔ)核心環(huán)節(jié),對構(gòu)筑我國人工智能發(fā)展的數(shù)據(jù)先發(fā)優(yōu)勢具有重要意義。
國家數(shù)據(jù)局在2024年全國首次數(shù)據(jù)工作會議上,就已經(jīng)提出探索建設(shè)國家級數(shù)據(jù)標(biāo)注基地,在數(shù)據(jù)標(biāo)注產(chǎn)業(yè)的生態(tài)構(gòu)建、能力提升和場景應(yīng)用等方面先行先試,集聚龍頭企業(yè),打造區(qū)域人工智能產(chǎn)業(yè)生態(tài)。5月,經(jīng)過國家數(shù)據(jù)局綜合評估,四川省成都市、遼寧省沈陽市、安徽省合肥市、湖南省長沙市、海南省海口市、河北省保定市、山西省大同市共7座城市成為首批全國數(shù)據(jù)標(biāo)注試點基地。
分析人士認(rèn)為,作為國家級別的項目,政策上的大力支持和資源上的優(yōu)先配置,將為數(shù)據(jù)標(biāo)注行業(yè)的發(fā)展提供有力保障。同時,這也將引發(fā)社會對數(shù)據(jù)標(biāo)注行業(yè)的更多關(guān)注和認(rèn)可,提高行業(yè)的整體形象和地位,同時也會釋放出大量的相關(guān)訂單。
2024年10月,由國家數(shù)據(jù)局?jǐn)?shù)字科技和基礎(chǔ)設(shè)施建設(shè)司指導(dǎo),國家數(shù)據(jù)局人工智能專班主辦的首屆“數(shù)據(jù)標(biāo)注產(chǎn)業(yè)大會暨供需對接會”在北京召開。此次大會旨在推動數(shù)據(jù)標(biāo)注產(chǎn)業(yè)高質(zhì)量發(fā)展,促進數(shù)據(jù)標(biāo)注基地快速形成面向產(chǎn)業(yè)的規(guī)模化服務(wù)能力。
現(xiàn)場,成都、沈陽、合肥、長沙、海口、保定、大同7個城市數(shù)據(jù)標(biāo)注基地進行了招引推介,促成了數(shù)據(jù)標(biāo)注基地和33家企業(yè)的合作簽約。其中,位居成都新津區(qū)的成都數(shù)據(jù)標(biāo)注基地牧山園區(qū),拿下7項合作,占據(jù)成都簽約項目八成以上,成為本次數(shù)據(jù)標(biāo)注產(chǎn)業(yè)大會達(dá)成合作最多的標(biāo)注基地。
據(jù)了解,成都為推動數(shù)據(jù)標(biāo)注試點城市建設(shè),作出了“一個牽引區(qū)+三個聚集區(qū)”的生產(chǎn)力布局。成都數(shù)據(jù)標(biāo)注基地牧山園區(qū),位于成都新津區(qū)東北部的天府牧山數(shù)字新城,距離雙流國際機場10余公里,緊鄰成都地鐵10號線萬平米產(chǎn)業(yè)載體,可用于數(shù)據(jù)標(biāo)注及上下游企業(yè)入駐,是成都最具發(fā)展?jié)摿惋@示度的數(shù)據(jù)標(biāo)注產(chǎn)業(yè)聚集區(qū)之一。
《實施意見》提出,培育一批數(shù)據(jù)標(biāo)注龍頭企業(yè),鼓勵通過資源整合、并購重組等方式做大做強,推動數(shù)據(jù)標(biāo)注企業(yè)規(guī)模化、標(biāo)準(zhǔn)化、集約化發(fā)展。支持和鼓勵科技創(chuàng)新型數(shù)據(jù)標(biāo)注企業(yè)承擔(dān)基礎(chǔ)研究、技術(shù)攻關(guān)、產(chǎn)業(yè)應(yīng)用等重點任務(wù),提高產(chǎn)業(yè)鏈協(xié)同創(chuàng)新水平。培育一批深耕行業(yè)的數(shù)據(jù)標(biāo)注瞪羚企業(yè)、獨角獸企業(yè)。推動數(shù)據(jù)標(biāo)注中小企業(yè)與人力資源、金融服務(wù)、合規(guī)咨詢等第三方機構(gòu)精準(zhǔn)對接,助力企業(yè)快速發(fā)展。
在AI應(yīng)用需求飛速提升的背景下,各路巨頭也開始加速對數(shù)據(jù)標(biāo)注產(chǎn)品的研發(fā)和推出。
Bsports必一體育
2024年9月,螞蟻數(shù)科發(fā)布新一代數(shù)據(jù)標(biāo)注產(chǎn)品,向企業(yè)客戶提供AI驅(qū)動的全流程數(shù)據(jù)服務(wù)。螞蟻數(shù)科具備領(lǐng)先的AI算法,在標(biāo)注產(chǎn)品中配置了模塊化服務(wù)和算法調(diào)度能力,能夠在高效匹配“人和任務(wù)”的前提下降低標(biāo)注的復(fù)雜度,幫助用戶解決通用大模型、多模態(tài)大模型和行業(yè)垂類大模型的數(shù)據(jù)標(biāo)注需求。據(jù)悉,該產(chǎn)品可以覆蓋多行業(yè)場景文本、圖像、音頻、視頻標(biāo)注需求。
10月,由青海國投所屬青數(shù)集團參與建設(shè)的百度智能云(海東市)人工智能基礎(chǔ)數(shù)據(jù)產(chǎn)業(yè)基地在海東市互助縣正式啟動。據(jù)悉,該基地是青數(shù)集團攜手百度智能云及互助縣政府共同打造的數(shù)據(jù)要素產(chǎn)業(yè)重要成果,旨在全力推動海東市數(shù)據(jù)標(biāo)注產(chǎn)業(yè)集群快速發(fā)展,為全省人工智能產(chǎn)業(yè)生態(tài)建設(shè)樹立“海東樣板”,提高市場競爭力。
A股上市公司也在加速對數(shù)據(jù)標(biāo)注領(lǐng)域的布局。12月3日,中達(dá)安在互動平臺表示,公司子公司山東中達(dá)安智算數(shù)據(jù)科技有限公司的業(yè)務(wù)有涉及數(shù)據(jù)標(biāo)注的業(yè)務(wù),其位于國家超算濟南中心園區(qū)內(nèi)的基地于日前揭牌。
海天瑞聲則在早期的一份機構(gòu)調(diào)研中稱,第四代智能駕駛標(biāo)注平臺,將可支持智能駕駛?cè)珣?yīng)用場景、各類型傳感器及多傳感器融合的數(shù)據(jù)處理;此外,公司基于對智能駕駛感知算法趨勢研判,進行了標(biāo)注工具升級,平臺將可支持行業(yè)各類前沿標(biāo)注需求,包括連續(xù)幀融合標(biāo)注中3D點云polyline、freespace的標(biāo)注、BEV(鳥瞰圖)標(biāo)注、4D點云疊加標(biāo)注等熱點功能,具有競爭力的平臺將成為公司業(yè)務(wù)拓充的核心動力。
據(jù)其介紹,第四代智能駕駛標(biāo)注平臺將繼續(xù)發(fā)力算法建設(shè),通過提升2D視覺及3D點云連續(xù)幀標(biāo)注中的插值、預(yù)測、自動貼合、地面檢測等算法效果,提高數(shù)據(jù)標(biāo)注效率,降低標(biāo)注成本。