近日,由北京智源人工智能研究院主辦,中國互聯(lián)網(wǎng)協(xié)會指導(dǎo),中國互聯(lián)網(wǎng)協(xié)會人工智能工作委員會、研究院共同承辦的2024北京智源大會“人工智能+數(shù)據(jù)新基建”論壇在京舉行,為上述問題的解答提供了前瞻性思考與實(shí)操性建議。
人工智能技術(shù)的歷次突破都離不開高質(zhì)量數(shù)據(jù)集的支撐,數(shù)據(jù)的“質(zhì)”和“量”是推動(dòng)大模型不斷進(jìn)步的關(guān)鍵。
中國互聯(lián)網(wǎng)協(xié)會理事長尚冰在致辭中表示,高質(zhì)量數(shù)據(jù)已經(jīng)成為AI大模型研發(fā)的戰(zhàn)略性資源,數(shù)據(jù)工程建設(shè)成為實(shí)現(xiàn)從“X+AI”轉(zhuǎn)向“AI+X”根本性變革的關(guān)鍵力量。
“智能來源于數(shù)據(jù),廣義地講是來源于環(huán)境,智能是對環(huán)境和數(shù)據(jù)的一種投射和凝練,是一種高度濃縮的表達(dá)。”北京智源人工智能研究院理事長、中國互聯(lián)網(wǎng)協(xié)會人工智能工作委員會主任委員黃鐵軍說,在人工智能的第三次浪潮中,最重要的就是從數(shù)據(jù)中學(xué)習(xí),從數(shù)據(jù)中提煉智能。
必一運(yùn)動(dòng)sport網(wǎng)頁版登錄
行業(yè)智能化的不少堵點(diǎn)在于數(shù)據(jù)。“很多現(xiàn)有的行業(yè)數(shù)據(jù)是為日常生產(chǎn)系統(tǒng)服務(wù)的,而不是為人工智能服務(wù)的。”集團(tuán)首席科學(xué)家、中國互聯(lián)網(wǎng)協(xié)會人工智能工作委員會副主任委員馮俊蘭認(rèn)為,行業(yè)智能化首先要解決數(shù)據(jù)的感知問題,需要建立一種以低成本來感知和表征復(fù)雜系統(tǒng)的行業(yè)數(shù)據(jù)體系。
北京大學(xué)人工智能研究院副院長、數(shù)據(jù)空間技術(shù)與系統(tǒng)全國重點(diǎn)實(shí)驗(yàn)室主任黃罡說,當(dāng)前數(shù)據(jù)基礎(chǔ)設(shè)施的建設(shè)普遍滯后于數(shù)聯(lián)網(wǎng)的規(guī)模和效率增長需求,以和大模型為代表的第四范式面臨著“高質(zhì)量數(shù)據(jù)危機(jī)”。數(shù)據(jù)基礎(chǔ)設(shè)施成為網(wǎng)絡(luò)空間的新型基礎(chǔ)設(shè)施,需要打造“專網(wǎng)+公網(wǎng)+跨境”的一體化數(shù)據(jù)基礎(chǔ)設(shè)施,實(shí)現(xiàn)基于數(shù)聯(lián)網(wǎng)的大模型智能體數(shù)據(jù)供應(yīng)鏈。
北京智源人工智能研究院副院長兼總工程師林詠華介紹,針對人工智能訓(xùn)練數(shù)據(jù)面臨的數(shù)據(jù)量、數(shù)據(jù)質(zhì)量、數(shù)據(jù)使用中的版權(quán)和安全等難題,論壇現(xiàn)場發(fā)布的“北京人工智能數(shù)據(jù)運(yùn)營平臺”聚集了通用數(shù)據(jù)集、行業(yè)垂類數(shù)據(jù)集兩大板塊的數(shù)據(jù),支持文本、圖像、視頻等多模態(tài)數(shù)據(jù),同時(shí)打造了全流程的數(shù)據(jù)治理工具,通過開源開放、合作共享、數(shù)算一體等三種數(shù)據(jù)使用方式服務(wù)于高質(zhì)量數(shù)據(jù)的供給。
當(dāng)前,世界日益演變成為人、機(jī)、物多元融合的復(fù)雜系統(tǒng),各類系統(tǒng)和數(shù)據(jù)前所未有之龐雜,難以僅靠人力去完成整個(gè)的價(jià)值變現(xiàn)鏈條。
“數(shù)字經(jīng)濟(jì)時(shí)代,數(shù)據(jù)成為生產(chǎn)要素,隨著數(shù)據(jù)內(nèi)涵發(fā)生變化,數(shù)據(jù)呈現(xiàn)出新特點(diǎn)。”復(fù)旦大學(xué)教授、上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室主任肖仰華說,一是數(shù)據(jù)的持續(xù)流動(dòng)特征對全鏈條、自動(dòng)化、智能化且高度協(xié)同的數(shù)據(jù)處理技術(shù)提出了要求,二是數(shù)據(jù)的開放生態(tài)特征對統(tǒng)一的、標(biāo)準(zhǔn)化的、互操作的數(shù)據(jù)管理提出了要求,三是數(shù)據(jù)的動(dòng)態(tài)增值特征對面向價(jià)值變現(xiàn)的數(shù)據(jù)科學(xué)理論和方法發(fā)起了挑戰(zhàn)。
肖仰華認(rèn)為,數(shù)據(jù)技術(shù)的供給不足也是制約數(shù)據(jù)價(jià)值變現(xiàn)的重要原因之一。“作為當(dāng)下人工智能的最新進(jìn)展,大模型習(xí)得了對復(fù)雜世界的建模能力,具備了對開放數(shù)據(jù)的認(rèn)知與操縱能力,將會成為激活數(shù)據(jù)要素價(jià)值的一個(gè)智能新引擎。”
今年5月,國家數(shù)據(jù)局在第七屆數(shù)字中國峰會主論壇上發(fā)布了承擔(dān)數(shù)據(jù)標(biāo)注基地建設(shè)任務(wù)的城市名單,并表示將從技術(shù)創(chuàng)新、行業(yè)賦能、生態(tài)培育、標(biāo)準(zhǔn)應(yīng)用、人才就業(yè)、數(shù)據(jù)安全等六個(gè)方面推進(jìn)數(shù)據(jù)標(biāo)注基地建設(shè)。
在黃鐵軍看來,隨著模型水平的提高,對數(shù)據(jù)處理者的要求也逐漸提高,Agent(智能體)主導(dǎo)的智能數(shù)據(jù)生產(chǎn)線將成為數(shù)據(jù)加工處理的主要形態(tài),通過部署先進(jìn)數(shù)據(jù)產(chǎn)線可以提高數(shù)據(jù)的加工效率。
今年,“人工智能+”首次寫入政府工作報(bào)告。業(yè)界如何擁抱“人工智能+”時(shí)代機(jī)遇,培育新質(zhì)生產(chǎn)力?
馮俊蘭認(rèn)為,規(guī)模化的應(yīng)用需要體系化的人工智能,可以通過體系化人工智能核心技術(shù)引擎,實(shí)現(xiàn)對算力、算網(wǎng)、模型和數(shù)據(jù)的靈活調(diào)度。“需要一些企業(yè)去承載AI體系的復(fù)雜度,將簡單易用的功能呈現(xiàn)出來,這樣才能使AI得到普適、大范圍的使用,就像對5G的使用一樣。”
在場景應(yīng)用方面,中國航信資本運(yùn)營與創(chuàng)新業(yè)務(wù)部副總經(jīng)理趙玉霞認(rèn)為,企業(yè)在推動(dòng)人工智能落地的過程中要找準(zhǔn)場景,以提高生產(chǎn)效率、提升客戶滿意度、降低成本為標(biāo)準(zhǔn),將大模型、高質(zhì)量行業(yè)數(shù)據(jù)集、智能化行業(yè)應(yīng)用三者相結(jié)合來提高生產(chǎn)力。
林詠華表示,要實(shí)現(xiàn)人工智能大范圍的行業(yè)落地,必須要考慮“最后一公里”的質(zhì)量問題,通過技術(shù)進(jìn)步提升智能化能力的準(zhǔn)確率,進(jìn)而推動(dòng)實(shí)體經(jīng)濟(jì)中一些核心系統(tǒng)的智能化升級。
在南方電網(wǎng)數(shù)字化部管理處高級經(jīng)理陳彬看來,一方面要從場景出發(fā)推動(dòng)企業(yè)自身經(jīng)營管理提質(zhì)增效,實(shí)現(xiàn)高質(zhì)量發(fā)展;另一方面也要發(fā)揮央企作為“國之大者”對產(chǎn)業(yè)鏈上下游的帶動(dòng)作用,推動(dòng)產(chǎn)業(yè)升級,同時(shí)注重人工智能的整體生態(tài)構(gòu)建和普惠性。
“企業(yè)需要注重價(jià)值導(dǎo)向,修建以價(jià)值增長為導(dǎo)向的‘?dāng)?shù)據(jù)運(yùn)河’,使數(shù)據(jù)在傳輸過程中的價(jià)值不斷得到提升和反饋,進(jìn)而保證數(shù)據(jù)的真正流通。”馮俊蘭說。
論壇中,多位專家提到要在數(shù)據(jù)與智能之間形成一種正反饋、正循環(huán)的機(jī)制,即通過數(shù)據(jù)積累與利用實(shí)現(xiàn)智能增強(qiáng)和持續(xù)學(xué)習(xí),加快數(shù)據(jù)流通,邁向智能化時(shí)代,這也就是雙向良性驅(qū)動(dòng)的“數(shù)據(jù)飛輪”效應(yīng)。