近日,《“數(shù)據要素×”三年行動計劃(2024—2026年)》(以下簡稱《行動計劃》)正式發(fā)布?!缎袆佑媱潯酚蓢覕?shù)據局會同中央網信辦、科技部、工業(yè)和信息化部等共17個部門聯(lián)合印發(fā),這是國家數(shù)據局揭牌兩個多月以來會同相關部門聯(lián)合印發(fā)的首個文件。該文件從2023年12月15日向社會征求意見到當月29日相關媒體吹風會舉行,再到2024年1月4日印發(fā)實施,歷時僅20天,可謂迅速、高效。
《行動計劃》提出一個引人矚目的表述——“數(shù)據要素×”,大力部署實施“數(shù)據要素×”行動并列出重點推進的12個領域,要求充分利用中國海量數(shù)據資源、豐富應用場景等優(yōu)勢,以數(shù)據流引領技術流、人才流、物資流等,實現(xiàn)知識擴散、價值倍增,催生新產業(yè)、新模式,為推動高質量發(fā)展、推進中國式現(xiàn)代化提供有力支撐?!缎袆佑媱潯访鞔_提出到2026年底數(shù)據要素應用總體目標,其中包括打造300個以上示范性強、顯示度高、帶動性廣的典型應用場景,數(shù)據產業(yè)年均增速超過20%。
實現(xiàn)科創(chuàng)效能倍增
科學技術是第一生產力,是先進生產力的集中體現(xiàn)和主要標志;創(chuàng)新是引領發(fā)展的第一動力,是推動生產力發(fā)展的關鍵因素。在《行動計劃》中,“科技創(chuàng)新”被列為“數(shù)據要素×”應用的12個重點領域之一。由此可見,數(shù)據要素被賦予實現(xiàn)科技創(chuàng)新效能倍增,推動社會生產力更快發(fā)展的重大使命。
《行動計劃》鮮明地提出以“數(shù)據驅動”科技創(chuàng)新,要求“充分依托各類數(shù)據庫與知識庫,推進跨學科、跨領域協(xié)同創(chuàng)新,以數(shù)據驅動發(fā)現(xiàn)新規(guī)律,創(chuàng)造新知識,加速科學研究范式變革”。
在中國工程院院士王堅看來,以“數(shù)據要素×”實現(xiàn)科技創(chuàng)新效能倍增,與當今時代“數(shù)據驅動型創(chuàng)新”特點高度契合。王堅把20世紀形成的傳統(tǒng)創(chuàng)新模式稱為“電氣化驅動創(chuàng)新”。正是在電氣化的強有力推動下,與激光、互聯(lián)網、計算機等有關的科技發(fā)明不斷涌現(xiàn),塑造了人們的生產生活方式和社會面貌,可以說20世紀是電氣化驅動科技創(chuàng)新的世紀。進入21世紀,以美國數(shù)據科學專家、圖靈獎得主詹姆斯·格雷為代表的科學家提出“數(shù)據密集型科學發(fā)現(xiàn)”,凸顯數(shù)據對科技創(chuàng)新的重大價值。
那么數(shù)據是如何驅動科技創(chuàng)新的呢?對此,王堅解釋,科學家可以根據相關數(shù)據,提出新的假設,并借助高性能計算技術、人工智能技術等,對假設進行驗證,從而獲得新的科學發(fā)現(xiàn)。
與王堅的上述看法類似,中國科學院院士、北京科學智能研究院院長鄂維南認為,在當今大數(shù)據時代,科研環(huán)境從依靠圖書館、電子顯微鏡等傳統(tǒng)基礎設施轉變?yōu)橐源髷?shù)據、人工智能為代表的新型基礎設施。
對《行動計劃》提到的“加速科學研究范式變革”,中國科學院院士、復旦大學校長金力表示,傳統(tǒng)的科研范式經歷了4個階段演化:從通過實驗描述自然現(xiàn)象的“實驗范式”,到通過模型或歸納進行研究的“理論范式”,再到應用計算機仿真模擬解決學科問題的“計算范式”,再到通過大數(shù)據分析研究事物內在關系的“數(shù)據范式”。今天,隨著數(shù)據資源不斷增長和需要求解的科學問題日益復雜,科學研究的第五范式應運而生,就是在“數(shù)據范式”基礎上,引入了智能技術,強調人的決策機制與數(shù)據分析的融合,將數(shù)據科學和計算智能有效地結合起來,利用AI技術學習、模擬、預測和優(yōu)化自然界和人類社會的各種現(xiàn)象和規(guī)律,以解決各種科研問題,從而推動科學發(fā)現(xiàn)和創(chuàng)新,這就是科學研究“人工智能驅動范式”(AI For Science)。
2022年底以來, 以ChatGPT為代表的生成式人工智能大模型大放異彩??茖W研究“人工智能驅動范式”迫切需要類似ChatGPT的人工智能大模型提供支撐。為此,《行動計劃》提出打造服務于中國科技創(chuàng)新事業(yè)的人工智能大模型并作出相關部署,要求“以科學數(shù)據支持大模型開發(fā),深入挖掘各類科學數(shù)據和科技文獻,通過細粒度知識抽取和多來源知識融合,構建科學知識資源底座,建設高質量語料庫和基礎科學數(shù)據集,支持開展人工智能大模型開發(fā)和訓練”。
對科學研究“人工智能驅動范式”的前景,金力進行了樂觀展望,認為這一范式是實現(xiàn)科技原始創(chuàng)新的利器,比如,在大數(shù)據支撐下,人工智能在生命科學領域可以高效、精準地預測蛋白質結構。無獨有偶,在近日舉行的一個論壇上,國家數(shù)據局局長劉烈宏在演講中也舉了這個例子。他說,長期以來,如何準確、快速確定蛋白質三維空間結構一直是一個難題,而基于海量、多元生物數(shù)據構建起的人工智能算法模型,能在幾天甚至幾分鐘預測出以前要花費數(shù)十年才能得到的、具有高置信度的蛋白質結構,顛覆了生命科學領域的研究范式。
科學數(shù)據重在應用,《行動計劃》指明了科學數(shù)據兩大應用方向:一是聚焦科研本身,以科學數(shù)據助力前沿研究,面向基礎學科,提供高質量科學數(shù)據資源與知識服務,驅動科學創(chuàng)新發(fā)現(xiàn);二是聚焦服務產業(yè),以科學數(shù)據支撐技術創(chuàng)新,聚焦生物育種、新材料創(chuàng)制、藥物研發(fā)等領域,以數(shù)智融合加速技術創(chuàng)新和產業(yè)升級。
廣泛賦能千行百業(yè)
由《行動計劃》,人們很自然地聯(lián)想到“互聯(lián)網+”,聯(lián)想到于2015年7月印發(fā)實施的《關于積極推進“互聯(lián)網+”行動的指導意見》。兩個文件雖然時隔8年多,但是仍有諸多可以相比較的地方。兩者分別以“互聯(lián)網+”和“數(shù)據要素×”為關鍵詞,都引入了數(shù)學符號,給人非常直觀的感受。同時,兩者都對部署的措施冠以“行動”并都詳細列舉了開展“行動”的重點領域。前者列舉了“創(chuàng)業(yè)創(chuàng)新”“協(xié)同制造”“現(xiàn)代農業(yè)”等11個領域,后者列舉了“科技創(chuàng)新”“智能制造”“智慧農業(yè)”等12個領域。
如何解讀“互聯(lián)網+”和“數(shù)據要素×”之間的關系呢?對此,國家數(shù)據局副局長沈竹林表示,從前者到后者可以用3個轉變來概括:一是從連接到協(xié)同的轉變。“互聯(lián)網+”強調的是連接,即各行各業(yè)擁抱互聯(lián)網,實現(xiàn)基于數(shù)據生成和傳遞的互聯(lián)互通;而“數(shù)據要素×”強調的是數(shù)據協(xié)同,是基于數(shù)據有效應用的全局優(yōu)化。二是從使用到復用的轉變。“互聯(lián)網+”強調的是千行百業(yè)利用互聯(lián)網技術;而“數(shù)據要素×”強調的是基于行業(yè)間數(shù)據復用的價值創(chuàng)造,拓展經濟增長新空間。三是從疊加到融合的轉變。“互聯(lián)網+”強調的是通過匯聚數(shù)據來提升效率;而“數(shù)據要素×”強調的是融合多來源、多類型的數(shù)據,驅動創(chuàng)新,培育經濟增長新動能。
中央財經大學中國互聯(lián)網經濟研究院副院長歐陽日輝是《行動計劃》的起草人之一。他近日撰文對“互聯(lián)網+”和“數(shù)據要素×”之間的關系進行了闡釋,指出互聯(lián)網和數(shù)據是數(shù)字技術的統(tǒng)一體,前者是“露出水面的冰山”而后者是“深藏在水下的主體”,實施多年的“互聯(lián)網+”行動為采取“數(shù)據要素×”行動奠定了堅實基礎,“數(shù)據要素×”是“互聯(lián)網+”的升級和升華,二者本質上都是數(shù)字技術與經濟社會的深度融合、雙向賦能。
縱觀《行動計劃》所列的“數(shù)據要素×”12個重點領域,基本覆蓋了一、二、三產業(yè)的各行業(yè)及重點細分領域,涉及千行百業(yè)。比如,在工業(yè)制造領域,《行動計劃》要求,支持工業(yè)制造類企業(yè)融合設計、仿真、實驗驗證數(shù)據,培育數(shù)據驅動型產品研發(fā)新模式,提升企業(yè)創(chuàng)新能力。比如,在現(xiàn)代農業(yè)領域,《行動計劃》提出,支持相關方面融合利用遙感、氣象、土壤、農事作業(yè)、災害、農作物病蟲害、動物疫病、市場等數(shù)據,加快打造以數(shù)據和模型為支撐的農業(yè)生產數(shù)智化場景,實現(xiàn)精準種植、精準養(yǎng)殖、精準捕撈等智慧農業(yè)作業(yè)方式。
詮釋新質生產力
數(shù)據是經過收集、記錄、測量、統(tǒng)計、描述所得到的信息或信息的載體,可以是數(shù)字、文字、圖像、聲音等形式。隨著網絡技術的發(fā)展和向各行業(yè)的滲透,數(shù)字技術創(chuàng)新成果與經濟社會各領域深度融合,不同領域的數(shù)據被生產、記錄、傳輸、存儲和消費,數(shù)據規(guī)模以摩爾定律的速度快速增長。數(shù)據的充分挖掘和有效利用,可以優(yōu)化資源配置和使用效率,對價值創(chuàng)造和生產力發(fā)展有著廣泛影響。
歐陽日輝表示,在數(shù)字經濟時代,數(shù)據的重要性不言而喻,但是數(shù)據并不是從一開始就被作為生產要素,而是經歷了一個過程。
2017年12月,習近平總書記在中共十九屆中央政治局第二次集體學習時強調“構建以數(shù)據為關鍵要素的數(shù)字經濟”。2019年10月,中共十九屆四中全會明確了勞動、資本、土地、知識、技術、管理和數(shù)據等7種生產要素。這是首次正式明確數(shù)據的生產要素地位。之后,中央作出改革和加快培育數(shù)據要素市場、更好發(fā)揮數(shù)據要素作用等一系列重大部署,而《行動計劃》就是落實這些部署的最新舉措。
值得注意的是,《行動計劃》把培育和發(fā)展新質生產力作為實施“數(shù)據要素×”行動的重要目標之一。對此,南開大學經濟與社會發(fā)展研究院教授杜傳忠指出,新質生產力的培育有多種推動力量,其中數(shù)據要素作為國家基礎性戰(zhàn)略資源和關鍵性生產要素,與算力相結合,將衍生形成強勁的數(shù)據生產力,成為新質生產力的重要組成部分。杜傳忠特別提到類似ChatGPT這樣的生成式人工智能大模型,他認為,AI大模型以智能算力作為底座支撐,通過深度學習算法和萬億級別數(shù)據的訓練,不斷迭代,從而形成新質生產力。此外,數(shù)據要素在人工智能技術加持下,推出大量具有深度學習、自主學習能力的機器人,可以進一步深化勞動分工、優(yōu)化勞動力供給結構,從而形成新質生產力。
中國首個工業(yè)級流體仿真大模型“東方·御風”被認為是新質生產力的典型代表。2022年9月,該大模型由中國商飛公司聯(lián)合有關方面共同發(fā)布,在相關流體仿真套件的支持下,有效提高了對復雜流動的仿真能力,將仿真時間縮短至原來的1/24。同時,該模型能對流場中變化劇烈的區(qū)域進行精準預測,流場平均誤差降低到萬分之一量級,達到工業(yè)級標準。正是有了大模型“東方·御風”的助力,中國C919大型客機才得以縮短研發(fā)周期,才能早日翱翔藍天。(記者 張保淑)
編輯:郭成