科學數(shù)據(jù)在數(shù)據(jù)與智能驅動的科研范式變革加速演進中愈發(fā)凸顯出基礎性和戰(zhàn)略性,對我國實現(xiàn)高水平科技自立自強、增強國際競爭話語權和發(fā)展新質生產力具有重要意義。當前,我國科學數(shù)據(jù)體系建設仍存在管理碎片化等諸多問題,亟待統(tǒng)籌謀劃,建立完善的科學數(shù)據(jù)管理體系,對政策、標準、技術、平臺、服務、應用進行全鏈條統(tǒng)籌整合。
科學數(shù)據(jù)體系建設意義重大
科學數(shù)據(jù)又稱為研究數(shù)據(jù)或者科研數(shù)據(jù),是由研究人員在科技創(chuàng)新活動中創(chuàng)建和收集的證據(jù),并在應用和傳播過程中實現(xiàn)增值。從科學數(shù)據(jù)屬性上來看,科學數(shù)據(jù)與個人數(shù)據(jù)、公共數(shù)據(jù)、產業(yè)(行業(yè))數(shù)據(jù)、企業(yè)數(shù)據(jù)、政務數(shù)據(jù)等其他類型的數(shù)據(jù)相比,既有獨特性,也存在交叉性。特別是隨著科研范式變革以及科技創(chuàng)新和產業(yè)創(chuàng)新的深度融合,科學數(shù)據(jù)與產業(yè)(行業(yè))數(shù)據(jù)的邊界日益模糊,科學數(shù)據(jù)與個人行為數(shù)據(jù)的關系日益緊密,科學數(shù)據(jù)本身亦有公共數(shù)據(jù)屬性,但又是具有科研特性的公共數(shù)據(jù)。當前加快科學數(shù)據(jù)體系建設、構建科學數(shù)據(jù)的全生命周期治理框架具有極為重要的意義。
第一,助力人工智能賦能科學研究,重塑科學發(fā)現(xiàn)范式。當前人工智能與跨學科研究需要高質量、高價值密度數(shù)據(jù),要求打破數(shù)據(jù)邊界,促進流動互通。科學數(shù)據(jù)體系為人工智能大模型提供了系統(tǒng)化、標準化、可訪問的訓練“燃料”,是驅動人工智能在材料設計、藥物篩選等科學研究中發(fā)揮作用的基礎,從而加速新規(guī)律發(fā)現(xiàn)和重大科學問題突破。
第二,捍衛(wèi)大國博弈中數(shù)據(jù)主權,保障國家安全。科學數(shù)據(jù)成為戰(zhàn)略資源,建設自主可控的科學數(shù)據(jù)體系,確保關鍵領域科學數(shù)據(jù)獲取、存儲、處理的自主可控,可以提供重要的替代支撐,對國家安全至關重要。
第三,支撐我國科技強國建設,實現(xiàn)高水平科技自立自強。通過科學數(shù)據(jù)公共平臺建設,可以使有限的科研經費更集中于原創(chuàng)性研究和關鍵技術攻關,整體提升國家科技投入產出效率。高質量的科學數(shù)據(jù)體系還能吸引全球頂尖科技人才,加速科技成果轉化,為培育新質生產力提供強大的數(shù)據(jù)驅動力。
我國科學數(shù)據(jù)體系建設存在的問題
雖然我國科學數(shù)據(jù)治理能力顯著提升,但在科學數(shù)據(jù)體系建設方面還存在缺乏系統(tǒng)規(guī)劃、管理碎片化、缺乏高質量數(shù)據(jù)庫、資源投入不足等問題。
第一,缺乏國家層面系統(tǒng)規(guī)劃,跨部門統(tǒng)籌協(xié)調困難。已出臺政策缺乏統(tǒng)一管理框架,出現(xiàn)多頭管理、跨部門統(tǒng)籌協(xié)調困難的情況。由于缺乏跨部門協(xié)調機構,數(shù)據(jù)持有部門出于數(shù)據(jù)控制權、數(shù)據(jù)安全、知識產權等風險規(guī)避考慮,出現(xiàn)“不愿共享”“不敢共享”“不能共享”的局面。
第二,科學數(shù)據(jù)管理碎片化,生命周期關鍵環(huán)節(jié)存在問題。在數(shù)據(jù)匯交環(huán)節(jié),科研主責單位匯交數(shù)據(jù)的主動性不足,部分匯交數(shù)據(jù)質量不高,缺乏可持續(xù)匯交機制。在數(shù)據(jù)共享環(huán)節(jié),大量科學數(shù)據(jù)依然分布于個體科研人員手中,數(shù)據(jù)持有者由于權屬不清、收益無保障、安全顧慮等原因,不愿意共享。在數(shù)據(jù)應用環(huán)節(jié),對人工智能賦能科學研究等最新應用場景響應不及時,尚未構建新興學科數(shù)據(jù)庫。在標準體系方面,跨學科跨領域數(shù)據(jù)標準不統(tǒng)一,強制性標準缺乏,難以整合利用。
第三,缺乏高質量數(shù)據(jù)庫,基礎軟件過度依賴國外。2024年全球科學數(shù)據(jù)存儲庫注冊平臺統(tǒng)計顯示,現(xiàn)有注冊數(shù)據(jù)庫3300個,中國牽頭建設的僅有63個,且普遍存在數(shù)據(jù)不完整、更新不及時以及質量參差不齊的問題。與此同時,嚴重依賴國外開源或商業(yè)軟件,如GEE、Pytorch、Neo4j、DOI科技資源標識等系統(tǒng),其中科技資源標識服務已發(fā)生數(shù)起斷供事件,嚴重影響我國資源全球訪問。
第四,資源投入不足,激勵與保障機制缺位。我國科學數(shù)據(jù)建設未能與科研儀器享有同等重要地位,缺乏科技專項支持。缺乏激勵與保障機制,科學數(shù)據(jù)未被納入科技成果評價體系,經濟收益激勵不足,從事數(shù)據(jù)工作的科研人員職稱評價難,導致相關人員流失嚴重。
統(tǒng)籌部署加快科學數(shù)據(jù)體系建設
科學數(shù)據(jù)體系化工作的當務之急是跳出部門利益局限和“打補丁”思維,以科技強國建設為目標,通過頂層設計、制度創(chuàng)新、平臺建設、場景驅動,實現(xiàn)科學數(shù)據(jù)的自立自強。
第一,加強頂層設計,重新定義“科學數(shù)據(jù)”,統(tǒng)籌調度各部門資源。推進《科學數(shù)據(jù)管理辦法》修訂工作,重新定義“科學數(shù)據(jù)”及其邊界,細化與豐富科學數(shù)據(jù)屬性,使其適應新時代要求。錨定科技強國建設目標,明確科學數(shù)據(jù)作為“科技基礎設施”的戰(zhàn)略定位。加強部門統(tǒng)籌協(xié)同,通過設立國家級重大科技項目,在項目框架內賦予首席科學家對科學數(shù)據(jù)的調度權,推動科學數(shù)據(jù)共享。
第二,探索制度創(chuàng)新,推動權屬界定,完善科研人員激勵評價政策。改變科研人員“重論文、輕數(shù)據(jù)”的傳統(tǒng)觀念,將科學數(shù)據(jù)納入科技成果范疇,接受數(shù)據(jù)作為獨立成果的價值。推動數(shù)據(jù)成果化,借鑒知識產權模式,鼓勵數(shù)據(jù)加工產品進入市場。改革考核評價機制,在機構評估中,將數(shù)據(jù)資源建設、管理能力、開放共享成效納入科研機構、高校等的評估體系。在科研人員的職稱評定、人才計劃評選、績效考核中,將高質量科學數(shù)據(jù)集的創(chuàng)建、維護、共享及其產生的廣泛影響力作為重要依據(jù)。建立數(shù)據(jù)工程師職稱通道,鼓勵科研人員參與數(shù)據(jù)治理。
第三,構建平臺體系,加大資源投入與整合,完善標準標識建設。優(yōu)化科學數(shù)據(jù)平臺體系,構建“國家科學數(shù)據(jù)總中心—省級節(jié)點—領域中心”的“1+M+N”科學數(shù)據(jù)分層治理體系。國家級科學數(shù)據(jù)中心聚焦基礎學科和“卡脖子”領域,覆蓋中西部地區(qū)的省域科學數(shù)據(jù)中心聚焦應用學科領域,高校、企業(yè)等機構建設的科學數(shù)據(jù)平臺也逐漸接入元數(shù)據(jù)框架。逐漸打通科學數(shù)據(jù)中心、國家實驗室、重大科技項目、學術期刊、企業(yè)機構“五類主體”的科學數(shù)據(jù)鏈,形成分層次的科學數(shù)據(jù)體系。國家和地方設立專項課題,資助科學數(shù)據(jù)的加工與應用,保障科學數(shù)據(jù)的全生命周期管理。由國家科學數(shù)據(jù)中心統(tǒng)一提供標識服務、安全掃描、引用追蹤等公共服務。
第四,強化場景驅動,拓展數(shù)據(jù)應用,支撐科技創(chuàng)新與產業(yè)創(chuàng)新融合。設立“數(shù)據(jù)—算法”聯(lián)合專項,支持基于高質量科學數(shù)據(jù)與先進算法融合的基礎理論研究和范式創(chuàng)新。鼓勵企業(yè)結合自身特點,使用國家科學數(shù)據(jù)開發(fā)垂直模型,探索定制化的數(shù)據(jù)應用解決方案。鼓勵基于開放數(shù)據(jù)的二次研究、產品開發(fā)和服務創(chuàng)新。推動科學數(shù)據(jù)在各行業(yè)深度應用,建立產業(yè)融合示范區(qū)。
(作者系中國科學技術發(fā)展戰(zhàn)略研究院副研究員)
文章鏈接:https://epaper.stdaily.com/statics/technology-site/index.html#/home
地址:中國 北京市海淀區(qū)玉淵潭南路8號 郵編(ZIP):100038
電話(Tel):86-10-58884543 咨詢:webmaster@casted.org.cn 新聞與信息:xxxz@casted.org.cn
版權所有 中國科學技術發(fā)展戰(zhàn)略研究院 備案號/經營許可證備號:京ICP備10036465號-11
技術支持:中研網(wǎng)