久久精品国产一区二区三区_开心五月综合亚洲_久久WWW免费人成人片_国模GOGO无码人体啪啪_欧洲第一无人区观看_最近最新电影大全免费观看_女人与公拘交酡过程高清视频_亚洲尺码一区二区三区_妇女敕BBB搡BBBBBB搡_日韩精品无码一区二区三区

秦錚|人工智能驅(qū)動的科學(xué)研究:特征、趨勢及建議

日期:2025-10-14        來源:科技中國,2025年第8期

字體:【

人工智能驅(qū)動的科學(xué)研究(AI for ScienceAI4S)是以人工智能(AI)手段輔助或獨立完成科學(xué)研究任務(wù)的一種模式,代表著新的科研范式發(fā)展趨勢。科研范式的變革則是推動科學(xué)中心轉(zhuǎn)移和一國科學(xué)崛起的底層力量,關(guān)切AI4S的發(fā)展特征和趨勢,對搶抓新科學(xué)革命的機遇意義重大。

一、AI for Science的典型案例

人工智能驅(qū)動的科學(xué)研究近年來持續(xù)升溫,2024年的諾貝爾化學(xué)獎和物理學(xué)獎則將其推到風(fēng)口浪尖。202410月,諾貝爾化學(xué)獎揭曉,美國華盛頓大學(xué)的大衛(wèi)·貝克(David Baker)和谷歌公司的英國科學(xué)家戴密斯·哈薩比斯(Demis Hassabis)、約翰·M·詹伯(John M. Jumper)獲此殊榮,因為他們“在蛋白質(zhì)設(shè)計和蛋白質(zhì)結(jié)構(gòu)預(yù)測方面作出了杰出貢獻(xiàn)”。這就是近年來最具典型代表性的AlphaFold輔助蛋白質(zhì)結(jié)構(gòu)研究的案例。

獲獎人哈薩比斯和詹伯開發(fā)了一種名為“AlphaFold”的人工智能應(yīng)用程序,這款程序?qū)iT用來預(yù)測人體蛋白質(zhì)的結(jié)構(gòu),由于蛋白質(zhì)的結(jié)構(gòu)決定了蛋白質(zhì)的功能,因此通過預(yù)測其結(jié)構(gòu)即可預(yù)判其功能,進(jìn)而進(jìn)一步設(shè)計其結(jié)構(gòu)并創(chuàng)造新的功能。哈薩比斯和詹伯完成了前半部分(結(jié)構(gòu)預(yù)測),而貝克則完成了后半部分(結(jié)構(gòu)設(shè)計)。由于組成蛋白質(zhì)多肽鏈的氨基酸數(shù)量極為龐大,通過傳統(tǒng)方法無法完成研究,該問題困擾科學(xué)界長達(dá)50年之久。隨著2018AlphaFold的牛刀小試,這一研究范式表現(xiàn)出巨大的潛力,到2.0版誕生后(2021年),這一問題才被徹底解決。目前利用AlphaFold 2已成功完成大約兩億種蛋白質(zhì)結(jié)構(gòu)的預(yù)測(幾乎已窮盡所有已知蛋白質(zhì)),并被全球200多萬科研人員在網(wǎng)絡(luò)上公開下載使用。

與諾貝爾化學(xué)獎類似,2024年諾貝爾物理學(xué)獎也頒給了與人工智能有關(guān)的研究人員。在諾貝爾物理學(xué)獎中,美國普林斯頓大學(xué)教授約翰·J·霍普菲爾德(John J. Hopfield)基于神經(jīng)科學(xué)和物理學(xué)中自旋系統(tǒng)的原理,發(fā)明了一種“聯(lián)想記憶”的網(wǎng)絡(luò)模型,用于數(shù)據(jù)記憶存儲和重構(gòu),可用來處理數(shù)據(jù)去噪和缺失數(shù)據(jù)重構(gòu)等問題。加拿大多倫多大學(xué)教授杰弗里·E·辛頓(Geoffrey E. Hinton)在此基礎(chǔ)上,利用統(tǒng)計物理學(xué)中系統(tǒng)狀態(tài)分布和調(diào)整的思維,革新了這個模型,生成一種可以基于已有訓(xùn)練自動歸類輸入信息并調(diào)整優(yōu)化整個系統(tǒng)結(jié)構(gòu),進(jìn)而生成新的系統(tǒng)結(jié)構(gòu)的模型,這不僅是早期人工智能生成模型的代表,而且也為今天的深度神經(jīng)網(wǎng)絡(luò)機器學(xué)習(xí)奠定了技術(shù)基礎(chǔ)。這些研究使得人工神經(jīng)網(wǎng)絡(luò)技術(shù)成為AI發(fā)展的核心,因此物理學(xué)獎用來表彰兩位科學(xué)家“在利用人工神經(jīng)網(wǎng)絡(luò)進(jìn)行機器學(xué)習(xí)方面所作出的基礎(chǔ)性發(fā)現(xiàn)和發(fā)明”。

我們可以看到,兩個獎項都與AI有關(guān),都在科學(xué)研究和AI之間建立了某種橋梁,但其邏輯方向不同:在諾貝爾化學(xué)獎的案例中,AI輔助了科學(xué)研究;而在諾貝爾物理學(xué)獎的案例中,科學(xué)研究推動了AI發(fā)展。由此可見,AI for ScienceScience for AI[王燕平1] (科學(xué)研究驅(qū)動的AI發(fā)展)都已被科學(xué)界廣泛接受。隨著諾貝爾獎的這些獎項的頒布,人工智能與科學(xué)研究之間的關(guān)系顯然變得更加緊密,一場轟轟烈烈的科研范式變革已成為不可爭辯的事實。

二、AI for Science的技術(shù)支撐

人工智能驅(qū)動的科學(xué)研究實質(zhì)上代表了未來科研范式的發(fā)展方向,它依靠AI技術(shù)輔助科學(xué)研究,從而加速科研進(jìn)度、提高科研效率,主要特征包括:第一,以龐大的數(shù)據(jù)體量為支撐,先有數(shù)據(jù),然后產(chǎn)生理論假設(shè),先知道“結(jié)果是什么”,然后去分析“為什么”,這不同于以前研究中的先假設(shè)、后驗證的方法。第二,AI4S屬于機器自動研究、自主研究,先通過數(shù)據(jù)學(xué)習(xí)獲取“規(guī)則”,然后進(jìn)行自動化處理,最后得到分析結(jié)果和解決方案,至于處理過程是什么樣的、如何解釋其中的因果聯(lián)系,可能人力無法知曉。第三,在理想情況下,AI4S的研究方法本身可以自動進(jìn)化,不需要由研究人員來決定優(yōu)劣及取舍,AI可自動完成方法升級,這與傳統(tǒng)的人力研究或計算機輔助研究具有根本不同。

總之,AI技術(shù)是其核心驅(qū)動力,而AI4S的發(fā)展又依賴于數(shù)據(jù)、算力、算法等多方面的支撐,這體現(xiàn)在以下四個方面:

第一,數(shù)據(jù)是AI4S的生產(chǎn)資料。高質(zhì)量數(shù)據(jù)集是訓(xùn)練和優(yōu)化AI模型和學(xué)習(xí)推理的基礎(chǔ),數(shù)據(jù)的質(zhì)量、數(shù)量以及多樣性直接影響到模型的最終效果。在科學(xué)研究中,數(shù)據(jù)包括實驗數(shù)據(jù)、觀測數(shù)據(jù)、模擬數(shù)據(jù)等,不同學(xué)科數(shù)據(jù)類別和復(fù)雜度不盡相同。與歐美國家相比,我國在復(fù)雜數(shù)據(jù)領(lǐng)域的數(shù)據(jù)利用率仍然較低,且傳統(tǒng)擅長處理結(jié)構(gòu)化和線性數(shù)據(jù)的AI框架,無法解決高維非線性數(shù)據(jù)的復(fù)雜性問題。如何有效整合多模態(tài)和多層次的數(shù)據(jù)集,是AI4S的重要研究方向。

第二,算力是AI4S的生產(chǎn)力。特別是在數(shù)據(jù)密集型的科研領(lǐng)域,無論是訓(xùn)練復(fù)雜的深度學(xué)習(xí)模型,還是處理大規(guī)模的數(shù)據(jù)集和復(fù)雜的模型結(jié)構(gòu),都需要巨大的高性能計算資源,包括強大的計算能力、高效的存儲系統(tǒng)、先進(jìn)的網(wǎng)絡(luò)通信、靈活的資源調(diào)度、安全可靠的環(huán)境、專業(yè)的技術(shù)支持和開放共享的平臺等,以確保AI算法的高效運行。通過加速模型的訓(xùn)練過程,可以減少迭代時間,提高科研速度和效率,從而使科學(xué)家更快地對研究問題進(jìn)行迭代和假設(shè)驗證。

第三,算法是AI4S的生產(chǎn)工具。算法是AI大模型的核心,它定義了如何從數(shù)據(jù)中提取有效信息并進(jìn)行預(yù)測或決策。不同的科學(xué)問題可能需要不同類型的算法,如機器學(xué)習(xí)中的監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、強化學(xué)習(xí)等。不同環(huán)節(jié)算法也包含不同的關(guān)鍵技術(shù),如架構(gòu)設(shè)計、優(yōu)化技術(shù)、正則化與模型剪枝(簡化模型)、動態(tài)調(diào)整學(xué)習(xí)率等。架構(gòu)的選擇會影響模型的性能、訓(xùn)練速度和推理效率,算法的選擇和優(yōu)化則有利于解決特定問題。有效的優(yōu)化策略可以加快收斂速度并提高最終模型的質(zhì)量;自適應(yīng)學(xué)習(xí)可以進(jìn)一步提高模型訓(xùn)練效果。

第四,專業(yè)知識是AI4S的智力支持。除了算力、算法和數(shù)據(jù)的AI三大要素外,AI4S的成功還依賴于科學(xué)家在各自研究領(lǐng)域的專業(yè)知識和經(jīng)驗。科學(xué)問題往往具有高度的專業(yè)性和復(fù)雜性,這些專業(yè)知識能夠幫助定義研究問題、選擇合適的特征、解釋模型結(jié)果以及設(shè)計后續(xù)實驗。如果沒有深厚的專業(yè)背景,即使有強大的算力和先進(jìn)的算法,也難以有效解決具體的科學(xué)問題。因此AI4S尚未發(fā)展到完全智能的程度,它只是在方向上具有較大的范式優(yōu)勢。

三、AI for Science的發(fā)展趨勢

從長期來看,當(dāng)前AI4S正處于初期發(fā)展階段,雖然關(guān)于AI4S的相關(guān)討論很多,但真正的應(yīng)用并不多,總體上判斷,AI4S未來可能面臨如下發(fā)展趨勢:

第一,應(yīng)用范圍越來越廣,被使用頻率越來越高。隨著AI技術(shù)的進(jìn)一步發(fā)展,AI4S的應(yīng)用會不斷擴(kuò)展:一方面,在自然科學(xué)研究領(lǐng)域,AI參與學(xué)術(shù)研究的比例越來越高,谷歌學(xué)術(shù)統(tǒng)計表明,20212023年,全球使用AI進(jìn)行科學(xué)研究的論文發(fā)表比例增長至超過34.5%,增長超過3倍,主要集中于材料科學(xué)、生命科學(xué)、能源科學(xué)等領(lǐng)域;另一方面,隨著生成式AI的發(fā)展,社會科學(xué)領(lǐng)域也會越來越多地被AI4S介入,相關(guān)研究可能會變得更加智能化、更有AI感,ChatGPTDeepSeek等現(xiàn)象[王燕平2] 級事件的發(fā)生是這一趨勢的有力證明。

第二,AI4S的相關(guān)學(xué)術(shù)監(jiān)管壓力將迅速增加。正因為其不可抵擋的擴(kuò)張趨勢,未來AI4S的發(fā)展可能面臨越來越多的監(jiān)管難題,因為在AI的智能化提升過程中,AI的“想象力”和“致幻率”之間存在著難以調(diào)和的矛盾,這一方面是由于AI大模型算法本身所決定的,另一方面可能是由于使用者的判斷能力甚至主觀意愿所導(dǎo)致。因此,未來的學(xué)術(shù)研究可能會產(chǎn)生越來越多的“致幻”數(shù)據(jù)和虛假結(jié)論,這對科學(xué)發(fā)展反而不利。也正因為如此,諾貝爾獎得主辛頓本身也對其提出反對意見(辛頓認(rèn)為“要像監(jiān)管核武器一樣對AI進(jìn)行監(jiān)管”,與此觀點類似的還有OpenAI公司的CEO山姆·奧特曼)。

第三,算力“天花板”或?qū)⒊蔀?span>AI4S的發(fā)展瓶頸。目前AI“智能化”水平的提升,主要靠“規(guī)模效應(yīng)”來驅(qū)動,即通過增加模型規(guī)模、數(shù)據(jù)量和計算資源來提高模型性能,這種“大力出奇跡”的方式,在短期內(nèi)比拼的是“算力”,但從長期來看,必然會遇到某種物理瓶頸,即“算力天花板”。這意味著大模型的開發(fā)不能一味地靠堆積算力,而更多的是要多路徑協(xié)同發(fā)展,而正因為模型的性能決定了AI4S的性能和研究效率,因此未來AI4S的發(fā)展將從單純的算力競爭轉(zhuǎn)變?yōu)椤靶酒?span>+算法+應(yīng)用”的綜合實力的競爭。

第四,AI4S推動的學(xué)科邊界重構(gòu)將更加明顯。AI4S是多學(xué)科、多技術(shù)、多領(lǐng)域交叉的系統(tǒng)工程,它本身需要跨學(xué)科的合作,因此在發(fā)展AI4S的過程中,必然會推動學(xué)科邊界的拆分與重構(gòu)。一方面,AI4S通過將基礎(chǔ)學(xué)科與AI相結(jié)合,幫助解決不同科研領(lǐng)域的共性問題,促進(jìn)學(xué)科交叉和交流,加大學(xué)科融合;另一方面,AI4S需要更多復(fù)合型人才的參與才能更好駕馭科學(xué)研究,而復(fù)合型人才的培育,必然要求打破學(xué)科邊界,通過構(gòu)建跨學(xué)科知識圖譜來加速學(xué)科融合。因此,AI4S在未來有望推動大科學(xué)研究和微觀尺度革命雙向突破,繼而催生出新的學(xué)科領(lǐng)域。

四、相關(guān)政策建議

綜上,應(yīng)充分認(rèn)識搶抓AI4S發(fā)展先機的重要意義,充分發(fā)揮我國龐大數(shù)據(jù)資源、豐富應(yīng)用場景和舉國算力等規(guī)模優(yōu)勢,更好推動人工智能發(fā)展為科學(xué)研究賦能添力。因此建議:

第一,堅持?jǐn)?shù)據(jù)戰(zhàn)略先行,大力推動數(shù)據(jù)共建共享。充分認(rèn)識高質(zhì)量數(shù)據(jù)資源對AI發(fā)展的決定性意義,盡快從國家層面構(gòu)建AI時代數(shù)據(jù)發(fā)展戰(zhàn)略,出臺數(shù)據(jù)共享、共建、共用等政策。堅持推進(jìn)數(shù)據(jù)標(biāo)準(zhǔn)化工作,通過數(shù)據(jù)標(biāo)準(zhǔn)化策略提升數(shù)據(jù)質(zhì)量、提高數(shù)據(jù)再現(xiàn)性,推動科研數(shù)據(jù)共享利用和科學(xué)知識傳播迭代。支持相關(guān)科技企業(yè)和地方政府聯(lián)合構(gòu)建大型多模態(tài)、多層次數(shù)據(jù)庫,搭建高通量數(shù)據(jù)生產(chǎn)公共平臺,加大數(shù)據(jù)開放共享和收益分配探索,提高相關(guān)數(shù)據(jù)利用率。

第二,實施算力倍增計劃,推動AI算力提質(zhì)增效。短期內(nèi),算力仍是大模型突破的重要方向,要繼續(xù)推動算力基礎(chǔ)設(shè)施建設(shè),盡快突破先進(jìn)制程芯片技術(shù)封鎖,想方設(shè)法縮小與美國的算力差距。在推動已有大算力集群建設(shè)的基礎(chǔ)上,引入先進(jìn)算力調(diào)度和管理技術(shù),提高本地算力利用率;超前部署“點—線—面”統(tǒng)一協(xié)調(diào)的全國一體化算力網(wǎng)絡(luò),實現(xiàn)算力資源共享和協(xié)同調(diào)度,提高整體算力使用效率。堅持實施“云計算+AI”方案,以“公共云”模式提供大規(guī)模并行智能技術(shù),支持大模型訓(xùn)練和推理應(yīng)用,促使AI應(yīng)用于科學(xué)研究。

第三,堅持AI開源開放,強化多主體協(xié)同創(chuàng)新。支持企業(yè)開發(fā)開源模型和構(gòu)建開源社區(qū),利用AI大模型開源開放促使開發(fā)人員相互交流,加速技術(shù)迭代升級。支持一批基礎(chǔ)較好的基礎(chǔ)模型開發(fā)企業(yè)和AI開源社區(qū)發(fā)展壯大,形成世界級模型衍生群和領(lǐng)先級開源社區(qū),提升我國AI全球影響力。試點探索科學(xué)研究中AI開源生態(tài)貢獻(xiàn)考核,比如在國家自然科學(xué)基金人工智能類項目中,將AI開源生態(tài)貢獻(xiàn)值納入立項標(biāo)準(zhǔn)或考核指標(biāo),吸引更多科研人員參與AI開源開發(fā)和AI4S落地應(yīng)用。

第四,堅持人才為本,加大AI人才培養(yǎng)引進(jìn)和開發(fā)。推動實施“科教融匯”戰(zhàn)略,錨定AI人才培育目標(biāo),制定人才培養(yǎng)計劃,盡快培育一大批AI相關(guān)理論與技能人才。支持有條件的地區(qū)或高校建立AI4S學(xué)院,支持校企聯(lián)合培養(yǎng)跨學(xué)科人才和AI復(fù)合型人才,加快推動人才互認(rèn)協(xié)調(diào)工作,強化人才需求與供給匹配。加強國際一流科研環(huán)境建設(shè),建立高端人才引進(jìn)機制,吸引AI相關(guān)國際專家、一流學(xué)者來華訪問或工作,吸引留學(xué)生回國從事相關(guān)研究等。


     (作者:秦錚,中國科學(xué)技術(shù)發(fā)展戰(zhàn)略研究院科技規(guī)劃與技術(shù)預(yù)測研究所,副研究員)


聯(lián)系我們

地址:中國 北京市海淀區(qū)玉淵潭南路8號 郵編(ZIP):100038

電話(Tel):86-10-58884543 咨詢:webmaster@casted.org.cn 新聞與信息:xxxz@casted.org.cn