-
首頁
- 師資與科研
- 科研動(dòng)態(tài)
- 詳情
2023年3月16日,人民郵電報(bào)發(fā)表北京交通大學(xué)信息管理理論與技術(shù)國際研究中心(ICIR)自媒體平臺(tái)——交大評(píng)論特約文章,題為《筑牢人工智能三大基礎(chǔ)環(huán)節(jié),迎接全球第四次科技革命浪潮》。
以下為刊登在人民郵電報(bào)上的評(píng)論文章全文(轉(zhuǎn)載自人民郵電報(bào))。
筑牢人工智能三大基礎(chǔ)環(huán)節(jié),迎接全球第四次科技革命浪潮
加強(qiáng)基礎(chǔ)研究,是實(shí)現(xiàn)高水平科技自立自強(qiáng)的迫切要求,是建設(shè)世界科技強(qiáng)國的必由之路。北京交通大學(xué)信息管理理論與技術(shù)國際研究中心(ICIR)研究認(rèn)為,目前我們正處于新一輪科技革命和產(chǎn)業(yè)變革的重要換檔期,從源頭和底層解決關(guān)鍵技術(shù)問題,成為我們應(yīng)對(duì)國際科技競爭、推動(dòng)構(gòu)建新發(fā)展格局、實(shí)現(xiàn)高質(zhì)量發(fā)展的迫切需要。縱觀近300年來工業(yè)發(fā)展歷史,人類社會(huì)已經(jīng)歷了蒸汽化、電氣化、信息化三次重大科技革命,大大提高了人的體力效率,極大地解放了生產(chǎn)力,現(xiàn)在正處于以提高人的腦力效率為目標(biāo)、以生成式人工智能為牽引的第四次工業(yè)革命時(shí)期,我們要筑牢生成式人工智能堅(jiān)實(shí)地基,在第四次科技革命浪潮中實(shí)現(xiàn)高水平自立自強(qiáng)。
第一次科技革命—機(jī)械化。第一次科技革命發(fā)端于18世紀(jì)后期的英國,以蒸汽機(jī)的發(fā)明和在廣泛應(yīng)用為標(biāo)志,生產(chǎn)工具發(fā)生了由手工形態(tài)向機(jī)器形態(tài)的質(zhì)變,使人們從繁重的體力勞動(dòng)中解放出來,人類社會(huì)開始走向機(jī)械化時(shí)代。
第二次科技革命—電氣化。第二次科技革命發(fā)端于19世紀(jì)的德國和美國,以電動(dòng)機(jī)、發(fā)電機(jī)和內(nèi)燃機(jī)的發(fā)明并在各行各業(yè)廣泛應(yīng)用為標(biāo)志,加速促進(jìn)了汽車和飛機(jī)等新型交通工具的誕生,人類社會(huì)進(jìn)入電氣化時(shí)代。
第三次科技革命—信息化。第三次科技革命發(fā)端于20世紀(jì)的美國,電子技術(shù)、微電子技術(shù)、原子能技術(shù)、信息技術(shù)、光學(xué)技術(shù)等相關(guān)技術(shù)不斷進(jìn)步,半導(dǎo)體晶體管、集成電路、激光、光纖、電磁波等技術(shù)產(chǎn)品快速迭代,各行各業(yè)的信息化應(yīng)用不斷深化,人類社會(huì)進(jìn)入信息化時(shí)代。
第四次科技革命—智能化。隨著ChatGPT的出現(xiàn),意味著一種可以逐步“解放大腦”的智能型生產(chǎn)工具已經(jīng)出現(xiàn),將有助于將人類從過去繁重的體力勞動(dòng)和重復(fù)性的腦力勞動(dòng)中解放出來,以ChatGPT為代表的生成式人工智能將引領(lǐng)人類社會(huì)第四次科技革命,成為推動(dòng)社會(huì)發(fā)展的新引擎。
生成式人工智能架構(gòu)由算力層、平臺(tái)層、算法層和應(yīng)用層四層架構(gòu)組成。其中,算力層主要指人工智能芯片,平臺(tái)層主要包括數(shù)據(jù)平臺(tái)和訓(xùn)練平臺(tái)等,算法層主要包括自然語言處理(NLP)、計(jì)算機(jī)視覺(CV)、音視頻、多模態(tài)等各種大模型和算法,應(yīng)用層則是面向各種應(yīng)用場景的人工智能專業(yè)服務(wù),如智能客服、聊天機(jī)器人、數(shù)字人、AI作畫、搜索引擎等。我國人工智能產(chǎn)業(yè)除在應(yīng)用層有一定的差異化競爭優(yōu)勢外,在算力層、平臺(tái)層和算法層等方面,都存在受制于人的“卡脖子”風(fēng)險(xiǎn)。
人工智能芯片是一種專門處理人工智能計(jì)算、應(yīng)用等任務(wù)的芯片,主要包括GPU、FPGA 、ASIC等不同形態(tài)。人工智能模型訓(xùn)練對(duì)算力的需求巨大,曾在2016擊敗圍棋九段高手李世石的“阿爾法狗”用了1202個(gè)CPU、176個(gè)GPU,約有800多萬核并行計(jì)算。而目前爆火的ChatGPT模型訓(xùn)練算力至少需要上萬顆英偉達(dá) GPU A100。
英偉達(dá)是全球人工智能芯片GPU的領(lǐng)導(dǎo)廠商,其產(chǎn)品占全球GPU市場份額高達(dá)70%,獨(dú)立顯卡領(lǐng)域市場份額更是高達(dá)86%。英偉達(dá)的GPUA100、 H100,以及Thor自動(dòng)駕駛芯片等,均處于全球絕對(duì)領(lǐng)先地位。而我國龍芯、景嘉微、華為海思、摩爾線程、璧仞科技、天數(shù)智芯等國產(chǎn)公司的人工智能芯片還落后很多,如景嘉微JM9231浮點(diǎn)性能只有8TFLOPS,是英偉達(dá)2000TFLOPS的Thor自動(dòng)駕駛芯片的1/250。此外,我國人工智能芯片在EDA設(shè)計(jì)工具、光刻膠等半導(dǎo)體材料、光刻機(jī)等半導(dǎo)體設(shè)備,以及先進(jìn)制程芯片加工制造等方面,受到的制約更多。
龐大的大數(shù)據(jù)樣本和卓越的算力平臺(tái)基礎(chǔ)設(shè)施也是人工智能大模型訓(xùn)練的基礎(chǔ)。OpenAI直到2019年微軟介入后,才開始全力利用微軟的大數(shù)據(jù)和大算力Aruze云平臺(tái)訓(xùn)練大模型。在大數(shù)據(jù)方面,GPT-2用于訓(xùn)練的數(shù)據(jù)集共有約40G、800萬篇源自Reddit上高贊的文章;GPT-3模型的訓(xùn)練數(shù)據(jù)集超過45TB;而 ChatGPT的編程能力源自微軟收購的 Github開源社區(qū)。在大算力方面,GPT-3.5微軟高帶寬集群Azure AI超算基礎(chǔ)設(shè)施上進(jìn)行訓(xùn)練,總算力達(dá)3640PF-days,即每秒一千萬億次計(jì)算,運(yùn)行3640天。
微軟Azure和谷歌GCP等云平臺(tái)具有數(shù)據(jù)量大質(zhì)高、算力穩(wěn)定強(qiáng)大的共同特點(diǎn),成為全球生成式人工智能訓(xùn)練的主要平臺(tái),如OpenAI、Meta、Hugging Face等世界領(lǐng)先的人工智能公司都選擇微軟Azure開展模型訓(xùn)練。我國的阿里云、騰訊云、華為云等在數(shù)據(jù)的覆蓋面和數(shù)據(jù)質(zhì)量方面差距較大,天翼云、移動(dòng)云、聯(lián)通云等運(yùn)營商云在算力技術(shù)方面差距較大。適合于大模型訓(xùn)練的云平臺(tái)也成為制約我國人工智能發(fā)展的主要瓶頸。
人工智能算法包括基礎(chǔ)算法和應(yīng)用算法兩種類型。目前幾乎全部的基礎(chǔ)算法模型都由斯坦福、哈佛、OpenAI、Meta、Hugging Face等美國機(jī)構(gòu)提出,應(yīng)用算法則幾乎完全開源,并且美國各大公司是人工智能開源代碼的主要貢獻(xiàn)者,對(duì)開源社區(qū)有絕對(duì)控制權(quán)。
我國人工智能產(chǎn)業(yè)幾乎完全依靠全球開源代碼和算法發(fā)展起來,缺乏自己的底層代碼和核心算法等做支撐,存在兩方面的突出問題:一是專業(yè)性和針對(duì)性不夠。由于訓(xùn)練框架固定、算法限制,很難達(dá)到用戶期望的結(jié)果,而且難以修改、完善、優(yōu)化算法;二是不掌握核心算法,被“卡脖子”的風(fēng)險(xiǎn)很大。開源代碼已不再具有中立性,已經(jīng)成為國與國競爭的經(jīng)濟(jì)武器,沒有自已的底層核心算法,人工智能產(chǎn)業(yè)的發(fā)展是不安全的。
先進(jìn)的人工智能芯片是生成式人工智能產(chǎn)業(yè)的基礎(chǔ),也是美國限制我國高科技發(fā)展的重點(diǎn)領(lǐng)域。我們要拋棄一切幻想,充分發(fā)揮新型舉國體制優(yōu)勢,充分調(diào)動(dòng)國內(nèi)外、全社會(huì)一切資源,充分利用財(cái)政、稅收、人才、資金、市場等所有手段,充分發(fā)揚(yáng)“兩彈一星”精神、航天精神、新時(shí)代北斗精神,聚焦關(guān)鍵環(huán)節(jié),實(shí)現(xiàn)人工智能芯片的突破,為我國人工智能產(chǎn)業(yè)發(fā)展奠定堅(jiān)實(shí)基礎(chǔ)。
我國現(xiàn)有云平臺(tái)性能、質(zhì)量和服務(wù)水平距離人工智能大模型訓(xùn)練還有很大差距。一方面,國家有關(guān)部門要加大引導(dǎo)不同類型云平臺(tái)企業(yè)的重組力度,實(shí)現(xiàn)優(yōu)勢互補(bǔ);另一方面,要鼓勵(lì)政企用戶多使用公有云,在大量用戶使用基礎(chǔ)上,提升云平臺(tái)的服務(wù)能力和水平。
我國人工智能產(chǎn)業(yè)界應(yīng)更加重視對(duì)基礎(chǔ)算法的研究。一是重新組建的科技部應(yīng)將基礎(chǔ)算法研究列為其重大突破方向,加大研究支持力度;二是工信部、農(nóng)業(yè)部、國家發(fā)改委等部門應(yīng)制定針對(duì)性的專門政策,開展人工智能項(xiàng)目研究時(shí)必須吸收一定比例的數(shù)學(xué)家加入;三是更多的數(shù)學(xué)家要主動(dòng)積極投身人工智能研究中,將邏輯、思維等新的數(shù)學(xué)技術(shù)融入算法模型。
“交大評(píng)論”公眾號(hào)由北京交通大學(xué)信息管理理論與技術(shù)國際研究中心(ICIR)主辦。全面關(guān)注全球政治、經(jīng)濟(jì)、社會(huì)發(fā)展熱點(diǎn)問題,重點(diǎn)聚焦以網(wǎng)信產(chǎn)業(yè)為核心的全球戰(zhàn)略新興產(chǎn)業(yè)發(fā)展動(dòng)態(tài),每周一期,周日定期更新。