2022年,習近平總書記在金磚國家領(lǐng)導人第十四次會晤期間深刻指出,“誰能把握大數(shù)據(jù)、人工智能等新經(jīng)濟發(fā)展機遇,誰就把準了時代脈搏”。
今天,隨著人工智能技術(shù)和應用的迅猛發(fā)展,我們對這一重要論斷的理解愈加深入。
2023年,以大模型、生成式人工智能為代表的通用人工智能技術(shù)在全球引起廣泛關(guān)注。
人工智能開始掀起洶涌澎湃的浪潮,正以前所未有的速度、廣度和深度變革經(jīng)濟社會發(fā)展模式。
對這次浪潮,有人稱之為“第四次工業(yè)革命”,有人稱之為“新一輪科技革命和產(chǎn)業(yè)變革”。無論如何表述,都意味著這將是一次對人類影響至深的巨變。
18世紀開始的以機械化為特征的第一次工業(yè)革命,19世紀開始的以電氣化為特征的第二次工業(yè)革命,20世紀開始的以信息化為特征的第三次工業(yè)革命,每次顛覆性的科技革新,都帶來社會生產(chǎn)力的大解放和生活水平的大躍升,從根本上改變?nèi)祟悮v史的發(fā)展軌跡。
如今,我們正在經(jīng)歷一場更大范圍、更深層次的科技革命和產(chǎn)業(yè)變革。大數(shù)據(jù)、人工智能等前沿技術(shù)不斷取得突破,新技術(shù)、新業(yè)態(tài)、新產(chǎn)業(yè)層出不窮。
2018年10月31日下午,十九屆中共中央政治局首次就人工智能發(fā)展現(xiàn)狀和趨勢舉行集體學習。習近平總書記深刻指出,“人工智能是新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動力量,加快發(fā)展新一代人工智能是事關(guān)我國能否抓住新一輪科技革命和產(chǎn)業(yè)變革機遇的戰(zhàn)略問題”。
能否抓住歷史機遇,能否把握時代脈搏、順應發(fā)展浪潮,事關(guān)政黨、國家、民族的興衰成敗。
“我們不能在這場科技創(chuàng)新的大賽場上落伍,必須迎頭趕上、奮起直追、力爭超越。”
“如果我們不識變、不應變、不求變,就可能陷入戰(zhàn)略被動,錯失發(fā)展機遇,甚至錯過整整一個時代。”
信息革命開始后,我們抓住了一個又一個歷史機遇。當新的舞臺拉開帷幕,中國能否積極主動適應和引領(lǐng)新一輪科技革命和產(chǎn)業(yè)變革,成為事關(guān)國家和民族發(fā)展的重大戰(zhàn)略問題。
2023年10月18日上午,國家主席習近平在北京人民大會堂出席第三屆“一帶一路”國際合作高峰論壇開幕式并發(fā)表題為《建設(shè)開放包容、互聯(lián)互通、共同發(fā)展的世界》的主旨演講。圖/新華社記者 王曄 攝
智能浪潮澎湃
2024年1月,瑞士小鎮(zhèn)達沃斯,世界各國的政商領(lǐng)袖相聚此地。今年,很多人的目光和話題都聚焦在一個關(guān)鍵領(lǐng)域——人工智能。
在這場素有“世界經(jīng)濟風向標”之稱的論壇上,“人工智能推動經(jīng)濟社會發(fā)展”成為四大關(guān)鍵議題之一。這個足以改變?nèi)祟愇磥淼募夹g(shù)領(lǐng)域,正成為一項全球性議程。
浪成于微瀾之間,人工智能從實驗室走向?qū)嶋H應用,經(jīng)歷了漫長的過程。
全球人工智能發(fā)展階段
這一場席卷全球的智能浪潮,發(fā)端于六十多年前。
1956年,美國小鎮(zhèn)漢諾斯,一群頂尖計算機科學家聚集在達特茅斯學院,討論一個不食人間煙火的主題,用機器來模仿人類學習以及其他方面的智能。
會議足足開了兩個月,雖然沒有達成普遍共識,但他們卻為爭論的內(nèi)容起了一個名字——人工智能(Artificial Intelligence),英文簡稱AI。
在科學家們實現(xiàn)宏偉目標的熱情中,人工智能很快嶄露頭角:首臺人工智能機器人Shakey誕生,世界上第一個聊天機器人ELIZA問世,機器定理證明、跳棋程序、人機對話等一批令人矚目的研究成果出現(xiàn)······發(fā)展初期的突破性進展讓人們對人工智能滿懷期望,隨之而來的卻是第一次失落。
重要技術(shù)的發(fā)展需要漫長的時間與恒久的耐心。20世紀70年代,在計算機內(nèi)存有限、處理速度不足等技術(shù)限制和過高期望的落差下,人工智能的發(fā)展陷入瓶頸。
人工智能的春天,隨著一類具有專門知識和經(jīng)驗的計算機系統(tǒng)——“專家系統(tǒng)”的出現(xiàn)而來。這一系統(tǒng),通過模擬人類專家的決策過程來解決特定的復雜問題。它實現(xiàn)了人工智能從理論研究走向?qū)嶋H應用、從一般推理策略探討轉(zhuǎn)向運用專門知識的重大突破,推動人工智能進入應用發(fā)展新高潮,這也被后來的學者們看作全球人工智能產(chǎn)業(yè)化的開端。
然而好景不長,應用領(lǐng)域狹窄、知識獲取困難、推理方法單一、難以與現(xiàn)有數(shù)據(jù)庫兼容······“專家系統(tǒng)”存在的問題逐漸暴露,人工智能再次陷入沉寂。
直到1997年,一場轟動世界的“人機大戰(zhàn)”讓人工智能重回公眾視野。
美國IBM(國際商業(yè)機器公司)推出的一秒鐘內(nèi)能計算兩億步棋、存儲了百年來幾乎所有頂級大師的開局和殘局棋譜的超級計算機——深藍,它在賽場上不知疲倦、沒有情緒地高速運算著,對弈的另一方是世界排名第一的國際象棋冠軍加里·卡斯帕羅夫,這位世界冠軍在決勝局僅僅走了19步,便失去耐心惱怒離場。
在彰顯智能的博弈游戲上,機器依靠編程“蠻力”將它的創(chuàng)造者遠遠拋在身后,并繼續(xù)在智能領(lǐng)域攻城略地。
2016年,又一場世紀大戰(zhàn)在韓國打響。人工智能阿爾法狗(AlphaGo)擊敗了世界圍棋九段頂尖棋手李世石。支撐阿爾法狗的是谷歌的超級服務(wù)器集群,它的“威力”則來自名為深度學習的人工智能算法。隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,計算性能上的基礎(chǔ)性障礙被逐漸克服,促進了深度學習算法的誕生。
在人工智能概念提出六十年后,深度學習算法如同一根火柴,劃亮了人工智能發(fā)展的拐點。
以深度神經(jīng)網(wǎng)絡(luò)為代表的人工智能技術(shù)飛速發(fā)展,大幅跨越了科學與應用之間的“技術(shù)鴻溝”,圖像分類、語音識別、知識問答、人機對弈、無人駕駛等人工智能技術(shù)實現(xiàn)了從“不能用、不好用”到“可以用”的技術(shù)突破,迎來爆發(fā)式增長的新階段。
“今天我們發(fā)布了ChatGPT。歡迎點擊這里與它聊天。”當?shù)貢r間2022年11月30日,美國開放人工智能研究中心(OpenAI)CEO山姆·奧特曼發(fā)布了這樣一條推文。
這款展示出超強“智能”的聊天機器人迅速在世界范圍內(nèi)成為現(xiàn)象級應用。上線僅僅兩個月,ChatGPT活躍用戶便突破一億。
一炮而紅,全球矚目,各國企業(yè)紛紛入場布局人工智能大模型,唯恐錯過時代的列車。
這個曾幾度頹然的科技產(chǎn)業(yè)領(lǐng)域,迎來了生成式人工智能的爆發(fā)時刻。人工智能正式踏入從專用人工智能向通用人工智能的躍遷征程。
峰回路轉(zhuǎn)見新晴。
在2024年的達沃斯,人們討論最多的就是如何抓住人工智能發(fā)展的重大機遇。
世界經(jīng)濟論壇創(chuàng)始人兼執(zhí)行主席克勞斯·施瓦布感慨地說,2023年年初,生成式人工智能技術(shù)還只是個“嬰孩”,不過一年時間,竟已長成“少年”。
微軟公司首席執(zhí)行官薩蒂亞·納德拉認為,類似于個人電腦廣泛普及的時期,世界即將迎來一個“神奇時刻”。
山姆·奧特曼表示:“人工智能對世界和工作的改變,遠比我們預想的要溫和得多。”他認為,通用人工智能將能夠執(zhí)行與人類相當或更高水平的任務(wù),并預測通用人工智能或在不久的將來問世。
······
站在達沃斯小鎮(zhèn)遠眺,遠山白雪皚皚,風景如畫,一如人們對世界未來前景的美好期待。
回溯人工智能近70年的發(fā)展歷程,三次飛躍帶來的熱潮都只是在歷史長河中拍擊起小浪花后,便又平淡退場。
技術(shù)創(chuàng)新就注定意味著創(chuàng)辟荒途,它的一面是對人工智能市場潛能激發(fā)的憧憬,另一面是與產(chǎn)業(yè)結(jié)合時的探索。當資本與人工智能技術(shù)相結(jié)合,真正的產(chǎn)業(yè)化生長才開始顯現(xiàn)。
自動駕駛汽車是人工智能開發(fā)領(lǐng)域中獲得資金最充裕的領(lǐng)域之一。2016年7月,美國通用汽車公司以超10億美元收購了一家研發(fā)出具備高自動化駕駛應用潛力系統(tǒng)的硅谷創(chuàng)業(yè)公司。2017年,英特爾公司以153億美元收購了掌握一系列圖像識別方面專利的以色列自動駕駛公司Mobileye。不斷優(yōu)化的計算機視覺技術(shù)讓巨頭企業(yè)對自動駕駛的未來充滿信心。
在人工智能產(chǎn)業(yè)化的漫長跋涉中,探索者們的腳步愈發(fā)堅定。
2017年,Transformer模型被谷歌團隊提出,獨有的注意力機制使其成為自然語言處理領(lǐng)域具有奠基性能的模型。一年后,谷歌公司提出BERT模型,通過雙向編碼器和Transformer模型,提高了長文本處理的效率,標志著自然語言處理領(lǐng)域進入了預訓練大模型時代;也是在這一年,OpenAI基于Transformer的Decorder(解碼器)部分開始建立GPT家族,為四年后的人工智能颶風式變革埋下伏筆。
2019年,微軟公司向一家位于舊金山的研究實驗室投資了10億美元,并因此成為這家實驗室的“獨家”云計算服務(wù)提供商。消息一經(jīng)公布,微軟股價大漲。后續(xù),微軟又追加了100億美元的投資。或許那個時候,微軟不會預料到,正是這筆頗具遠見的投資讓它成功地坐上了新一輪人工智能浪潮“頭班車”。
三年后,正是微軟投資的這家叫做OpenAI的實驗室發(fā)布了轟動全球的ChatGPT。這款擁有接近人類水平的語言理解和生產(chǎn)能力的人工智能產(chǎn)品的問世,推動生成式人工智能領(lǐng)域飛速發(fā)展。
新一輪人工智能浪潮以不可阻擋之勢席卷而來:網(wǎng)絡(luò)技術(shù)特別是互聯(lián)網(wǎng)技術(shù)的發(fā)展,加速了人工智能的創(chuàng)新研究,促使人工智能技術(shù)進一步走向?qū)嵱没?。深度學習和其他機器學習技術(shù)取得了顯著進步,在語音識別、圖像識別、自然語言處理等許多領(lǐng)域中達到或超越了人類的水平。成熟的人工智能技術(shù)正廣泛應用于醫(yī)療、金融、交通、農(nóng)業(yè)等各行各業(yè)。
在六十多年的技術(shù)研究和應用的奠基之上,人工智能真正進入產(chǎn)業(yè)化階段。
智能曙光正式從歷史的地平線上升騰而起,注定照耀并改變未來世界。
2023年12月,《自然》期刊公布了2023年度十大人物。人們注意到,榜單上除了科學領(lǐng)域的十位學者,還首次出現(xiàn)了一個非人類——ChatGPT。
《自然》特寫部主編表示,這一做法旨在承認“生成式人工智能給科學發(fā)展和進步帶來的巨大改變”。
將人工智能與人類重要科學人物并列,這一做法意味深長。
大國智能布局
大風起兮云飛揚。
習近平總書記深刻指出,“人工智能是引領(lǐng)這一輪科技革命和產(chǎn)業(yè)變革的戰(zhàn)略性技術(shù),具有溢出帶動性很強的‘頭雁’效應”。
具有多學科綜合、高度復雜特征的人工智能,早已展現(xiàn)出推動產(chǎn)業(yè)革新、提升經(jīng)濟效益和促進社會發(fā)展的巨大潛力。世界各國紛紛將發(fā)展人工智能作為提升國家競爭力、維護國家安全的重大戰(zhàn)略,力圖在全球科技中掌握主導權(quán)。
這是中國向數(shù)字未來挺進的步伐。
2014年,習近平總書記在中國科學院第十七次院士大會、中國工程院第十二次院士大會上指出,“3D打印、人工智能迅猛發(fā)展,制造機器人的軟硬件技術(shù)日趨成熟,成本不斷降低,性能不斷提升,軍用無人機、自動駕駛汽車、家政服務(wù)機器人已經(jīng)成為現(xiàn)實,有的人工智能機器人已具有相當程度的自主思維和學習能力······我們要審時度勢、全盤考慮、抓緊謀劃、扎實推進”。
2015年,國務(wù)院出臺《關(guān)于積極推進“互聯(lián)網(wǎng)+”行動的指導意見》,首次將“人工智能”納入重點任務(wù)。
2016年,“人工智能”被寫入“十三五”規(guī)劃綱要。
2017年,國務(wù)院發(fā)布《新一代人工智能發(fā)展規(guī)劃》強調(diào),“當前,我國國家安全和國際競爭形勢更加復雜,必須放眼全球,把人工智能發(fā)展放在國家戰(zhàn)略層面系統(tǒng)布局、主動謀劃,牢牢把握人工智能發(fā)展新階段國際競爭的戰(zhàn)略主動,打造競爭新優(yōu)勢、開拓發(fā)展新空間,有效保障國家安全”。
這是我國在人工智能領(lǐng)域發(fā)布的第一個系統(tǒng)部署文件,也是面向未來打造我國先發(fā)優(yōu)勢的一個指導性文件。
這份具有里程碑意義的規(guī)劃,對我國人工智能發(fā)展進行了戰(zhàn)略性部署,描繪了未來十幾年我國人工智能發(fā)展的宏偉藍圖,明確到2030年人工智能理論、技術(shù)與應用總體達到世界領(lǐng)先水平,成為世界主要人工智能創(chuàng)新中心。
中國人工智能產(chǎn)業(yè)政策制定的三個階段
日日行,不怕千萬里。
黨的十八大以來,前沿技術(shù)多次成為中共中央政治局集體學習的主題。
2018年10月31日下午,是十九屆中共中央政治局第九次集體學習。這一次,學習的主題聚焦“人工智能”,研究探討人工智能發(fā)展現(xiàn)狀和趨勢。
習近平總書記在主持學習時強調(diào),“加快發(fā)展新一代人工智能是我們贏得全球科技競爭主動權(quán)的重要戰(zhàn)略抓手,是推動我國科技跨越發(fā)展、產(chǎn)業(yè)優(yōu)化升級、生產(chǎn)力整體躍升的重要戰(zhàn)略資源”。
繼“人工智能”被寫入“十三五”規(guī)劃綱要后,2020年,人工智能在“十四五”規(guī)劃和2035年遠景目標綱要中的優(yōu)先級進一步提升,強調(diào)“培育壯大人工智能、大數(shù)據(jù)、區(qū)塊鏈、云計算、網(wǎng)絡(luò)安全等新興數(shù)字產(chǎn)業(yè)”。這是人工智能走進產(chǎn)業(yè)深處,為經(jīng)濟增長制造新動能的新的起跑點。
2018年,麥肯錫發(fā)布的研究報告指出,到2030年,人工智能新增經(jīng)濟規(guī)模將達13萬億美元,對世界經(jīng)濟貢獻和全球變革影響不亞于以蒸汽機為引領(lǐng)的第一次工業(yè)革命。
每一次科技革命都會帶來世界經(jīng)濟中心的轉(zhuǎn)移,都會引發(fā)世界格局的大調(diào)整。在這一次科技革命中,中國登上世界舞臺,甚至有望成為主角。
當前,我國經(jīng)濟已由高速增長階段轉(zhuǎn)向高質(zhì)量發(fā)展階段,正處在轉(zhuǎn)變發(fā)展方式、優(yōu)化經(jīng)濟結(jié)構(gòu)、轉(zhuǎn)換增長動力的攻關(guān)期,迫切需要新一代人工智能等重大創(chuàng)新添薪續(xù)力。
習近平總書記強調(diào):“把握數(shù)字化、網(wǎng)絡(luò)化、智能化融合發(fā)展契機,在質(zhì)量變革、效率變革、動力變革中發(fā)揮人工智能作用,提高全要素生產(chǎn)率。”
人工智能是引領(lǐng)未來的戰(zhàn)略性技術(shù),是新一輪科技革命和產(chǎn)業(yè)變革的核心驅(qū)動力,也被稱為形成新質(zhì)生產(chǎn)力的重要引擎。
以新一代人工智能為代表的數(shù)字技術(shù),具有滲透性、替代性、協(xié)同性等技術(shù)-經(jīng)濟特征,能夠廣泛應用于經(jīng)濟社會各行業(yè)各領(lǐng)域,不斷替代傳統(tǒng)要素并提高經(jīng)濟社會各環(huán)節(jié)、各要素間協(xié)同性,通過提升運行效率賦能千行百業(yè)。
中國人工智能的發(fā)展,是牢牢抓住變革機遇的故事。
黨的十八大以來,我國搶抓機遇,從國家戰(zhàn)略層面部署人工智能,取得顯著成績。目前,我國在人工智能領(lǐng)域發(fā)表的論文數(shù)量居世界首位;人工智能核心產(chǎn)業(yè)規(guī)模達5000億元,企業(yè)數(shù)量超4400家;工業(yè)質(zhì)檢、知識管理、自動駕駛、語音交互······各種人工智能應用正向縱深演進。
《中國網(wǎng)信》雜志發(fā)布的《全球人工智能產(chǎn)業(yè)概況》指出:中國產(chǎn)業(yè)政策強調(diào)人工智能技術(shù)在各個行業(yè)場景的創(chuàng)新應用及深度融合。
被列入國家戰(zhàn)略發(fā)展規(guī)劃后,人工智能在國內(nèi)迎來新一輪的成長。為搶占先機,國內(nèi)各地及時出臺政策,支持和推進人工智能產(chǎn)業(yè)發(fā)展。
作為國內(nèi)人工智能綜合實力最強的城市,北京關(guān)于人工智能的一舉一動都將成為外界觀察中國科技發(fā)展的風向標。
2024年1月,北京市政府工作報告指出,2024年將提升人工智能底層技術(shù)和基礎(chǔ)底座自主可控能力,推動人工智能模型對標國際先進水平,加快在政務(wù)、醫(yī)療、教育、工業(yè)、生活服務(wù)等領(lǐng)域應用,保持人工智能研發(fā)應用領(lǐng)先水平。
此前,僅在2023年5月,北京就發(fā)布了3項支持人工智能發(fā)展的政策文件:《北京市通用人工智能產(chǎn)業(yè)創(chuàng)新伙伴計劃》《北京市加快建設(shè)具有全球影響力的人工智能創(chuàng)新策源地實施方案(2023-2025年)》和《北京市促進通用人工智能創(chuàng)新發(fā)展的若干措施》。
一系列政策措施的推出,助推北京人工智能技術(shù)創(chuàng)新與產(chǎn)業(yè)發(fā)展進入新階段。
機器人送餐、面部識別打卡、聲控電梯、智慧泊車······北京中關(guān)村,作為創(chuàng)新發(fā)展的重要前沿地,無數(shù)個“第一”誕生于此。在人工智能掀起的新浪潮中,中關(guān)村同樣沒有缺席。據(jù)了解,中關(guān)村人工智能大模型數(shù)量占全國一半以上。
北京城東南,距離中關(guān)村30多公里的亦莊,一座“無人駕駛之城”正在崛起。在這里,你經(jīng)??梢栽诼飞峡吹礁鞣N各樣的無人車:無人出租車、無人快遞車、無人售賣車等。
不久前,北京宣布,正式在亦莊范圍內(nèi)開放智能網(wǎng)聯(lián)乘用車“車內(nèi)無人”商業(yè)化試點,企業(yè)在達到相應要求后即可在示范區(qū)面向公眾提供常態(tài)化的自動駕駛付費出行服務(wù)。
這意味著,在亦莊將能打到一輛“空無一人”的出租車,這種場景之前只在科幻電影中出現(xiàn)過。
這是北京人工智能發(fā)展的生動縮影。
截至2022年底,北京擁有人工智能核心企業(yè)1500家,占全國總量的29%,有30余家獨角獸企業(yè)。在我國獲批建設(shè)國家新一代人工智能開放創(chuàng)新平臺的24家企業(yè)中,10家總部在北京,成為我國人工智能產(chǎn)業(yè)發(fā)展的重要推動力量。
潮起東方。
2023年,一屆“智感”十足的亞運會令世界目光聚焦中國杭州。
“智能”作為杭州亞運會辦賽理念之一,貫穿辦賽、參賽、觀賽的方方面面。開幕式上,首個數(shù)字火炬手自錢塘江上踏浪花而來,一步步奔向“大蓮花”,點燃亞運圣火;“數(shù)字焰火”流光溢彩,全場觀眾齊聲高呼,為亞運會釋放最熾烈的熱情;吉利發(fā)射首顆保障亞運賽事的衛(wèi)星“亞運中國星”······智能化技術(shù)消弭時空界限,數(shù)字世界與現(xiàn)實世界同頻共振,東方古國再一次向八方來客張開盛情歡迎的懷抱。
萬涓成水,奔涌成潮。
硬核科技支撐智能亞運的背后,是浙江多年來加快人工智能產(chǎn)業(yè)布局的一次集中展示。
加快人工智能產(chǎn)業(yè)發(fā)展,浙江目標很明確——到2027年,人工智能核心技術(shù)取得重大突破,培育千億級人工智能融合產(chǎn)業(yè)集群10個、省級創(chuàng)新應用先導區(qū)15個、特色產(chǎn)業(yè)園區(qū)100個,人工智能企業(yè)數(shù)量超3000家,總營業(yè)收入突破1萬億元。
作為數(shù)字經(jīng)濟強省的浙江,正以數(shù)字經(jīng)濟“一號工程”為引擎,積極布局人工智能技術(shù)及相關(guān)產(chǎn)業(yè)發(fā)展,打造全國領(lǐng)先的人工智能產(chǎn)業(yè)發(fā)展高地。從區(qū)域布局來看,浙江省人工智能產(chǎn)業(yè)已初步形成以杭州為核心,向?qū)幉?、嘉興、紹興等環(huán)杭州灣地區(qū)集聚發(fā)展的態(tài)勢。
發(fā)達地區(qū)之外,其他地區(qū)是否還有可能在人工智能產(chǎn)業(yè)鏈上占據(jù)一席之地?
全球人工智能產(chǎn)業(yè)鏈圖譜(來源:中關(guān)村產(chǎn)業(yè)研究院)
人工智能的三大基石是數(shù)據(jù)、算力與算法,而數(shù)據(jù)標注的精確度往往決定著人工智能的智能程度,數(shù)量越多質(zhì)量越高的數(shù)據(jù),往往越能訓練出更“聰明”的模型。
數(shù)據(jù)標注領(lǐng)域有過一個“神話”——ImageNet項目。這個項目數(shù)據(jù)庫擁有超過1400萬張已被標注的圖片,其中,識別出的物體種類超過2萬種。
而在ImageNet項目背后,是來自167個國家的近5萬名數(shù)據(jù)標注員,他們足足花了三年時間才完成了全部圖片的標注。如今,ImageNet已經(jīng)成為世界上最大的圖像識別數(shù)據(jù)庫,被用于成千上萬個人工智能研究項目和實驗。
據(jù)數(shù)據(jù)公司IDC統(tǒng)計,全球每年生產(chǎn)的數(shù)據(jù)量將在2025年增至163ZB,其中,80%~90%都是原始數(shù)據(jù)。而這些原始數(shù)據(jù)只有經(jīng)過清洗和標注后變成標準化格式數(shù)據(jù),才能被人工智能所理解。
當人工智能卷起巨浪的時候,在中國的三四線城市,因為數(shù)據(jù)標注需求,有一群“人工智能訓練師”,以相對簡單的技能,與最前沿的技術(shù)產(chǎn)生了聯(lián)系。
中國新疆南部,皮山縣。2020年,在援疆省市安徽的支持下,皮山縣提出打造數(shù)字經(jīng)濟產(chǎn)業(yè)園,明確實施“1+3”產(chǎn)業(yè)脫貧攻堅戰(zhàn)略,其中,數(shù)據(jù)標注被放在了首要位置。
當?shù)卣疄楹螘?shù)據(jù)標注這樣一個小眾行業(yè)作為當?shù)禺a(chǎn)業(yè)振興的“龍頭”?
皮山縣擁有32萬人口,近6萬人的就業(yè)需求,相對穩(wěn)定用工2.2萬人,同時還有近10萬名學生的潛在就業(yè)需求。
而數(shù)據(jù)標注具有發(fā)展前景廣闊、就業(yè)需求量大、門檻相對低、制約因素少等特點。除了少部分標注工作需要較高知識水平才能完成之外,主要內(nèi)容的圖片和視頻標注只需要掌握計算機基本操作即可。
目前,皮山數(shù)字經(jīng)濟產(chǎn)業(yè)園已實現(xiàn)穩(wěn)定就業(yè)2100余人,脫貧人口用工占比40%以上,成為和田地區(qū)脫貧產(chǎn)業(yè)跨界蝶變的新領(lǐng)域。
在很多地方,數(shù)據(jù)標注產(chǎn)業(yè)在助力當?shù)財?shù)字產(chǎn)業(yè)發(fā)展的同時,也為更多普通人提供了轉(zhuǎn)型、就業(yè)的新機會。
在四川內(nèi)江,當?shù)卣當y手阿里巴巴合資成立了科技公司,建設(shè)包括數(shù)據(jù)標注在內(nèi)的數(shù)字服務(wù)外包產(chǎn)業(yè)基地。廣州天河區(qū)與科大訊飛共同在貴州大方縣設(shè)立智慧就業(yè)車間,為當?shù)匾椎胤鲐毎徇w群眾提供貴州方言標注等工作崗位。百度智能云人工智能數(shù)據(jù)標注產(chǎn)業(yè)基地陸續(xù)落地山東濟南、山西臨汾、重慶奉節(jié)等十余個地方,其中,截至2022年5月,百度(山西)人工智能基礎(chǔ)數(shù)據(jù)產(chǎn)業(yè)基地常駐專業(yè)數(shù)據(jù)標注師人數(shù)近5000人,累計產(chǎn)值超過5億元。
縱觀世界科技革命史,每一次人類將自身的能力賦予一個新工具時,總會推動時代向前邁進一大步。
在發(fā)展人工智能路徑選擇上,美國在原理性研究、理論性研究上更先進,而中國的優(yōu)勢在于,擁有廣闊的市場、海量的數(shù)據(jù),可以從場景、應用著手反哺底層技術(shù)發(fā)展。
當前,我國已經(jīng)建成全球最為龐大、生機勃勃的數(shù)字社會,成為全球最大網(wǎng)絡(luò)零售市場和最大移動支付市場。從幫助人們從繁重的機械勞動中解放出來,到與人類進行激烈辯論;從預測經(jīng)濟發(fā)展走向,到規(guī)劃人類未來生活圖景,智能化技術(shù)無聲無息滲透每一個角落,不斷為經(jīng)濟社會注入新動能。
“應充分利用我國超大規(guī)模市場背后的龐大用戶群體、多樣化數(shù)據(jù)資源、豐富應用場景和巨大市場空間等優(yōu)勢,鼓勵各方主體大膽探索創(chuàng)新應用并加速形成規(guī)?;瘧脙?yōu)勢。”專家表示。
新技術(shù)的真正繁榮,一定是應用的繁榮。
據(jù)了解,人工智能產(chǎn)業(yè)包括基礎(chǔ)層、技術(shù)層以及應用層。目前,我國已形成較成熟的人工智能生態(tài)。
在基礎(chǔ)層,也就是大數(shù)據(jù)、云計算、邊緣計算、智能芯片等領(lǐng)域,國內(nèi)領(lǐng)先的企業(yè)有百度、阿里巴巴、華為、寒武紀等代表企業(yè)。在技術(shù)層,我國在計算機視覺、智能語音、機器學習、自然語言處理等細分領(lǐng)域也誕生了諸如科大訊飛、云從科技、商湯科技、曠視科技等企業(yè)。在應用層,人工智能技術(shù)與其他領(lǐng)域結(jié)合的應用有智能機器人、智能終端、智能交通、公共安全等。其中,機器人領(lǐng)域有新松機器人、科沃斯機器人等代表性企業(yè),而眾多互聯(lián)網(wǎng)巨頭也紛紛入局智能終端的研發(fā)與物聯(lián)網(wǎng)生態(tài)的打造,包括華為、小米、聯(lián)想、中興等。
更大的想象空間在于,大模型催生出過去從來沒有過的AI原生應用。據(jù)悉,百度正在孵化全新的AI原生應用,現(xiàn)在百度每新增100行代碼,就有20行是人工智能生成的,而且這個比例還在快速增長中。這樣的AI原生應用,通過人機協(xié)同,幫助百度大幅度提升研發(fā)效率。
一年前,我們還很難想象,人工智能不僅可以寫劇本、繪畫、生成視頻,甚至還可以應用到辦公、醫(yī)療、法律等各個行業(yè),且正在以一往無前的態(tài)勢,不斷顛覆我們的生活。
ChatGPT引發(fā)的大模型創(chuàng)新熱浪持續(xù)涌動,一場比工業(yè)革命、信息革命更為深刻的人工智能革命近在眼前。
在OpenAI發(fā)布ChatGPT后,國內(nèi)企業(yè)緊跟其后也發(fā)布了一批大語言模型,如百度的文心一言,目前用戶規(guī)模突破一億;訊飛星火認知大模型上線14小時,用戶數(shù)量突破100萬;阿里云的通義千問已有超過20萬企業(yè)用戶申請接入;商湯商量語言大模型已與500多家客戶建立了深度合作;360公司的360智腦上線首周即獲300萬用戶超5000萬余次互動。此外,騰訊、字節(jié)跳動、京東等公司也都發(fā)布了自己的類GPT應用開發(fā)計劃;垂直行業(yè)企業(yè)也加速布局,如醫(yī)療人工智能企業(yè)醫(yī)渡科技正在研發(fā)醫(yī)療垂直領(lǐng)域大語言模型。
國內(nèi)企業(yè)之所以能夠快速跟進,離不開長期的深入探索研究。如百度的ERNIE大模型、阿里巴巴的M6大模型、華為的盤古大模型等,都是在ChatGPT發(fā)布之前就已經(jīng)存在的自然語言模型。
正是有了一定的積累,在OpenAI指明技術(shù)路線之后,國內(nèi)企業(yè)才能迅速跟進并發(fā)布自己的產(chǎn)品。
據(jù)科技部新一代人工智能發(fā)展研究中心于2023年5月發(fā)布的《中國人工智能大模型地圖研究報告》顯示,中國研發(fā)的大模型數(shù)量排名全球第二,僅次于美國;目前,中國10億參數(shù)規(guī)模以上的大模型已發(fā)布79個。
移動互聯(lián)網(wǎng)時代,中國誕生了微信、抖音這樣的國民級App,人工智能時代,下一個超級應用會出現(xiàn)在哪里?
在專家看來,“繼2023年百模大戰(zhàn)之后,2024年將成為人工智能大模型應用落地的關(guān)鍵一年。目前來看,人工智能大模型技術(shù)的‘殺手級’應用場景尚未誕生且發(fā)展態(tài)勢并未特別明晰。但我個人認為,制造業(yè)或?qū)⑹钦Q生人工智能大模型‘殺手級’應用的重要場景之一。”
部署前沿技術(shù),催生未來產(chǎn)業(yè)。
2024年1月29日,工業(yè)和信息化部等七部門聯(lián)合印發(fā)《關(guān)于推動未來產(chǎn)業(yè)創(chuàng)新發(fā)展的實施意見》,提出要打造人形機器人、量子計算機、新型顯示、腦機接口等十大標志性產(chǎn)品。
近年來,我國機器人領(lǐng)域基礎(chǔ)研發(fā)能力迅速提升,市場應用加速拓展,功能種類更加豐富,產(chǎn)業(yè)規(guī)模持續(xù)壯大。最新數(shù)據(jù)顯示,當前我國工業(yè)機器人銷量已占全球一半以上,連續(xù)10年居世界首位。“機器人+行業(yè)應用”也在不斷深化,工業(yè)機器人應用覆蓋了國民經(jīng)濟的60個行業(yè)大類和168個行業(yè)中類。
制造業(yè)則是人工智能加快形成新質(zhì)生產(chǎn)力最重要的領(lǐng)域之一。
我國以大模型為代表的人工智能發(fā)展呈現(xiàn)出技術(shù)創(chuàng)新快、應用滲透強、國際競爭激烈等特點,正加速與制造業(yè)深度融合,深刻改變制造業(yè)生產(chǎn)模式和經(jīng)濟形態(tài),展現(xiàn)出強大的賦能效應,有力推動了實體經(jīng)濟數(shù)字化、智能化、綠色化轉(zhuǎn)型。目前,我國已建設(shè)近萬家數(shù)字化車間和智能工廠。
改變正在悄然發(fā)生。
根據(jù)畢馬威與中關(guān)村產(chǎn)業(yè)研究院聯(lián)合發(fā)布的報告,截至2023年6月底,中國人工智能企業(yè)數(shù)量緊隨美國之后,在全球占比達到16.0%。在全球人工智能獨角獸中,中美也平分秋色。從全球人工智能領(lǐng)域風險投資金額來看,中國以12%的占比位居世界第二。
“人工智能近10年呈現(xiàn)爆發(fā)式增長,形成了中美兩家獨大的格局。”專家表示,我國的經(jīng)濟社會為發(fā)展人工智能產(chǎn)業(yè)提供了優(yōu)越的條件,包括廣泛的應用場景、活躍的國內(nèi)外投資、數(shù)據(jù)資源和積極的政策支持。
在這一次新科技革命浪潮中,中國沒有錯過,而是牢牢把握住了發(fā)展機遇。
據(jù)海外專業(yè)調(diào)研機構(gòu)Tortoise Intelligence發(fā)布的人工智能指數(shù),中國成為人工智能綜合排名第二的國家,并在發(fā)展指標和政府策略指標兩方面位居首位。在人工智能賽道,我國昂首進入全球前列。
中國,正以堅定的步伐,闊步邁向世界科技強國、網(wǎng)絡(luò)強國,不斷攀越新的高峰。
共赴智能未來
大數(shù)據(jù)和人工智能技術(shù)的廣泛應用讓每個人都可以成為數(shù)字化的個體——我們可以被追蹤、被收集,也可以被分析、被輸出。
我們該如何穿越技術(shù)發(fā)展中的這片風險地帶?
一些走在科技前沿的人比以往都更加謹慎:馬斯克曾經(jīng)幾次公開表示,人工智能有可能成為人類文明的最大威脅?;艚鹨苍鴵鷳n地表示,強大的人工智能的崛起可能是人類遇到的最好的事情,也可能是最壞的事情,但我們還不知道答案。
著名美國科幻作家阿西莫夫在其文學作品《我,機器人》中提出了機器人三定律:“第一條:機器人不得傷害人類個體,不能目睹人類受到傷害不干預;第二條:機器人必須服從他的命令,命令與第一條沖突時除外;第三條:機器人在不違反第一、第二條的原則下,要保護自己的安全。”
科幻作家筆下的故事在數(shù)十年后走向現(xiàn)實。
2018年“劍橋分析”事件震驚中外,近8700萬名用戶的個人信息被違法用于影響政治選舉,危及國家政治安全;英國脫歐公投期間,聊天機器人Brexit Bot被用來傳播關(guān)于脫歐益處和留歐風險的虛假信息······
“2024年將是‘深度偽造’的大選年嗎?”微軟全國廣播公司(MSNBC)在報道中發(fā)出了這樣的疑問。前不久,美國部分選民接到了自稱是美國總統(tǒng)拜登的一通來電。
這通電話的生成來自一家人工智能初創(chuàng)公司的技術(shù)“深度偽造”,再度引發(fā)了美國社會關(guān)于人工智能風險的討論。
大數(shù)據(jù)和人工智能通過了解我們的想法和喜好給我們帶來了便利,但也在冥冥之中調(diào)試我們的感官,重塑我們對世界的認識。
在ChatGPT發(fā)布的一年后,谷歌決定“絕地反擊”。當?shù)貢r間2023年12月6日,谷歌公司宣布上線大模型Gemini系列。
然而,發(fā)布不久,就有中國網(wǎng)民發(fā)現(xiàn),在對該系列之一的Gemini Pro進行測試問它“你是誰”時,Gemini Pro回答說是百度文心大模型。
這種“胡言亂語”并非偶然,中國某科技自媒體在和它進行中文對話時,發(fā)現(xiàn)Gemini Pro確實表示自己是百度文心大模型。但切換成英文與之交流,它就恢復到谷歌大模型的身份認知,表現(xiàn)正常。在追問下,Gemini承認有訓練語料來自百度。
問題曝光后,谷歌技術(shù)人員很快修復好了漏洞,但這背后卻暴露出高質(zhì)量中文語料的稀缺:谷歌使用了國內(nèi)大模型生成的一些數(shù)據(jù)并且沒有仔細篩選。相較于英語,可供大模型訓練的高質(zhì)量中文語料數(shù)據(jù)集嚴重不足,在常用的開源數(shù)據(jù)集Common Crawl中,中文僅占5%。
豐富、高質(zhì)量的語料是人工智能研發(fā)必要的數(shù)據(jù)基礎(chǔ)。人工智能某種意義上來說是一張“白紙”,“喂”給它怎樣的數(shù)據(jù),“白紙”就會呈現(xiàn)怎樣的色彩。
公開標注數(shù)據(jù)集測試表明,ChatGPT在價值觀層面偏向西方,生成內(nèi)容中存在大量對中國的偏見言論,加之ChatGPT在中文知識和常識問答上很容易出現(xiàn)錯誤,而且會使用流暢的句子對編造的虛假事實進行闡述,對信息來源受限的群體來說具有一定迷惑性,極易成為部分國家針對我國制造“認知陷阱”的工具。
如何篩選出“好”的語料成為值得我們思考的關(guān)鍵問題。
2023年10月,國內(nèi)首個專門面向生成式人工智能安全領(lǐng)域的規(guī)范意見稿——《生成式人工智能服務(wù)安全基本要求》(征求意見稿)發(fā)布,給出包括語料安全在內(nèi)的生成式人工智能服務(wù)在安全方面的基本要求。
征求意見稿提出,應對各來源語料進行安全評估,單一來源語料內(nèi)容中含違法不良信息超過5%的,應將該來源加入黑名單。同時要求,按照我國網(wǎng)絡(luò)安全相關(guān)法律要求阻斷的信息,不應作為訓練語料。
科技發(fā)展高歌猛進,在驚濤駭浪中,人們渴望知曉航向。
中國公布《生成式人工智能服務(wù)管理暫行辦法》,聯(lián)合國成立人工智能高級別咨詢機構(gòu),全球首屆人工智能安全峰會發(fā)布《布萊奇利宣言》,歐盟就《人工智能法案》達成協(xié)議······一年多來,各方對人工智能治理緊迫性的認識在深化,相關(guān)行動在提速。
但面對這樣一項必將深刻影響人類文明發(fā)展軌跡的顛覆性技術(shù),治理挑戰(zhàn)仍廣泛存在,更有效地協(xié)調(diào)全球合作是當務(wù)之急。
習近平總書記指出:“人工智能、虛擬現(xiàn)實等新技術(shù)日新月異,虛擬經(jīng)濟與實體經(jīng)濟的結(jié)合,將給人們的生產(chǎn)方式和生活方式帶來革命性變化。這種變化不會一蹴而就,也不會一帆風順,需要各國合力推動,在充分放大和加速其正面效應的同時,把可能出現(xiàn)的負面影響降到最低。”
在2023年一年時間內(nèi),中國《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》施行、《生成式人工智能服務(wù)管理辦法(征求意見稿)》發(fā)布、《生成式人工智能服務(wù)管理暫行辦法》備案開始施行、國內(nèi)大模型首批通過《生成式人工智能服務(wù)管理暫行辦法》······一系列規(guī)范人工智能技術(shù)發(fā)展和應用的相關(guān)法規(guī)陸續(xù)出臺,展現(xiàn)出我國在人工智能安全治理方面的高度重視與積極作為。
2023年4月28日,中共中央政治局召開會議,分析研究當前經(jīng)濟形勢和經(jīng)濟工作。會議提出,要重視通用人工智能發(fā)展,營造創(chuàng)新生態(tài),重視防范風險。
發(fā)展和安全,一對辯證關(guān)系,始終貫穿于我們黨治國理政的偉大實踐之中。
一直以來,我國在人工智能安全治理方面積極作為,高度重視人工智能技術(shù)的發(fā)展與安全治理,并通過制定政策法規(guī)來規(guī)范人工智能技術(shù)的發(fā)展和應用,強調(diào)技術(shù)應用的合法合規(guī)性以及保護用戶數(shù)據(jù)和隱私的重要性。
“不發(fā)展是最大的不安全。法律的作用不僅是規(guī)范,還有促進。”專家表示。
當前,世界百年未有之大變局加速演進,局部沖突和動蕩頻發(fā),世界經(jīng)濟復蘇動力不足。同時,各國人民求和平、謀發(fā)展、促合作的愿望更加強烈。
“當前,新一輪科技革命和產(chǎn)業(yè)變革深入發(fā)展,人類要破解共同發(fā)展難題,比以往任何時候都更需要國際合作和開放共享。”2023年5月25日,習近平總書記向2023中關(guān)村論壇致賀信強調(diào)。
一段時間以來,個別大國企圖壟斷人工智能發(fā)展優(yōu)勢,熱衷于搞“小院高墻”“脫鉤斷鏈”,甚至把意識形態(tài)偏見引入人工智能治理,打造封閉排他的“小圈子”,惡意阻撓他國人工智能發(fā)展。
“科技成果應該造福全人類,而不應該成為限制、遏制其他國家發(fā)展的手段。”歷史和現(xiàn)實一再表明,違背科技發(fā)展規(guī)律,損害全球共同利益的做法,最終只會堵自己的路。
創(chuàng)新發(fā)展、合作共贏,是人間正道、大勢所趨。
中國始終愿意在人工智能領(lǐng)域與各國共推發(fā)展、共護安全、共享成果。
2023年10月,習近平總書記在第三屆“一帶一路”國際合作高峰論壇開幕式上的主旨演講中宣布中方將提出全球人工智能治理倡議,強調(diào)愿同各國加強交流和對話,共同促進全球人工智能健康有序安全發(fā)展。
智能新時代正加速到來,全球人工智能發(fā)展治理任重道遠。中國正同國際社會一道,進一步加強人工智能領(lǐng)域的國際合作,深入推進全球范圍內(nèi)人工智能技術(shù)交流、知識分享和資源整合,以期為全人類帶來更多的福祉和發(fā)展機會,努力推動實現(xiàn)人工智能美好未來。