摘 要:數(shù)據(jù)作為人工智能和大數(shù)據(jù)時代的核心要素,將對人類社會發(fā)展帶來深刻影響。隨著數(shù)據(jù)容量的快速積累、算力和數(shù)據(jù)質(zhì)量的不斷提高,如何使用和管理數(shù)據(jù)成為第四次工業(yè)革命中一個重要的課題。人工智能背景下的數(shù)據(jù)治理,需要準(zhǔn)確把握挖掘數(shù)據(jù)潛在價值、降低數(shù)據(jù)利用成本和控制數(shù)據(jù)隱含風(fēng)險的總目標(biāo),并從治理原則、制度體系和場景管理等方面著力,推動數(shù)據(jù)治理實踐的落地落實。
關(guān)鍵詞:數(shù)據(jù)治理 人工智能 大數(shù)據(jù)
【中圖分類號】F49 【文獻(xiàn)標(biāo)識碼】A
數(shù)據(jù)治理的背景
人類利用數(shù)據(jù)的歷史非常悠久,很早就掌握利用數(shù)字記錄、管理生產(chǎn)生活的能力。19世紀(jì)初,一些博物學(xué)家在私人資助下環(huán)游世界搜集動植物標(biāo)本、觀測天文現(xiàn)象,并通過規(guī)?;涗洈?shù)據(jù)從紛繁復(fù)雜的事實中歸納科學(xué)發(fā)現(xiàn)。由此,數(shù)據(jù)開始真正被社會關(guān)注、規(guī)范和監(jiān)管,并逐漸被制度化為社會商品。歐洲的霍亂疫情使得人們開始搜集、統(tǒng)計疾病傳播的數(shù)據(jù),并發(fā)明了可視化技術(shù)和數(shù)據(jù)分析方法。進(jìn)入20世紀(jì)之后,貿(mào)易需求促進(jìn)了測量和計算方法的發(fā)展,統(tǒng)計學(xué)成為一門獨立學(xué)科,為應(yīng)對數(shù)據(jù)分析的需求,軍事投入也推動了計算科學(xué)的進(jìn)步以及數(shù)據(jù)傳輸技術(shù)的發(fā)展。今天,互聯(lián)網(wǎng)公司如Facebook、亞馬遜、騰訊、阿里巴巴等管理著數(shù)十億人的工作、娛樂、消費等數(shù)據(jù),我們現(xiàn)在所談?wù)摰臄?shù)據(jù),已經(jīng)是人工智能時代海量的數(shù)據(jù)資源——大數(shù)據(jù)??v觀人類利用數(shù)據(jù)的歷史,在制度、技術(shù)和經(jīng)濟(jì)發(fā)展的交織作用下,數(shù)據(jù)的規(guī)模、價值和影響不斷擴(kuò)大,影響日益深遠(yuǎn)。如今,數(shù)據(jù)作為一種生產(chǎn)要素,作為信息時代的“石油”,已然取得與農(nóng)業(yè)時代的土地、工業(yè)時代的資本同樣重要,甚至是更加突出的地位。
數(shù)據(jù)治理包括利用數(shù)據(jù)進(jìn)行治理和對數(shù)據(jù)進(jìn)行治理兩個含義。前者將數(shù)據(jù)作為一種技術(shù)手段應(yīng)用到治理實踐中,與電子政務(wù)、電子商務(wù)等密切相關(guān),目前已經(jīng)有很多的研究;后者則將數(shù)據(jù)視作治理對象,關(guān)注數(shù)據(jù)特性、數(shù)據(jù)應(yīng)用和數(shù)據(jù)管理。在人工智能和大數(shù)據(jù)快速發(fā)展的背景下,對這方面概念、理論和政策的梳理還比較欠缺,應(yīng)是未來研究的重要方向。數(shù)據(jù)治理的兩個含義相互聯(lián)系,但并不沖突。一方面,政務(wù)APP、一站式服務(wù)等改革舉措通過讓“讓數(shù)據(jù)多跑路、讓群眾少跑腿”,極大提高了公共服務(wù)的效率和滿意度。另一方面,無論是在公共部門還是私營部門,數(shù)據(jù)的應(yīng)用和管理問題,已經(jīng)日益成為現(xiàn)實生活中至為重要的議題。
數(shù)據(jù)治理的必要性
隨著大數(shù)據(jù)、人工智能、共享經(jīng)濟(jì)、平臺經(jīng)濟(jì)等新技術(shù)、新業(yè)態(tài)的迅速發(fā)展,人們在社交網(wǎng)絡(luò)中展現(xiàn)出的個人行為、性格偏好、興趣愛好都可以被數(shù)據(jù)化,通過特定算法生成“數(shù)據(jù)畫像”,每個人都將變成沒有隱私的“透明人”。在沒有外部規(guī)制的條件下,商家可以根據(jù)消費者的個人偏好向其推薦特定商品或服務(wù),并根據(jù)消費者的收入水平、消費傾向“因人定價”,通過“大數(shù)據(jù)殺熟”等方式實現(xiàn)利潤最大化。同時,互聯(lián)網(wǎng)平臺企業(yè)存在用戶數(shù)據(jù)泄露隱患,導(dǎo)致個人隱私保護(hù)更加困難。僅在 2018年Facebook就發(fā)生三次嚴(yán)重的數(shù)據(jù)泄露事件。以上問題表明,數(shù)據(jù)在成為一項重要的社會資源的同時,其使用和監(jiān)管也面臨很多新的挑戰(zhàn),需要我們從數(shù)據(jù)保護(hù)、獲取和利用等多維視角,以及法律、制度和政策等不同層面對其進(jìn)行系統(tǒng)研究,以便更好地開發(fā)其價值,同時控制其潛在的風(fēng)險。
數(shù)據(jù)治理的目標(biāo)
無論是當(dāng)前的理論研究還是實踐探索,尚未形成數(shù)據(jù)治理的準(zhǔn)確定義。一般認(rèn)為數(shù)據(jù)治理是對數(shù)據(jù)行使管理權(quán)力的過程,具體而言有四個方面的內(nèi)涵。首先,數(shù)據(jù)治理是一個跨功能的活動,需要跨越不同的功能邊界和學(xué)科領(lǐng)域;其次,數(shù)據(jù)治理將數(shù)據(jù)視作一種重要的戰(zhàn)略資產(chǎn),為管理數(shù)據(jù)提供一種結(jié)構(gòu)化和形式化的框架;第三,數(shù)據(jù)治理回答了數(shù)據(jù)管理需要什么樣的決策,如何形成這種決策,誰有權(quán)做出這種決策等問題;最后,數(shù)據(jù)治理需要建立數(shù)據(jù)政策、標(biāo)準(zhǔn)和流程,還需要監(jiān)管合規(guī),確保政策和標(biāo)準(zhǔn)能夠執(zhí)行。
數(shù)據(jù)治理的目標(biāo)是充分挖掘數(shù)據(jù)潛在的價值,同時盡可能降低數(shù)據(jù)利用的成本和控制可能產(chǎn)生的風(fēng)險,這三者之間需要保持統(tǒng)籌與平衡,不可偏廢任何一方。數(shù)據(jù)治理在宏觀層面包括國際、國內(nèi)和有關(guān)部門的法律、政策和條例;中觀層面包括組織的數(shù)據(jù)治理,以實現(xiàn)數(shù)據(jù)的價值和防范風(fēng)險為目標(biāo);在微觀層面關(guān)注日常數(shù)據(jù),依靠相關(guān)專業(yè)人士處理數(shù)據(jù)信息。按照治理對象種類的不同,可以將數(shù)據(jù)區(qū)分為以下大類:科研數(shù)據(jù)、公共數(shù)據(jù)、商業(yè)行為數(shù)據(jù)和個人隱私數(shù)據(jù)等,而不同類型的數(shù)據(jù),在不同應(yīng)用場景下,需要不同的治理規(guī)則。
數(shù)據(jù)治理的實現(xiàn)路徑
本質(zhì)上看,數(shù)據(jù)治理是追求公共利益最大化的社會治理過程,因此,首先需要明確數(shù)據(jù)治理的基本原則。數(shù)據(jù)的所有權(quán)屬于誰?數(shù)據(jù)應(yīng)該由誰來管理?數(shù)據(jù)使用中如何保障個人權(quán)益?哪些數(shù)據(jù)需要促進(jìn)開放和流動?目前這一系列問題都需要進(jìn)一步討論。
其次,根據(jù)數(shù)據(jù)保護(hù)的實際情況,加強(qiáng)數(shù)據(jù)治理的制度建設(shè)。歐盟于2018年出臺了被視為“史上最嚴(yán)”的數(shù)據(jù)保護(hù)法規(guī)——《通用數(shù)據(jù)保護(hù)條例》(GDPR),對個人信息的保護(hù)達(dá)到前所未有的高度,將數(shù)據(jù)披露與使用的權(quán)利賦予個人,同時明確數(shù)據(jù)控制者與數(shù)據(jù)處理者有保護(hù)個人數(shù)據(jù),以及加工處理以防止泄密的義務(wù)。然而,不少學(xué)者認(rèn)為歐盟的這種過度保護(hù)措施,會使其喪失數(shù)字產(chǎn)業(yè)未來的競爭力。對此,中國應(yīng)當(dāng)辯證地學(xué)習(xí)和借鑒歐盟的經(jīng)驗,并結(jié)合中國發(fā)展實際,加快構(gòu)建隱私權(quán)保護(hù)的法律,明確數(shù)據(jù)權(quán)屬以及隱私保護(hù)規(guī)則,在產(chǎn)業(yè)發(fā)展與人民權(quán)益保護(hù)之間建立平衡。
再次,數(shù)據(jù)治理是政府、企業(yè)和用戶等多元主體對數(shù)據(jù)采取聯(lián)合行動的過程,如何協(xié)調(diào)利益訴求不一致甚至相互沖突的多元主體是數(shù)據(jù)治理的關(guān)鍵。鑒于數(shù)據(jù)多元主體的現(xiàn)狀,需要構(gòu)建“多方參與,分層監(jiān)管,合理擔(dān)責(zé)”的治理體系。促進(jìn)政府部門開放相應(yīng)的數(shù)據(jù),打通不同部門之間“數(shù)據(jù)孤島”。與此同時,政府與平臺企業(yè)可以聯(lián)合,也可以委托第三方機(jī)構(gòu)建立違法內(nèi)容共享數(shù)據(jù)庫,比如假冒侵權(quán)數(shù)據(jù)庫、低俗圖片和視頻庫、違法信息數(shù)據(jù)庫、判定規(guī)則數(shù)據(jù)庫等,勾勒出常見違法內(nèi)容的主要特征,便于平臺企業(yè)利用人工智能等技術(shù)手段自動識別和判定疑似違法內(nèi)容,更好履行審查義務(wù)。
最后,根據(jù)數(shù)據(jù)種類的不同,需要做到精細(xì)化分類管理的要求,將宏觀數(shù)據(jù)治理規(guī)則精確體現(xiàn)到具體的應(yīng)用場景中,充分發(fā)揮數(shù)據(jù)的作用,挖掘其價值。應(yīng)當(dāng)注意的是,數(shù)據(jù)的有效治理離不開數(shù)據(jù)技術(shù)的幫助,新興技術(shù)在發(fā)展過程中產(chǎn)生的問題還需要技術(shù)本身來解決。例如,在設(shè)計數(shù)據(jù)共享機(jī)制時,可以對數(shù)據(jù)進(jìn)行分類,明確哪些數(shù)據(jù)在何種情況下可以進(jìn)行共享,以及相應(yīng)的保護(hù)和懲罰措施。同時,把數(shù)據(jù)的有限開放和完全開放相結(jié)合。對于涉及個人信息的數(shù)據(jù),可以通過開設(shè)許可證或開放數(shù)據(jù)接口進(jìn)行驗證等方式有限地開放。而對于那些不涉及個人隱私的公共服務(wù)數(shù)據(jù),比如環(huán)保、交通、氣象等領(lǐng)域數(shù)據(jù),則應(yīng)當(dāng)在保證安全的基礎(chǔ)上全面開放。
總體而言,物聯(lián)網(wǎng)、人工智能、大數(shù)據(jù)等新興技術(shù)的發(fā)展加速了人類文明數(shù)字化的進(jìn)程,同時給數(shù)據(jù)治理帶來了新問題和新挑戰(zhàn)。為了充分挖掘大規(guī)模數(shù)據(jù)應(yīng)用的經(jīng)濟(jì)社會價值,降低數(shù)據(jù)利用的成本和風(fēng)險,亟需構(gòu)建全面、合理、平衡的數(shù)據(jù)治理體系,在各利益相關(guān)者取得共識的基礎(chǔ)上明確數(shù)據(jù)治理的原則,建立數(shù)據(jù)治理的制度和法律體系,協(xié)調(diào)政府、企業(yè)和用戶在數(shù)據(jù)使用中的關(guān)系,分類管理數(shù)據(jù)應(yīng)用的具體場景和環(huán)境。
【本文作者為清華大學(xué)公共管理學(xué)院教授、清華大學(xué)人工智能國際治理研究院副院長;清華大學(xué)公共管理學(xué)院博士后吳培熠對本文亦有貢獻(xiàn)】
責(zé)編:羅 婷 / 王茂磊
聲明:本文為《國家治理》周刊原創(chuàng)內(nèi)容,任何單位或個人轉(zhuǎn)載請回復(fù)國家治理周刊微信號獲得授權(quán),轉(zhuǎn)載時務(wù)必標(biāo)明來源及作者,否則追究法律責(zé)任。