“數(shù)據(jù)治理”如何打造升級(jí)版
徐鵬飛 繪
2013年3月德國(guó)漢諾威IT展戴爾公司展臺(tái),工作人員向參觀者介紹大型服務(wù)器。新華社發(fā)
在大數(shù)據(jù)時(shí)代,對(duì)原有規(guī)范的修修補(bǔ)補(bǔ)已經(jīng)滿足不了需要,也不足以抑制大數(shù)據(jù)帶來(lái)的風(fēng)險(xiǎn)。法律需要界定數(shù)據(jù)的權(quán)益,需要界定數(shù)據(jù)的類型(哪些是隱私,哪些涉及國(guó)家安全等),這樣數(shù)據(jù)的流通就有法可依。作為個(gè)人,要明白“有行動(dòng)就可能產(chǎn)生數(shù)據(jù)”,當(dāng)有些行為涉及隱私時(shí)需要謹(jǐn)慎。
杜小勇(中國(guó)人民大學(xué)信息學(xué)院院長(zhǎng))
肯尼思·丘基爾(《經(jīng)濟(jì)學(xué)家》雜志數(shù)據(jù)編輯)
黃智生(荷蘭阿姆斯特丹自由大學(xué)計(jì)算機(jī)系高級(jí)研究員)
朱揚(yáng)勇(復(fù)旦大學(xué)數(shù)據(jù)科學(xué)研究中心主任)
維克托·邁爾·舍恩伯格(《大數(shù)據(jù)時(shí)代》作者)
法迪·謝哈德(互聯(lián)網(wǎng)名稱與數(shù)字地址分配機(jī)構(gòu)總裁)
斯蒂夫·帕爾默(美國(guó)IT咨詢公司Avanade商業(yè)情報(bào)部副總裁)
問(wèn)題一:
大數(shù)據(jù)屬于誰(shuí)?
杜小勇:獲取、記錄數(shù)據(jù)需要耗費(fèi)資源,因此,數(shù)據(jù)也就具有了資產(chǎn)的屬性。在大數(shù)據(jù)出現(xiàn)以前,數(shù)據(jù)依附于具體業(yè)務(wù)而存在,人們更多的關(guān)注在使用數(shù)據(jù)的軟件系統(tǒng)上。沒(méi)有軟件的使用,就沒(méi)有數(shù)據(jù)的價(jià)值。當(dāng)時(shí)有關(guān)數(shù)據(jù)的歸屬問(wèn)題并不那么突出。在大數(shù)據(jù)時(shí)代,數(shù)據(jù)可以作為一種獨(dú)立的存在,其“資產(chǎn)”性價(jià)值越來(lái)越引起人們的重視。
數(shù)據(jù)是物理世界客觀事物性質(zhì)、狀態(tài)的反映,這是客觀存在。你去收集了,有特定的表達(dá)形式,自然特定格式的數(shù)據(jù)就是你的。個(gè)人、企業(yè)、政府、組織都可以合法地去收集數(shù)據(jù)。如果違反了現(xiàn)有法律收集了數(shù)據(jù),自然也是非法擁有,數(shù)據(jù)財(cái)產(chǎn)也是非法的了。
肯尼思·丘基爾:個(gè)人、企業(yè)、政府等都可能是數(shù)據(jù)的擁有者。比如,移動(dòng)運(yùn)營(yíng)商收集個(gè)人使用全球定位系統(tǒng)的定位數(shù)據(jù)。這種情況下,個(gè)人成為大數(shù)據(jù)的來(lái)源,移動(dòng)通信公司投資并收集大數(shù)據(jù),以向用戶提供更好的服務(wù)。類似地,政府可擁有特定的數(shù)據(jù),如人口普查數(shù)據(jù)、天氣信息、郵政編碼等。不過(guò),我們會(huì)對(duì)大數(shù)據(jù)如何使用或者是否應(yīng)該被收集施加一些限制。
黃智生:隨著智能手機(jī)、網(wǎng)絡(luò)和衛(wèi)星定位系統(tǒng)的普及,每個(gè)人的一舉一動(dòng)都會(huì)產(chǎn)生很多數(shù)據(jù)。個(gè)體在購(gòu)買手機(jī)、簽署手機(jī)合同之時(shí)可能就同意手機(jī)網(wǎng)絡(luò)公司有權(quán)獲得個(gè)人位置之類的信息了。
今后的數(shù)據(jù)歸屬權(quán)與個(gè)人隱私的概念可能越來(lái)越無(wú)關(guān),而且隨著時(shí)間的推移,人們對(duì)于隱私的看法也在發(fā)生改變。以個(gè)人位置數(shù)據(jù)信息為例,以前,人們肯定很不樂(lè)意自己的行蹤被別人獲知。如今,似乎沒(méi)有人為了不讓別人知道自己的行蹤而不使用手機(jī)。
歐洲民眾要求政府公開信息的訴求越來(lái)越強(qiáng)烈,歐盟和歐洲各國(guó)的立法也在向這個(gè)方向推進(jìn)。以荷蘭為例,除了涉及國(guó)家安全和個(gè)人隱私的公共信息外,大部分信息都已經(jīng)實(shí)現(xiàn)了公開。民眾也有權(quán)向政府申請(qǐng)信息公開。
朱揚(yáng)勇:關(guān)于數(shù)據(jù)財(cái)產(chǎn),目前法律上存在空白,套用目前的物權(quán)法或著作權(quán)法等相關(guān)法律可能都有些問(wèn)題。所以,我們只能來(lái)談?wù)剶?shù)據(jù)權(quán)益歸屬的合理性問(wèn)題。因?yàn)閿?shù)據(jù)不是天然存在的,所以,“數(shù)據(jù)應(yīng)該屬于數(shù)據(jù)的生產(chǎn)者”的說(shuō)法比較合情合理。但是,很多時(shí)候數(shù)據(jù)擁有者很難主張權(quán)利,這需要將來(lái)制定相應(yīng)的法律來(lái)解決。現(xiàn)在面臨的問(wèn)題主要有兩個(gè):一是當(dāng)數(shù)據(jù)有多個(gè)生產(chǎn)者時(shí)如何界定;二是當(dāng)生產(chǎn)的數(shù)據(jù)涉及秘密和隱私時(shí)如何界定。
對(duì)于第一個(gè)問(wèn)題,可以通過(guò)協(xié)商解決。例如,某人在電子商務(wù)網(wǎng)站購(gòu)物,購(gòu)物行為生產(chǎn)的數(shù)據(jù)是可以由購(gòu)物者和電商(可能還有第三方支付平臺(tái))共同擁有。一般情況下,個(gè)人購(gòu)物數(shù)據(jù)對(duì)個(gè)人幾乎無(wú)用,目前被電商無(wú)償占有了。再比如,微博數(shù)據(jù)現(xiàn)在幾乎已經(jīng)作為個(gè)人資產(chǎn)來(lái)看待了,因而微博運(yùn)營(yíng)商就不能無(wú)償占有使用微博數(shù)據(jù),需要協(xié)商處理。對(duì)于第二個(gè)問(wèn)題, 就需要法律來(lái)界定了。例如,病歷數(shù)據(jù)是病人和醫(yī)生及醫(yī)院共同生產(chǎn)的,醫(yī)院銷售病歷數(shù)據(jù)就一定會(huì)遇到麻煩,這里不是數(shù)據(jù)權(quán)益的主張問(wèn)題,而是涉及病人的隱私問(wèn)題。
問(wèn)題二:
大數(shù)據(jù)誰(shuí)掌控?
肯尼思·丘基爾:沒(méi)有哪個(gè)機(jī)構(gòu)或者哪個(gè)人會(huì)擁有大數(shù)據(jù)的最終控制權(quán)。這取決于具體情況,即什么類型的數(shù)據(jù)、用于何種目的。例如,我們的智能手機(jī)傳感器可能會(huì)識(shí)別我們周邊的人。這是否意味著我侵犯了別人的隱私呢?也許是的。但這不同于上世紀(jì)20年代中期大眾攝影時(shí)代發(fā)生的情形。那個(gè)年代,如果有人在大街上對(duì)你拍照或者錄像,你會(huì)覺(jué)得受到了干擾。但是,今天,當(dāng)人們?cè)诎屠璞R浮宮前被數(shù)百臺(tái)智能手機(jī)拍攝時(shí),大部分人是不會(huì)在乎的。
維克托·邁爾·舍恩伯格:我們?nèi)蕴幵诖髷?shù)據(jù)時(shí)代的初始階段,誰(shuí)來(lái)掌控大數(shù)據(jù)或者誰(shuí)來(lái)使用,在何種條件下又受到何種規(guī)范,大數(shù)據(jù)未來(lái)的儲(chǔ)存和流動(dòng)方式等,都還處于未知的狀態(tài),我們無(wú)法給出準(zhǔn)確的答案。但是社會(huì)的各個(gè)領(lǐng)域已經(jīng)有很多這方面的嘗試,未來(lái)在這方面也一定會(huì)出現(xiàn)更多的創(chuàng)新。
未來(lái)對(duì)大數(shù)據(jù)規(guī)范管理的重點(diǎn)仍舊需要集中在個(gè)人信息的使用方面,而不是數(shù)據(jù)的采集和交易過(guò)程。采集數(shù)據(jù)的過(guò)程并不會(huì)帶來(lái)太多的麻煩,關(guān)鍵問(wèn)題在于有可能產(chǎn)生數(shù)據(jù)濫用。因?yàn)榛ヂ?lián)網(wǎng)公司可以收集大量有價(jià)值的數(shù)據(jù),而且有利用這些數(shù)據(jù)的強(qiáng)烈的利益驅(qū)動(dòng)力,所以互聯(lián)網(wǎng)公司順理成章地成了最新處理技術(shù)的帶頭實(shí)踐者。它們甚至超過(guò)了很多有幾十年經(jīng)驗(yàn)的線下公司,成為新技術(shù)的領(lǐng)銜使用者。但事實(shí)上,政府才是大規(guī)模信息的原始采集者,并且還在與私營(yíng)企業(yè)競(jìng)爭(zhēng)他們所控制的大量數(shù)據(jù)。
黃智生:目前網(wǎng)絡(luò)上的數(shù)據(jù)龐大,但絕大部分?jǐn)?shù)據(jù)都是由公司進(jìn)行管理的。比如個(gè)人的郵件系統(tǒng),無(wú)論個(gè)人使用哪一家公司的郵件系統(tǒng),提供商都可以看到這些郵件。但是這些公司的員工必須遵守職業(yè)道德,而且有嚴(yán)格的調(diào)閱規(guī)章制度,法律中對(duì)私自查看或泄露別人網(wǎng)絡(luò)隱私的行為也會(huì)進(jìn)行嚴(yán)厲打擊。
公共數(shù)據(jù)可以由政府進(jìn)行管理,但必須嚴(yán)格遵守法律。在歐洲,個(gè)人、公司和組織有權(quán)拒絕向政府或執(zhí)法機(jī)關(guān)提供數(shù)據(jù)。比如,我在阿姆斯特丹留學(xué)期間,荷蘭警方要求我們學(xué)校提供所有華人留學(xué)生的住址,但學(xué)校表示,荷蘭法律沒(méi)有規(guī)定我們有義務(wù)向警方提供此類信息。但如果涉及國(guó)家安全,又有法律可循,那么歐洲的政府是有權(quán)管理相關(guān)數(shù)據(jù)的。
問(wèn)題三:
大數(shù)據(jù)存多久?
維克托·邁爾·舍恩伯格:我們所處的時(shí)代之所以與眾不同,是因?yàn)閿?shù)據(jù)的收集不再存在固有的局限性。技術(shù)已經(jīng)發(fā)展到一定程度,大量信息可以被廉價(jià)地捕捉和記錄。數(shù)據(jù)收集往往是被動(dòng)的,人們無(wú)須投入太多精力,甚至不需要認(rèn)識(shí)這些數(shù)據(jù)。而且,由于存儲(chǔ)成本的大幅下降,保存數(shù)據(jù)比丟棄數(shù)據(jù)更加容易。這使得以較低成本獲得更多數(shù)據(jù)的可能性比以往任何時(shí)候都大。在過(guò)去50年中,數(shù)字存儲(chǔ)成本大約每?jī)赡晗鳒p一半,而存儲(chǔ)密度則增加了5000萬(wàn)倍。大部分?jǐn)?shù)據(jù)的直接價(jià)值對(duì)收集者而言是顯而易見的。數(shù)據(jù)的基本用途為信息的收集和處理提供了依據(jù)。
隨著時(shí)間的推移,大多數(shù)數(shù)據(jù)都會(huì)失去一部分基本用途。在這種情況下,繼續(xù)依賴于舊的數(shù)據(jù)不僅不能增加價(jià)值,實(shí)際上還會(huì)破壞新數(shù)據(jù)的價(jià)值。然而,并非所有的數(shù)據(jù)都會(huì)貶值。有些公司提倡盡可能長(zhǎng)時(shí)間地保存數(shù)據(jù),即使監(jiān)管部門或公眾要求它們短時(shí)間內(nèi)刪除或隱匿這些信息。這就解釋了為什么一直以來(lái),谷歌都拒絕將互聯(lián)網(wǎng)協(xié)議地址從舊的搜索查詢中完全刪除。谷歌希望得到每年的同比數(shù)據(jù),如假日購(gòu)物搜索等。
黃智生:目前似乎沒(méi)有法規(guī)要求在一定的時(shí)限后銷毀數(shù)據(jù)。如銀行的個(gè)人財(cái)務(wù)信息等內(nèi)容,反而要求一定期限內(nèi)不準(zhǔn)銷毀。而且現(xiàn)在存儲(chǔ)數(shù)據(jù)的成本很低,所以各公司都盡量將各自產(chǎn)生的數(shù)據(jù)儲(chǔ)存下來(lái)。雖然世界主要技術(shù)公司的總部大多在美國(guó),但并非所有的數(shù)據(jù)都儲(chǔ)存在美國(guó),世界各地都會(huì)有這些公司的服務(wù)器和存儲(chǔ)系統(tǒng)。不過(guò)這些技術(shù)公司的高級(jí)管理人員可以很容易地查閱到世界各地的數(shù)據(jù)。從這個(gè)方面來(lái)講,存放在哪里并不重要,只要網(wǎng)絡(luò)能連接就可以了。如美國(guó)政府搜集的所謂“事關(guān)國(guó)家安全”的信息,政府更不會(huì)將其銷毀,只會(huì)越積越多。相對(duì)于較低的儲(chǔ)存成本,真正耗資的是篩選和運(yùn)算成本。從山一樣的數(shù)據(jù)中挑選砂一樣的有用信息,實(shí)在很困難。
雖然目前WEB3.0系統(tǒng)已經(jīng)能夠做到低智能、大數(shù)據(jù)量的篩選工作,但依然達(dá)不到實(shí)戰(zhàn)需要,代替不了人的作用。這如山一樣的數(shù)據(jù),是政府的一種負(fù)擔(dān),也是一個(gè)雞肋。但不能說(shuō)這些數(shù)據(jù)就沒(méi)有用,比如警方確定了一個(gè)犯罪分子身份,就可以依法向網(wǎng)路服務(wù)商、手機(jī)服務(wù)商索取這個(gè)犯罪分子之前的所有信息,并通過(guò)這些積累的信息進(jìn)行分析篩選。
法迪·謝哈德:互聯(lián)網(wǎng)名稱與數(shù)字地址分配機(jī)構(gòu)(ICANN)成立之時(shí)完全由美國(guó)政府主導(dǎo),招致許多非英語(yǔ)國(guó)家,特別是發(fā)展中國(guó)家人士的不滿。互聯(lián)網(wǎng)域名相當(dāng)于網(wǎng)絡(luò)空間的門牌號(hào),本來(lái)是一個(gè)全球性系統(tǒng)。ICANN在2009年與美國(guó)商務(wù)部簽署協(xié)議,此后不再對(duì)該部門負(fù)責(zé),并使國(guó)際利益相關(guān)方在ICANN監(jiān)管全球域名系統(tǒng)時(shí)擁有更多發(fā)言權(quán)。我們應(yīng)該增加互聯(lián)網(wǎng)領(lǐng)域的透明度,而不讓某個(gè)國(guó)家或地區(qū)把互聯(lián)網(wǎng)控制起來(lái),各國(guó)、各地區(qū)應(yīng)該更加平等地分享網(wǎng)絡(luò)數(shù)據(jù)資源。
杜小勇:擁有數(shù)據(jù)的組織可以決定數(shù)據(jù)放在哪、如何存、存多久等。如果數(shù)據(jù)是企業(yè)的生命線,他自然會(huì)考慮安全、經(jīng)濟(jì)、高效等多種因素。為了信息安全,企業(yè)一般會(huì)采取異地備份等成本更高的手段。據(jù)稱,“9·11”事件后,有些擁有更完善的數(shù)據(jù)備份體系的公司很快就恢復(fù)了業(yè)務(wù),而另一些公司則由于數(shù)據(jù)損毀而走向破產(chǎn)。企業(yè)數(shù)據(jù)要存多久,也是一個(gè)需要權(quán)衡各種因素后的決策。這是企業(yè)自主的行為,除非建立在這些數(shù)據(jù)之上的業(yè)務(wù)還有其他法律上的要求。
我們可能關(guān)心的是另一個(gè)問(wèn)題,即國(guó)家層面的信息安全。有人提出“信息疆域”的概念。也就是說(shuō),土地、海洋、空間都有國(guó)家的屬性(領(lǐng)地、領(lǐng)海、領(lǐng)空),數(shù)字空間中是否也有“主權(quán)”的概念?大型跨國(guó)公司,通過(guò)種種業(yè)務(wù)滲透到日常生活的方方面面,因此可以采集到一個(gè)國(guó)家方方面面的數(shù)據(jù)。于是,國(guó)外機(jī)構(gòu)對(duì)一個(gè)國(guó)家情況的了解甚至有可能超過(guò)該國(guó)自身,這顯然會(huì)直接威脅到國(guó)家安全。
因此,國(guó)家對(duì)于跨國(guó)企業(yè)的數(shù)據(jù)傳輸、數(shù)據(jù)備份、數(shù)據(jù)使用等應(yīng)有所限制,并進(jìn)行監(jiān)控,這十分必要。國(guó)家應(yīng)該對(duì)此立法保障。有些數(shù)據(jù)有法律的保護(hù),如測(cè)繪數(shù)據(jù),其他更多種類的數(shù)據(jù),目前還沒(méi)有類似的法律。
問(wèn)題四:
大數(shù)據(jù)怎么用?
維克托·邁爾·舍恩伯格:隨著世界開始邁向大數(shù)據(jù)時(shí)代,社會(huì)也將經(jīng)歷類似的地殼運(yùn)動(dòng)。在改變我們生活和思維方式的同時(shí),大數(shù)據(jù)早已在推動(dòng)我們重新考慮最基本的準(zhǔn)則,包括怎樣鼓勵(lì)其增長(zhǎng)以及怎樣遏制其潛在威脅。然而,不同于印刷革命,我們沒(méi)有幾個(gè)世紀(jì)的時(shí)間去慢慢適應(yīng),我們也許只有幾年時(shí)間。
在大數(shù)據(jù)時(shí)代,對(duì)原有規(guī)范的修修補(bǔ)補(bǔ)已經(jīng)滿足不了需要,也不足以抑制大數(shù)據(jù)帶來(lái)的風(fēng)險(xiǎn),我們需要全新的制度規(guī)范。我們需要設(shè)立一個(gè)不一樣的隱私保護(hù)模式,這個(gè)模式應(yīng)該更著重于數(shù)據(jù)使用者為其行為承擔(dān)責(zé)任,而不是將重心放在收集數(shù)據(jù)之初取得個(gè)人認(rèn)可上。
肯尼思·丘基爾:對(duì)大數(shù)據(jù)技術(shù)進(jìn)行規(guī)范是問(wèn)題的關(guān)鍵。首先,可以從強(qiáng)調(diào)監(jiān)管大數(shù)據(jù)的收集,轉(zhuǎn)向重點(diǎn)監(jiān)管大數(shù)據(jù)的實(shí)際使用。其次,可以讓大數(shù)據(jù)變得不那么神秘,不再是個(gè)“黑箱”,增加大數(shù)據(jù)應(yīng)用中的透明度和問(wèn)責(zé)制。可創(chuàng)造一個(gè)被稱為“算法學(xué)家”的新職業(yè),這些人接受計(jì)算機(jī)技術(shù)、統(tǒng)計(jì)學(xué)和數(shù)據(jù)處理方面的專門訓(xùn)練,對(duì)大數(shù)據(jù)的應(yīng)用進(jìn)行評(píng)估,以確保公眾對(duì)大數(shù)據(jù)系統(tǒng)感到放心。
至于平衡隱私權(quán)和國(guó)家安全的問(wèn)題,古希臘哲學(xué)家亞里士多德早就提出這樣的問(wèn)題:“我們?nèi)绾伪O(jiān)視守護(hù)者?”即使是在他那個(gè)年代,這個(gè)問(wèn)題也沒(méi)有簡(jiǎn)單的答案。
斯蒂夫·帕爾默:大數(shù)據(jù)給我們帶來(lái)的真正機(jī)遇是把許多信息碎片拼起來(lái),為我們的決策服務(wù)。大數(shù)據(jù)時(shí)代最大的挑戰(zhàn)是如何從大數(shù)據(jù)中獲取“價(jià)值”。從大數(shù)據(jù)中獲取最大價(jià)值,需要探索式的研究方法。未來(lái),數(shù)據(jù)科學(xué)家會(huì)很吃香,這種科學(xué)家既要熟悉商業(yè)環(huán)境,也要有操作層面的知識(shí)。
杜小勇:很多問(wèn)題就出在數(shù)據(jù)使用上!數(shù)據(jù)作為資產(chǎn),就涉及管理的問(wèn)題,因此“數(shù)據(jù)治理”就顯得越發(fā)重要。信息世界同樣需要公約,將竊取他人數(shù)據(jù)視為犯罪,將攻擊他人系統(tǒng)視為犯罪,從刑法上加以明確規(guī)定,共同營(yíng)造一個(gè)文明有序的數(shù)字生活,應(yīng)該是我們的理想。大數(shù)據(jù)時(shí)代,我們需要盡快跟進(jìn)這方面的工作,如開展國(guó)家間對(duì)話,形成公約。
企業(yè)利用數(shù)據(jù)挖掘技術(shù),進(jìn)行精準(zhǔn)廣告投放,也涉及隱私問(wèn)題。一個(gè)少女收到了嬰兒用品廣告,其父大怒,要告企業(yè)。事實(shí)卻是這位少女未婚先孕了。這個(gè)故事中,企業(yè)使用的是自己采集的客戶購(gòu)物數(shù)據(jù),使用的是自己開發(fā)的數(shù)據(jù)挖掘軟件,整個(gè)過(guò)程都沒(méi)有問(wèn)題。但事實(shí)上卻侵犯了個(gè)人隱私,應(yīng)堅(jiān)決反對(duì)。這里面應(yīng)該有一些法律問(wèn)題,需要認(rèn)真研究。
朱揚(yáng)勇:“大數(shù)據(jù)時(shí)代,數(shù)據(jù)作為資源,不被共享是趨勢(shì)。”這樣的話,數(shù)據(jù)運(yùn)用一定需要價(jià)值交換。在確定數(shù)據(jù)權(quán)益的前提下,數(shù)據(jù)的運(yùn)用就是有償使用。法律需要界定數(shù)據(jù)的權(quán)益,政府界定數(shù)據(jù)的類型(哪些是隱私,哪些涉及國(guó)家安全)等,這樣數(shù)據(jù)的流通就有法可依。
在現(xiàn)階段法律法規(guī)都還沒(méi)有明確之前,應(yīng)從國(guó)家安全的角度高度關(guān)注數(shù)據(jù)資源的安全。而作為個(gè)人,要明白“有行動(dòng)就可能產(chǎn)生數(shù)據(jù)”,所以當(dāng)有些行為涉及隱私時(shí),需要謹(jǐn)慎。
從更大的范圍來(lái)講,公共網(wǎng)絡(luò)中公開的數(shù)據(jù)應(yīng)該屬于全人類,任何人都有權(quán)獲取、使用并獲益。這樣能夠更大程度地發(fā)揮數(shù)據(jù)資源的作用,讓數(shù)據(jù)給人類的生活生產(chǎn)帶來(lái)更多便利,對(duì)人類社會(huì)進(jìn)步有重要的意義。
(編輯:高晴)
共1頁(yè) 首頁(yè) | 上一頁(yè) 1 下一頁(yè) | 尾頁(yè) 轉(zhuǎn)到第頁(yè) |