最近,一位在某大平臺工作的師妹向我訴苦。她說,她的工作需要公司內另一個部門的數(shù)據(jù)支持,但是該部門拒絕了她們部門的請求。原因是,只要數(shù)據(jù)離開了本部門條線,即便是在同一公司內,也會擔心數(shù)據(jù)使用導致的數(shù)據(jù)安全問題,而《數(shù)據(jù)安全法》提及的責任該部門承擔不起,索性就不給了。她當然知道數(shù)據(jù)安全很重要,但她的苦惱是,沒有數(shù)據(jù),自己部門的業(yè)務怎么推進?
是不是不用數(shù)據(jù),就能保護個人信息和數(shù)據(jù)安全?中國要發(fā)展數(shù)字經(jīng)濟,這個問題就不能回避。
數(shù)據(jù)要不要用起來?當然要用。中國的發(fā)展戰(zhàn)略對這一問題的態(tài)度是明確的。2020年發(fā)布的《中共中央 國務院關于構建更加完善的要素市場化配置體制機制的意見》(以下簡稱《意見》),明確了數(shù)據(jù)是新的生產(chǎn)要素。在過去數(shù)年間,全球數(shù)據(jù)量爆發(fā)式增長,而中國將成為世界上數(shù)據(jù)資源最豐富的國家。
根據(jù)Statista的統(tǒng)計,2016至2019年的全球數(shù)據(jù)量分別為18ZB、26ZB、33ZB、41ZB(1ZB等于10萬億億字節(jié));而國際數(shù)據(jù)公司(IDC)的白皮書認為,到2025年中國數(shù)據(jù)量將為全球最大,以48.6ZB的規(guī)模,占全球比重的27.8%。如果能將如此龐大的數(shù)據(jù)資源善加利用,其作為生產(chǎn)要素的價值與土地、資本相比將毫不遜色。
中央文件明確提出要加快培育數(shù)據(jù)要素市場,推進政府數(shù)據(jù)開放共享,提升社會數(shù)據(jù)資源價值,這表明加快數(shù)據(jù)利用不僅是中國的優(yōu)勢,也帶有緊迫性。
但是,使用數(shù)據(jù)這個硬幣的另一面是,數(shù)據(jù)風險如影隨形。
事實上,目前市值最大的蘋果、微軟、亞馬遜、Alphabet(谷歌)、Meta(臉書),他們的發(fā)展歷程中都不乏數(shù)據(jù)安全事件。例如,根據(jù)網(wǎng)站firewalltimes.com的統(tǒng)計,2021年8月,微軟因第三方公司錯誤配置導致3800萬條記錄被泄露;2021年9月,一個名為Pegasus(飛馬)的間諜軟件感染了iPhone和其他蘋果設備,該間諜軟件會記錄電話和信息,甚至在用戶不知情的情況下打開設備的攝像頭和麥克風;2021年10月,黑客將亞馬遜旗下的流媒體平臺Twitch上125GB的文件泄露給4chan,而此前數(shù)年亞馬遜有多起員工售賣客戶數(shù)據(jù)、以及第三方公司賄賂員工以獲得數(shù)據(jù)或者打擊競爭對手的事件;谷歌的數(shù)據(jù)安全問題主要是出在Google+上,如2018年11月的更新產(chǎn)生了一個API(應用程序編程接口)錯誤,暴露了5250萬個Google+賬戶的數(shù)據(jù);而臉書在2021年4月也發(fā)生逾5.3億用戶的個人資料在網(wǎng)上論壇泄露事件。
也就是說,數(shù)據(jù)安全和數(shù)據(jù)使用之間存在權衡,即便是技術先進的大公司,也沒有辦法完全避免數(shù)據(jù)相關風險。
那么,雪藏不用,是不是數(shù)據(jù)就最安全?事實上,為了保護數(shù)據(jù)安全而雪藏數(shù)據(jù),反而可能是最不安全的安排。至少有如下幾個原因:
第一,如果數(shù)據(jù)豐富的企業(yè)不使用數(shù)據(jù),就無法了解數(shù)據(jù)特征,就不知道數(shù)據(jù)的缺點、弱點在哪里。孫子兵法所說的“知己知彼,百戰(zhàn)不殆”,不使用數(shù)據(jù),可能連“知己”都做不到,有效防范攻擊也就無從談起。
第二,不使用數(shù)據(jù)不利于發(fā)揮數(shù)據(jù)豐富企業(yè)的自身數(shù)據(jù)優(yōu)勢,甚至是放棄了核心競爭力。大數(shù)據(jù)的優(yōu)勢,不僅在數(shù)據(jù)量大,也在于維度豐富。數(shù)據(jù)豐富企業(yè)的核心競爭力在于通過整合共享不同維度的數(shù)據(jù),實現(xiàn)大數(shù)據(jù)的高維優(yōu)勢。如果一家大企業(yè)內部對《數(shù)據(jù)安全法》的理解,都導致人為構筑企業(yè)內部不同部門之間數(shù)據(jù)的共通共享,那么大數(shù)據(jù)變得支離破碎,數(shù)據(jù)豐富企業(yè)不使用數(shù)據(jù),屬于“自廢武功”。
第三,不使用數(shù)據(jù)難以“知彼”,無法通過實戰(zhàn)學習應對攻擊的措施,并作出有力防范。在“魔高一尺,道高一丈”的斗爭過程中,無論是平臺企業(yè)還是監(jiān)管者,都需要通過處理各類安全事件來學習并獲得經(jīng)驗,從而更能防范未來的安全事件。
例如,臉書5.3億賬戶泄露事件的發(fā)現(xiàn)者Alon Gal披露了數(shù)據(jù)售賣過程:2020年初起就有犯罪分子以3萬美元的售價出售5.3億個賬戶數(shù)據(jù);之后買家進一步以更低的價格轉手賣出;這樣價格越來越低,直至2021年變成免費泄露。追查數(shù)據(jù)泄露的原因發(fā)現(xiàn),由于臉書沒有對API實施適當?shù)南拗疲槙穆?lián)系人導入功能使黑客能夠在每個API查詢中導入多達5000個電話號碼,并看到與查詢的電話號碼相對應的賬戶。這導致黑客通過列舉世界上所有的電話號碼對臉書數(shù)據(jù)庫作查詢的方法,獲得了5.3億用戶的信息。
那么,為什么臉書的API會有這個疏漏呢?追究更深層次的原因發(fā)現(xiàn),要讓平臺保持快速成長的態(tài)勢,臉書就要盡量通過用戶來獲得更多他們的朋友的信息,而這為黑客獲得更多信息提供了可趁之機。
上面的例子表明,數(shù)據(jù)風險也帶來了寶貴的學習機會。無論是企業(yè)還是監(jiān)管者,通過對數(shù)據(jù)風險事件的梳理,可以對數(shù)據(jù)被出售的方式、數(shù)據(jù)風險犯罪手法和企業(yè)發(fā)展策略等方面的問題均有更全面的了解。這些信息都是未來防范新的風險事件的抓手。
第四,即便不使用數(shù)據(jù)保障了數(shù)據(jù)安全,但有數(shù)據(jù)生產(chǎn)要素卻不運用的代價是無法通過發(fā)展獲取數(shù)字紅利。如果企業(yè)內部、企業(yè)和企業(yè)之間、企業(yè)和政府相關部門之間無法有效共通共享數(shù)據(jù),那么保護數(shù)據(jù)安全的初衷可能帶來數(shù)據(jù)無法使用的結局。北京大學國發(fā)院副院長黃益平在《應加強而不是削弱平臺經(jīng)濟創(chuàng)新能力》一文中列舉的,印度新興獨角獸公司數(shù)量已經(jīng)超越中國,成為僅次于美國的第二大國的現(xiàn)象,再次提醒我們,數(shù)據(jù)生產(chǎn)要素如果沒有利用好,將不利于中國數(shù)字經(jīng)濟發(fā)展大局,并最終導致中國平臺企業(yè)失去國際競爭力。
那么,到底應該怎么保障數(shù)據(jù)安全?
事實上,無論是《意見》還是《數(shù)據(jù)安全法》,指出的方向都是“以發(fā)展促安全”,而不是“為安全不發(fā)展”。
例如,《意見》強調了要“加強數(shù)據(jù)資源整合和安全保護”。通讀之下可以看出在安全的基礎上充分運用、從而充分盤活數(shù)據(jù)資源價值,是對待數(shù)據(jù)這一生產(chǎn)要素的大方向。
而《數(shù)據(jù)安全法》第十三條明確發(fā)展和數(shù)據(jù)安全之間的關系是“國家統(tǒng)籌發(fā)展和安全,堅持以數(shù)據(jù)開發(fā)利用和產(chǎn)業(yè)發(fā)展促進數(shù)據(jù)安全,以數(shù)據(jù)安全保障數(shù)據(jù)開發(fā)利用和產(chǎn)業(yè)發(fā)展”。第七條也明確,“國家保護個人、組織與數(shù)據(jù)有關的權益,鼓勵數(shù)據(jù)依法合理有效利用,保障數(shù)據(jù)依法有序自由流動,促進以數(shù)據(jù)為關鍵要素的數(shù)字經(jīng)濟發(fā)展。”
因此,對《意見》、對《數(shù)據(jù)安全法》的理解,都不應泛化成為不使用數(shù)據(jù)。
究竟應當如何實現(xiàn)以發(fā)展促安全呢?
培育市場、完善制度、發(fā)展風險可控的數(shù)據(jù)、開發(fā)共享工具是重點。當然,要系統(tǒng)化實現(xiàn)以發(fā)展促安全目標,可能需要成立一個高規(guī)格的數(shù)據(jù)治理委員會,統(tǒng)籌數(shù)據(jù)政策,包括制定數(shù)據(jù)生產(chǎn)要素的交易范圍、算法治理和個人信息保護與數(shù)據(jù)安全等方面的指南;執(zhí)行數(shù)據(jù)牌照的申請、審核、發(fā)放、限制使用和吊銷,并知道相應數(shù)據(jù)安全問題的應對措施。
例如,數(shù)據(jù)安全中的常見問題是數(shù)據(jù)被泄露或者濫用。這一問題的產(chǎn)生與數(shù)據(jù)特征分不開。數(shù)據(jù)作為準公共品的非競爭性和部分排他性等特征,導致數(shù)據(jù)產(chǎn)品存在價格趨于零和確權難、交易不積極等問題;這讓傳統(tǒng)的先確權再交易的方式不完全適用于數(shù)據(jù)產(chǎn)品,從而存在數(shù)據(jù)供給不足的問題。
解決問題的一個途徑,是推動公共數(shù)據(jù)有序開放共享和安全利用,使數(shù)據(jù)需求方無需或僅支付成本價格,從而降低交易成本和合規(guī)成本。目前,地方層面已在探索出臺公共數(shù)據(jù)條例。增加更多公共數(shù)據(jù),也能讓《數(shù)據(jù)安全法》第三十二條“任何組織、個人收集數(shù)據(jù),應當采取合法、正當?shù)姆绞?,不得竊取或者以其他非法方式獲取數(shù)據(jù)”更容易落地。
又如,隨著移動互聯(lián)網(wǎng)和云計算技術的迅猛發(fā)展,越來越多的數(shù)據(jù)在云環(huán)境下進行存儲、共享和計算,云環(huán)境下的數(shù)據(jù)安全問題也成為熱點。從技術上解決安全問題,實現(xiàn)“數(shù)據(jù)可用不可見”,一種思路是采用基于密碼算法及協(xié)議的隱私保護技術,另一種思路則是構建可信執(zhí)行環(huán)境(Trusted execution environment,TEE),實現(xiàn)基于硬件安全的內存隔離的安全計算,以解決上述隱私保護計算的實現(xiàn)依賴于大量復雜計算的問題。
再如,數(shù)據(jù)安全和隱私保護的挑戰(zhàn)中,防止用戶數(shù)據(jù)被濫用甚至被出售的問題,可以通過推動算法審計來緩解??梢砸笃脚_明確對不同利益相關方的由算法所體現(xiàn)的利益分配機制,并要求平臺報告對算法訓練和算法評估及選擇中用到的數(shù)據(jù)來源和質量、算法預測或優(yōu)化目標、算法使用的技術、算法運行效果等。通過對算法的評估,在風險到來之前對于平臺企業(yè)算法的安全性有更全面的掌握。
最后,以發(fā)展促數(shù)據(jù)安全,在激勵機制上,需要有一定的容錯率,但需要從機制上明確相關主體責任,盡量避免數(shù)據(jù)安全漏洞和風險。不能以保障數(shù)據(jù)安全為由而固步自封,也不能因鼓勵創(chuàng)新而疏于監(jiān)管機制建設和模糊責任擔當。只有這樣,才能既發(fā)揮數(shù)據(jù)優(yōu)勢,又讓中國數(shù)字經(jīng)濟的發(fā)展成為國際競爭力的重要體現(xiàn)和保障。
作者沈艷系CF40特邀成員、北京大學國家發(fā)展研究院教授、北大數(shù)字金融研究中心副主任,文章僅代表作者個人觀點,不代表CF40立場。