“明明隻是用手機瀏覽瞭某些網站,並沒有留下自己的電話,卻還是接到推銷電話。”

3月15日,2022年央視3·15晚會如約而至。不同於往屆,這屆3·15晚會首次設立“3·15信息安全實驗室”,並希望通過實驗室定期發佈“信息安全指數”,促進行業進步。

當晚,節目說到做到,曝光瞭個人信息泄露導致的推銷電話及黑產等問題,引發全民關註。

這已經是央視3·15晚會連續多年關註同一話題瞭:2021年央視3·15重拳曝光人臉識別信息和個人簡歷信息泄露等問題;2020年矛頭對準的是手機軟件插件竊取用戶隱私信息亂象;2019年揭發瞭一款在用戶毫不知情的情況下違規收集個人信息的產品——“探針盒子”。

其實,個人隱私保護和數據安全問題早就是老生常談——中國互聯網協會發佈的《2016中國網民權益保護調查報告》就曾顯示,84%的網民曾經遭受過因個人信息泄露帶來的不良影響,比如廣告推銷等;從2015年下半年到2016年上半年的一年間,我國網民因垃圾信息、詐騙信息、個人信息泄露等遭受的總體經濟損失高達約915億元。

但為何這麼多年過去,個人信息保護和數據安全保障的形勢依舊如此嚴峻?

你的隱私被泄露,能全怪無良商傢

一想到數據泄露,一般人可能會想到互聯網平臺數據安全意識欠缺,有意或無意侵犯用戶隱私、濫用數據,導致泄密。這固然沒錯,但鮮為人知的是,數據泄密其實也與數據流通時所使用的技術直接相關。

和動植物一樣,數據也有著長長的生命周期,包括收集、傳輸、存儲、使用、流轉、銷毀等諸多環節。在如此長的生命周期當中,任何一個環節出現紕漏,都可能導致數據安全問題出現。

傳統的信息技術是基於明文數據(沒有加密)進行處理,而明文數據一旦被看見,就會泄露具體信息,因此技術本身就存在數據安全隱患——這就好比,一個人光著全身在澡堂洗澡,一旦有外人進入,ta就將與外人“坦誠相見”,沒有任何秘密可言。

尤其是在數據流轉過程中,傳統的數據訪問控制技術無法解決跨組織的數據授權管理和數據流向追蹤問題,僅僅依靠書面協議,難以實現對數據接收方進行實時監控和審計,因此極易造成個人隱私泄露、數據濫用情況出現。

明文數據處理方式之下,隱私泄露事件層出不窮,數據安全問題嚴重。例如2018年6月,圓通快遞10億條快遞數據被公然在暗網上售賣;次月,3億順豐用戶數據(包括收寄件人姓名、地址、電話)在暗網售賣;8月,5億條華住集團用戶數據(包括姓名、身份證號、傢庭住址、生日等)被泄露;11月,萬豪集團名5億客人的信息泄露。

甚至,左右一國的總統選舉和國傢發展進程。2016年,8700萬Facebook用戶的個人數據被泄露給一傢叫做“劍橋分析”(Cambridge Analytica)的英國數據公司。該公司根據用戶的性格、對生活滿意度、政治立場等數據做成算法模型,量身定制地投放有利於特朗普的競選廣告,幫助其上臺,最終影響瞭美國總統大選結果。幾年後,東窗事發,Facebook被迫與美國聯邦貿易委員會(Federal Trade Commission)達成高達50億美元的和解協議。

與此同時,無所不在的數據收集技術和多樣化的數據處理技術,也使得用戶難以掌控個人數據的收集和應用情境,因此信息數據的個人自決權力被嚴重削弱,特別是隨著數字經濟的發展,企業間的數據共享變得日益頻繁,基於大數據的超強分析能力可將經過匿名處理的數據再次還原,導致現有數據脫敏技術“失靈”,進而直接威脅用戶的隱私安全。

為加強隱私保護和數據安全管理,各國紛紛出臺相關法律法規,比如歐盟先後通過《通用數據保護條例(《GDPR》)》《數據法案》《歐洲數據治理條例》《非個人數據自由流動條例》等等;中國則在2021年開始執行《數據安全法》《個人信息保護法》,再加上2017年開始實施的《網絡安全法》,正式形成數據合規治理體系。

多傢全球巨頭也因數據安全不合規而吃下巨額罰單。例如,2019年,英國航空公司因為違反《GDPR》被罰1.8339億英鎊;2021年7月,亞馬遜因違反《GDPR》被盧森堡數據保護委員會開出7.46億歐元罰款。

都說數據是數字經濟時代的“石油”,中國官方也將數據定義為與勞動力、土地、資本、技術並列的第五生產要素。

數據要想成為生產要素、發揮價值,就必須順暢地流通起來。但在強監管之下,但為瞭確保數據合規,數據持有者可能或主動或被動地減少數據共享,導致數據流通遇阻,越來越多數據孤島出現。

既然如此,有沒有一類技術,可以既從根本上解決數據安全合規的問題,同時又確保數據要素流通、充分挖掘數據的價值?有,隱私計算。

不止告別“裸奔”,個人數據還能“變現”

所謂隱私計算,是一類針對隱私數據全生命周期保護的計算方法。簡單說,就是在數據隱私得到充分保護的前提下,讓數據高效流通。

在隱私計算出現之前,數據保密通常有三種傳統模式——API模式、離線駐場模式和第三方沙箱模式。三種模式都是尺有所長,寸有所短:API模式簡單易用,但不適合聯合建模、機器學習等深度應用;離線駐場模式可聯合建模,機器學習靈活性高,但需人工全程操作,成本高,且敏感信息線下拷貝,會帶來數據泄露的高風險,另外海量數據也無法離線使用;第三方沙箱模式,雖然集中處理效率高,可以聯合建模、機器學習,但存在第三方承受信任壓力、數據安全風險、多方數據源集中難度大等問題。

相比之下,隱私計算讓數據所有方可以在不直接共享原始數據的前提下,使得數據使用方得到數據計算後產生的結果以及更高的數據價值,但是在整個流程中,原始數據始終掌握在數據所有方手中,數據安全得到瞭保障,最終實現“數據可用不可見”“數據不動價值動”的終極願景。以我們熟知的“人臉識別”為例,如果應用瞭隱私計算技術,“刷臉”就不會采集任何真正的臉部數據,而是會通過算法模型判斷出是否為本人。

雖然能夠保護隱私、防止數據泄露,但隱私計算的價值又不僅僅在於此。

先來看幾則新聞。

新聞一:2020年7月12日,在媒體Privacy Affairs上出現瞭一篇題為《Dark Web Price Index 2020》的文章,裡面詳細列出暗網上信用卡數據、付款處理服務、偽造文件、社交媒體和惡意軟件等商品或服務的詳細售價。比如附有信用卡的沃爾瑪賬戶賣10美元,餘額還剩100美金的PayPal賬戶詳細信息賣198.56美元,被黑的Facebook賬戶賣74.5美金。

新聞二:互聯網巨頭的商業模式普遍是通過收集C端用戶的數據,為B端企業提供服務、收取費用,在支撐公司發展的同時,用免費的信息服務補償用戶。用戶雖然免費使用這些互聯網巨頭的產品,但無法得到看得見的實惠。為此,美國一傢網站發佈一款可以讓人們出售自己的隱私數據換取折扣或者好處的產品。

新聞三:美國一傢區塊鏈企業遊說地方立法機關,通過一項立法提案——允許個人在自願的前提下,出售自己的健康數據,然後賣給醫療機構,換取費用,或者選擇保持這些數據的私密性。

新聞一,暗網售賣個人信息引發瞭人們對網絡黑產的巨大擔憂;新聞二,該公司的產品並未掀起多少風浪,更未成為主流;新聞三,該企業的提案,也遭遇瞭巨大的反對聲。盡管如此,但三則新聞都有力地說明瞭,個人隱私數據是的的確確是有價值的。隻不過,過去,個人隱私數據要麼是被泄露之後發在暗網上被違法售賣,要麼苦於種種原因無法變現。

現在,隱私計算的出現,卻能讓這一局面得到顯著改觀。

如前文所述,確保數據安全、高效、順暢流通,加快培育數據要素市場,是數字經濟發展的大勢所趨。但數據成為生產要素的前提是數據確權與定價,即:數據所有者享有怎樣的權利?如何在保證數據安全的基礎上交易數據?數據如何定價?數據的使用者如何向數據的所有者付費?

傳統的信息共享方法是基於明文數據進行處理,但明文數據一旦被看見就會泄露具體信息,因此難以限制數據的用途和用量,難以厘清“責、權、利”,這導致明文數據難以通過供需關系定價,難以大規模地實現市場流通。

而隱私計算技術,作為一類針對隱私數據全生命周期保護的計算方法,能在參與方數據不出本地的前提下,既保護數據安全,又實現多源數據跨域合作,進而破解數據保護與融合應用難題,因此便為數據確權和定價奠定瞭技術基礎,為新時代的數據開放共享提供瞭解題思路。在隱私計算框架之下,數據的所有權與使用權實現分離。用戶的個人數據得到確權後,使用者在使用用戶的數據前,須征得用戶的知情、同意。在整個數據的生命周期之內,使用者的使用過程(包括查閱復制、轉移、刪除)均須接受用戶的監控。一旦使用瞭用戶的個人數據,使用方就需要給用戶進行利益分成。

換句話說,隱私計算不僅僅能保護用戶的個人隱私,防止數據泄露,還能幫助用戶對個人數據進行確權,充分挖掘用戶個人數據的價值。

隱私計算,如何服務你我?

也正是因為上述優勢,隱私計算成為瞭當今計算機領域最當紅的賽道,以及全球各大科技公司、資本和創業者爭相追逐的風口,國外的微軟、Intel、Google,國內的BAT、螞蟻集團、平安科技、微眾銀行等均已入局。

除瞭服務於政企客戶,隱私計算企業也不約而同地將隱私計算用於個人場景之中。

比如在國外,從2020年起,Facebook就引入一項名為Private Lift Measurement的解決方案。該方案使用安全多方計算技術,在幫助廣告商瞭解廣告投放活動信息的同時,增加瞭額外的隱私層,以限制Facebook自己或者廣告主可以瞭解的用戶信息。Google同樣推出瞭“隱私計算服務”,該技術不僅能夠保證用戶設備信息的私密性,還可讓設備在調用雲端功能時不去侵犯用戶隱私。

在國內,隱私計算企業同樣將目標鎖定在提高用戶個人福祉,讓用戶更好地享受數字經濟紅利上。

比如八分量。這傢在可信計算領域積累超過10年、核心團隊來自牛津大學、北大、清華的初創企業,創新性地將隱私計算的三項技術方案(多方安全計算、聯邦學習和可信執行環境),與區塊鏈技術融合,開發出全自研、自主可控的隱私計算系統。

截至目前,八分量隱私計算系統已深入多個應用場景,並取得效果。

比如職業信用。在職業信用平臺,個人信用指數依據個人多維數據計算,這些數據包括工作履歷、稅務、傢庭等。

傳統的數據處理方式,是提交電子檔,但電子檔可被輕松偽造,難以判斷個人真實信息。另外,這些個人核心數據在企業進行統一的歸檔和管理後,一旦泄露,就回導致個人隱私,包括收入、醫療、身份信息等等一覽無餘。很多涉及個人的敏感信息,也不可避免地回被同時提交。

而八分量隱私計算職業信用平臺通過與各個數據合作方合作,搭建隱私計算網絡,雙方指定可以共享的數據,通過數據聯合建模分析,就可以確保數據在不出本地的情況下,完成數據的共享。比如,通過與金融機構合作,在不對外提供職員個人隱私數據的情況下,通過聯合建模,為金融機構信貸風控提供更全面的數據信息,從而幫助個人獲取到更好的信貸服務。

在上述過程中,多方原始數據在安全可信的環境中共享流通,原始數據沒有出域、沒有泄露、全程加密使用,數據所有權仍在數據擁有者手中,也就是在確保用戶數據安全的前提下,充分挖掘數據的價值。

這隻是一個具體應用的場景案例,類似的場景車載鬥量。

結語

回到文章開頭的話題,移動互聯網的發展,雖然為用戶帶來更多便利,但由於互聯網平臺數據安全保護力度不夠,更關鍵的是傳統的信息處理手段,基於明文數據的技術手段,先天存在安全隱患,導致個人隱私數據一再被泄露,用戶叫苦不迭。

但這幾年大熱的隱私計算,讓數據所有方可以在不直接共享原始數據的前提下,讓數據使用方得到數據計算後產生的結果以及更高的數據價值,但是在整個流程中,原始數據始終掌握在數據所有方手中,數據安全得到瞭保障,最終實現“數據可用不可見”“數據不動價值動”的終極願景。

從技術的底層邏輯上改變瞭上述局面。隱私計算在確保數據不出本地的前提下,讓數據高效、順暢流通,最終實現“數據可用不可見”“數據不動價值動”的終極願景,從而解決瞭數據合規和流通問題。

假以時日,待到隱私計算技術成熟,數據確權和定價問題解決,數據要素市場化配置高效運轉,用戶個人的隱私數據不僅將有望告別“裸奔”,甚至還能給用戶帶來利益。屆時,數字化將真正陽光普照大地,讓每一個人普通人都能享受到數字經濟的紅利和實惠。