xx色综合,国产午夜亚洲精品不卡网站,成年在线欧美,最近免费中文字幕mv在线视频3 ,亚洲综合人成网免费视频

數(shù)字化制造

楊強:打破數(shù)據(jù)孤島穿越人工智能寒冬

ainet.cn   2022年12月26日

隨著5G、物聯(lián)網(wǎng)、云計算、工業(yè)互聯(lián)網(wǎng)等技術(shù)發(fā)展,數(shù)據(jù)量已然進入爆發(fā)增長期,如何在遵守更加嚴格、新的隱私保護條例前提下,解決數(shù)據(jù)碎片化和數(shù)據(jù)隔離的問題,是當前人工智能研究者和實踐者面臨的首要挑戰(zhàn)。

倘若不能很好地解決這個問題,將會很可能導致新一輪的人工智能的寒冬。微眾銀行首席人工智能官楊強稱,在人工智能領(lǐng)域,隱私保護技術(shù)聯(lián)邦學習作為一種分布式的機器學習新范式,具有數(shù)據(jù)不動模型動,數(shù)據(jù)可用不可見的核心特征,已成為推動人工智能產(chǎn)業(yè)應用深化、數(shù)據(jù)要素流通、數(shù)據(jù)價值釋放的關(guān)鍵技術(shù)。

楊強還是香港科技大學計算機與工程系講座教授和前系主任,AAAI-2021大會主席,國際人工智能聯(lián)合會(IJCAI)理事會前主席,香港人工智能與機器人學會(HKSAIR)理事長,智能投研技術(shù)聯(lián)盟(ITL)、開放群島(OI)開源社區(qū)、聯(lián)邦學習FATE開源社區(qū)主席,華為諾亞方舟實驗室首任主任。他于20137月當選為國際人工智能協(xié)會(AAAI)院士,是第一位獲此殊榮的華人,之后又于20165月當選為AAAI執(zhí)行委員會委員,是首位AAAI華人執(zhí)委。20178月他當選為國際人工智能聯(lián)合會(ICAI,國際人工智能領(lǐng)域創(chuàng)立最早的頂級國際會議)理事會主席,是第一位擔任ICAI理事會主席的華人科學家。

楊強所在的微眾銀行是國內(nèi)首家提出聯(lián)邦學習解決數(shù)據(jù)孤島與數(shù)據(jù)隱私保護難題的機構(gòu),聯(lián)邦學習為人工智能落地中數(shù)據(jù)孤島與數(shù)據(jù)隱私保護難題提供了通用解決方案。


從實驗室中走向工業(yè)化

楊強擅長機器學習和數(shù)據(jù)挖掘領(lǐng)域,是該方向的領(lǐng)軍人物。2012年,楊強將主要精力轉(zhuǎn)向大數(shù)據(jù)的產(chǎn)業(yè)化,與華為公司聯(lián)合組建諾亞方舟實驗室,并擔任首席主任。

人工智能有一個特點,就是離不開實際的應用場景。剛開始我一直在學校研究人工智能,再逐漸接觸到華為、微眾等企業(yè)。后來我逐漸感覺到,人工智能在特定的場景中仍遇到一些挑戰(zhàn)。2018年時我已在微眾銀行擔任獨立董事,接觸了很多微眾的金融場景,感觸特別深的是微眾需要很多模型來支持各種金融方面的操作。這個場景剛好適合我,就選擇了來到微眾。楊強稱,機器學習的技術(shù)本身已經(jīng)很成熟,只不過是從實驗室中走向工業(yè)化。而聯(lián)邦學習則是從零開始,全球都沒有成功案例。

回溯最初,谷歌在2016年發(fā)表的論文中提出了聯(lián)邦學習概念,從此聯(lián)邦學習成為人工智能社區(qū)里一個非?;钴S的研究領(lǐng)域。楊強團隊在2018年提出系統(tǒng)化的聯(lián)邦學習理論,2019年發(fā)布了FATE開源系統(tǒng),2020年出版了首本聯(lián)邦學習中英文專著《聯(lián)邦學習》。

經(jīng)過多年的探索,目前微眾銀行新一代的聯(lián)邦學習在理念和實踐上已走在了全球前列。

早在2018年之前,人工智能已在很多領(lǐng)域開展應用,但訓練人工智能應用模型所需要的數(shù)據(jù)量非常龐大。在很多領(lǐng)域中,人們發(fā)現(xiàn)滿足這樣規(guī)模的數(shù)據(jù)量是難以甚至無法達到的。尤為重要的是,人們對用戶隱私和數(shù)據(jù)安全的關(guān)注度也在不斷提高。用戶開始更加關(guān)注他們的隱私信息是否未經(jīng)自己許可,便被他人出于商業(yè)或其他目的而利用,甚至濫用。在此趨勢下,包括中國在內(nèi)的全球多地政府相繼出臺數(shù)據(jù)保護法律和法規(guī),使得數(shù)據(jù)孤島效應進一步顯現(xiàn)。在這樣的法律環(huán)境下,收集和分享不同組織間的數(shù)據(jù)將會變得越來越困難。更加重要的是,某些高度敏感的數(shù)據(jù)(例如,金融交易數(shù)據(jù)和醫(yī)療健康數(shù)據(jù)等)的擁有者也會極力反對無限制地計算和使用這些數(shù)據(jù)。在這種情況下,數(shù)據(jù)擁有者只允許數(shù)據(jù)保存在自己手中,進而會形成各自孤立的數(shù)據(jù)孤島。楊強稱,如何在更加嚴格的、新的隱私保護條例的前提下,解決數(shù)據(jù)碎片化和數(shù)據(jù)隔離的問題,是當前人工智能研究者和實踐者面臨的首要挑戰(zhàn)。倘若不能很好解決這個問題,將會很可能導致新一輪的人工智能的寒冬。


聯(lián)邦學習奠基者

我們把聯(lián)邦學習到今天的發(fā)展分為1.0階段和2.0階段。1.0階段是從2018年開始的。楊強稱,按照數(shù)據(jù)集合維度相似性構(gòu)成的特點,業(yè)界普遍將聯(lián)邦學習分為橫向聯(lián)邦學習、縱向聯(lián)邦學習。目前大部分手機等終端應用公司在使用橫向聯(lián)邦學習,而在其他領(lǐng)域,大概是70%-80%的應用,是使用由微眾銀行發(fā)展出來的縱向聯(lián)邦學習。2019年發(fā)表的一篇縱向聯(lián)邦學習概述論文,目前已有超過3000個引用,這在學術(shù)界是非常驚人的。

20221214日,中國移動發(fā)布的《中國移動隱私計算應用白皮書2.0》顯示,縱向聯(lián)邦學習適用于各個參與方有大量的重疊樣本,但其特征空間不同的情形。典型的案例是跨行業(yè)、跨機構(gòu)的數(shù)據(jù)聯(lián)合建模,如同一地區(qū)的銀行和電信運營商,其用戶重疊度高,數(shù)據(jù)維度差異大,通過縱向聯(lián)邦學習可以在保護數(shù)據(jù)隱私的條件下構(gòu)建滿足各種需求的模型。

當有著相同特征的樣本分布于不同的參與方時,在能夠?qū)崿F(xiàn)綜合運用各方數(shù)據(jù)的同時,保證各方數(shù)據(jù)隱私的算法稱為橫向聯(lián)邦學習。橫向聯(lián)邦學習的目的是要利用分布于各方的同構(gòu)數(shù)據(jù)進行機器學習建模,其典型應用場景包括醫(yī)療數(shù)據(jù)建模、業(yè)務相似的同行業(yè)、不同用戶的數(shù)據(jù)聯(lián)合建模等。現(xiàn)在聯(lián)邦學習已經(jīng)發(fā)展到2.0階段。2.0階段和1.0階段的重大區(qū)別就是可信聯(lián)邦學習。其本質(zhì)是能夠滿足用戶和監(jiān)管等各方面需求的分布式機器學習范式??尚怕?lián)邦學習將助推隱私計算應用在各種場景上,降低隱私計算的成本,提升隱私計算應用質(zhì)量,從而加速推動隱私計算行業(yè)的發(fā)展。在2022年初我們發(fā)表了一篇論文叫做《聯(lián)邦學習中隱私與模型性能沒有免費午餐定理》,就論證了隱私保護、模型性能、算法效率三者需要平衡,且可以平衡。楊強稱。

2022年,微眾銀行與上海交通大學、中山大學等機構(gòu)聯(lián)合撰寫的《聯(lián)邦學習中隱私與模型性能沒有免費午餐定理》《FedCG:聯(lián)邦條件對抗生成網(wǎng)絡》《FedIPR:聯(lián)邦學習模型所屬權(quán)驗證》多篇論文被IJCAI2022、TPAMI2022、ACMTIST國際人工智能頂級學術(shù)期刊和頂級學術(shù)會議收錄發(fā)表。

其中,《聯(lián)邦學習中隱私與模型性能沒有免費午餐定理》提出了隱私與模型性能的“No-free-lunch安全-收益恒定定律,首次從信息論的角度分析揭示了聯(lián)邦學習的模型效用與隱私保護之間的內(nèi)在約束關(guān)系,利用該定律可實現(xiàn)可信聯(lián)邦學習的安全、效用、效率三者的協(xié)調(diào),在保證數(shù)據(jù)隱私保護的同時,也最大化模型效用和學習效率。有效運用該定律能夠量化分析隱私計算各種技術(shù)保護方案的優(yōu)劣,進一步優(yōu)化隱私保護算法設(shè)計,為設(shè)計可信聯(lián)邦學習算法提供有效的指導。

據(jù)清華大學發(fā)布的《聯(lián)邦學習全球研究與應用趨勢報告(2022)》統(tǒng)計,在論文研究方面,全球高被引論文領(lǐng)先的機構(gòu)依次是谷歌、卡內(nèi)基·梅隆大學、北京郵電大學及微眾銀行。從論文發(fā)布及高被引用論文數(shù)量、全球?qū)@芾砹考伴_源框架熱度等幾個方面來看,中國與美國正在引領(lǐng)全球聯(lián)邦學習發(fā)展。微眾銀行在聯(lián)邦學習領(lǐng)域處于全球領(lǐng)先地位。楊強稱,從論文、專利、場景應用和生態(tài)發(fā)展等多維度來比較,微眾銀行已成為聯(lián)邦學習領(lǐng)域的領(lǐng)頭羊,但他更希望看到多個領(lǐng)頭羊的出現(xiàn)。多個企業(yè)和機構(gòu)都在探索和實踐聯(lián)邦學習是非常好的現(xiàn)象,對于促進行業(yè)生態(tài)的發(fā)展有著至關(guān)重要的意義。

而在應用方面,基于在金融領(lǐng)域的實踐,微眾銀行的聯(lián)邦學習已在聯(lián)合風控、聯(lián)合營銷、反洗錢和反欺詐以及醫(yī)療領(lǐng)域獲得一系列的探索成果。全球知識產(chǎn)權(quán)綜合信息服務提供商IPRdailyincoPat創(chuàng)新指數(shù)研究中心聯(lián)合發(fā)布的全球隱私計算技術(shù)發(fā)明專利排行榜(TOP100顯示,入榜前10名企業(yè)主要來自中國和美國,其中,微眾銀行以204件專利位列排行榜第八名,在所有入選榜單的銀行當中,微眾銀行名列全球第一。


構(gòu)建聯(lián)邦學習生態(tài)

數(shù)據(jù)基礎(chǔ)制度建設(shè)事關(guān)國家發(fā)展和安全大局。”1219日發(fā)布的《中共中央 國務院關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見》強調(diào),完善治理體系,保障安全發(fā)展。統(tǒng)籌發(fā)展和安全,貫徹總體國家安全觀,強化數(shù)據(jù)安全保障體系建設(shè),把安全貫穿數(shù)據(jù)供給、流通、使用全過程,劃定監(jiān)管底線和紅線。加強數(shù)據(jù)分類分級管理,把該管的管住、該放的放開,積極有效防范和化解各種數(shù)據(jù)風險,形成政府監(jiān)管與市場自律、法治與行業(yè)自治協(xié)同、國內(nèi)與國際統(tǒng)籌的數(shù)據(jù)要素治理結(jié)構(gòu)。數(shù)字安全技術(shù)標準與國際規(guī)則的制定,已經(jīng)成為了大國角逐的新戰(zhàn)場。楊強表示,數(shù)據(jù)流通的關(guān)鍵是價值流通,數(shù)據(jù)流通的目的是價值釋放。安全、可信的數(shù)據(jù)跨境流通體系頂層設(shè)計過程,不僅包括數(shù)據(jù)安全和隱私計算技術(shù)的不斷發(fā)展,還包括持續(xù)推進跨境數(shù)據(jù)審計和確權(quán)制度的完善,并構(gòu)建完整的跨境數(shù)據(jù)價值交易平臺,從而讓數(shù)據(jù)在不出境、不可見的情況下,仍能達到價值流通與價值釋放的根本目的。隱私計算、區(qū)塊鏈等新興技術(shù)賦能多樣化場景,是實現(xiàn)數(shù)據(jù)跨境可信流通的主要方法。

為推動安全隱私技術(shù)蓬勃發(fā)展,微眾銀行早在2019年,將其自研的全球第一個聯(lián)邦學習工業(yè)級開源框架FederatedAITechnologyEnablerFATE)捐贈給了Linux基金會,并持續(xù)豐富和補充聯(lián)邦學習開源產(chǎn)品版圖,擴大以FATE開源生態(tài)為核心的聯(lián)邦學習生態(tài)。截至目前,FATE開源社區(qū)吸納了電信運營商、金融機構(gòu)、大型互聯(lián)網(wǎng)與科技企業(yè)在內(nèi)的多家成員單位,包括工商銀行、中國銀聯(lián)、微眾銀行、中國電信、中國聯(lián)通、中國銀行、中銀金科、建信金科、光大科技、易方達基金、騰訊云、美團、第四范式、VMware、星云Clustar、亞信科技、綠盟科技、醫(yī)渡云等。如果隱私計算和聯(lián)邦學習技術(shù)只是掌握在少數(shù)機構(gòu)的手里,數(shù)據(jù)還是得不到真正的流通,也難以大力支持數(shù)字經(jīng)濟發(fā)展,因此必須把門檻降低,其中一個有效手段就是開源,讓人人都能夠使用這樣的技術(shù),人人都能在實踐中為技術(shù)做出貢獻。楊強說。

20224月,楊強又有了一個新身份——開放群島(OpenIslands)開源社區(qū)執(zhí)行主席。開放群島 (OpenIslands)是由深圳數(shù)據(jù)交易有限公司聯(lián)合國家智庫、國家單位、高校、大型金融機構(gòu)、大型互聯(lián)網(wǎng)公司等多家發(fā)起單位牽頭成立的國內(nèi)首個國際化自主可控隱私計算開源社區(qū)。聯(lián)邦學習和傳統(tǒng)的計算技術(shù)的區(qū)別,就是它不僅僅是一方變好就可以了。一方很有很強的技術(shù)、很強的人才,在聯(lián)邦學習的場景下還不夠,這只是其中的50%。另50%是構(gòu)建一個網(wǎng)絡,構(gòu)建一個聯(lián)邦學習的生態(tài),所以就涉及到兩方或者多方。目前已經(jīng)有很多非常令人振奮的信號,比如各地數(shù)據(jù)交易所的掛牌等。楊強最后稱,隨著大量應用案例落地以及執(zhí)法、立法機構(gòu)的加入,聯(lián)邦學習正迎來蓬勃發(fā)展的新機遇,隨著數(shù)據(jù)規(guī)模、技術(shù)復雜度、應用場景等豐富,進而進一步打破數(shù)據(jù)孤島,并為更多行業(yè)創(chuàng)造更高價值。

(轉(zhuǎn)載)

標簽:數(shù)據(jù) 我要反饋 
泰科電子ECK、ECP系列高壓直流接觸器白皮書下載
億萬克
專題報道