中國(guó)深度學(xué)習(xí)平臺(tái)逆襲,只是因?yàn)椤皣?guó)潮”嗎?
一直到今天,柯潔也未必知道,他2017年看似輸給了阿爾法狗,但實(shí)際上是輸給了深度學(xué)習(xí)平臺(tái)。
相比于之前以職業(yè)棋手為目標(biāo)的圍棋AI,阿爾法狗棋力突然飛升的核心原因,在于搭載了深度學(xué)習(xí)模型。谷歌在2015年推出了深度學(xué)習(xí)框架TensorFlow,引入深度學(xué)習(xí)這項(xiàng)原來(lái)算法復(fù)雜、算力需求極高、開發(fā)難度極大的技術(shù),也有效降低了深度學(xué)習(xí)模型的開發(fā)成本。
甚至可以說(shuō),TensorFlow推出后,柯潔敗給AI已經(jīng)只是時(shí)間問題,沒有阿爾法狗,也會(huì)有阿爾法貓或者貝塔狗。
這個(gè)故事告訴我們,雖然人工智能的新聞紛繁復(fù)雜,但是目前從實(shí)用化角度來(lái)說(shuō),深度學(xué)習(xí)底層構(gòu)建是一條重要主線。2015年其出現(xiàn)之前,AI需要從零開始研發(fā),因此應(yīng)用停留在比較淺的階層;2015年之后,谷歌發(fā)布TensorFlow則讓AI應(yīng)用落地有了全新的想象空間。
但,牌桌上的玩家層出不窮。
一、“中國(guó)玩家”的彎道超車
盡管擁有先發(fā)優(yōu)勢(shì),但TensorFlow沒有一統(tǒng)江湖,并不出人意料。
作為深度學(xué)習(xí)平臺(tái)的開創(chuàng)者,TensorFlow有一個(gè)公認(rèn)評(píng)價(jià),“什么都好,就是不好用”。反觀Meta推出的PyTorch,雖然時(shí)間更晚,但更具有通用性,結(jié)果谷歌因此被迫先后推出TensorFlow2.0和JAX進(jìn)行防御。
這看似是TensorFlow的戰(zhàn)略失誤,而從更高的維度來(lái)講,TensorFlow不可能既滿足通用性又滿足專業(yè)性。作為一個(gè)前途廣闊的領(lǐng)域,雖然深度學(xué)習(xí)平臺(tái)作為人工智能的基礎(chǔ)設(shè)施投資巨大,但是正如CPU有英特爾和AMD,手機(jī)操作系統(tǒng)也是蘋果和安卓共分天下一樣,獨(dú)木不成林,似乎只有兩強(qiáng)爭(zhēng)霸并立才能形成穩(wěn)定態(tài)。
但是,這樣的兩強(qiáng)體制也因以飛槳為代表的“中國(guó)平臺(tái)”集體登場(chǎng)而被打破格局。
2022年7月28日,在2022全球數(shù)字經(jīng)濟(jì)大會(huì)“人工智能驅(qū)動(dòng)未來(lái)產(chǎn)業(yè)論壇”上,中國(guó)信通院與深度學(xué)習(xí)技術(shù)及應(yīng)用國(guó)家工程研究中心聯(lián)合發(fā)布了《深度學(xué)習(xí)平臺(tái)發(fā)展報(bào)告》。報(bào)告顯示,在經(jīng)過(guò)多維度分析,百度飛槳在中國(guó)深度學(xué)習(xí)市場(chǎng)應(yīng)用規(guī)模已經(jīng)達(dá)到第一。截至2022年5月,飛槳已累計(jì)凝聚477萬(wàn)開發(fā)者、服務(wù)18萬(wàn)企事業(yè)單位、創(chuàng)建56萬(wàn)AI模型。與此同時(shí),華為昇思、曠視天元、之江天樞等深度學(xué)習(xí)平臺(tái),同樣也獲得了快速發(fā)展。
無(wú)獨(dú)有偶,在信通院發(fā)布報(bào)告之前,調(diào)研機(jī)構(gòu)IDC和弗若斯特沙利文同樣發(fā)布了相關(guān)報(bào)告,結(jié)果分別顯示百度飛槳的中國(guó)深度學(xué)習(xí)市場(chǎng)綜合份額第一、綜合競(jìng)爭(zhēng)力第一。
2016年正式開源的飛槳,如何能在底層框架這樣馬太效應(yīng)強(qiáng)烈的領(lǐng)域完成彎道超車?
這看似不可思議,但實(shí)際上卻可能有某種必然性。
首先,經(jīng)過(guò)一系列卡脖子事件之后,中國(guó)無(wú)論是硬件還是軟件,都對(duì)安全性有著更高的需求。而更重要的是,中國(guó)AI的產(chǎn)業(yè)體量,也到了不可能不去爭(zhēng)奪底層控制權(quán)的時(shí)期。
根據(jù)IDC預(yù)測(cè),在2020-2024年中國(guó)人工智能整體市場(chǎng)規(guī)模將保持30.4%的年復(fù)合增長(zhǎng)率,到2024年將達(dá)到172.2億美元,在全球占比從2020年的12.5%上升到2024年的15.6%,實(shí)力位居全球第三,前兩名是美國(guó)和打包在一起的歐洲。
這樣的規(guī)模和增速,意味著中國(guó)的AI產(chǎn)業(yè)來(lái)到了與2011年通信產(chǎn)業(yè)相同的境地:當(dāng)年中國(guó)終于普及3G,用戶數(shù)和市場(chǎng)規(guī)模達(dá)到世界第三,巨大的體量,意味著遵守別人底層規(guī)則產(chǎn)生的摩擦成本以及額外費(fèi)用,會(huì)迅速超過(guò)自建標(biāo)準(zhǔn)和基礎(chǔ)設(shè)施的投入。因此中國(guó)通信產(chǎn)業(yè)既有實(shí)力,也不得不深度介入通信標(biāo)準(zhǔn)制定,而下一年,中國(guó)制定的4G標(biāo)準(zhǔn)成為國(guó)際通信標(biāo)準(zhǔn)之一。
很多時(shí)候,決戰(zhàn)紫禁之巔不是因?yàn)槎髟骨槌?,而是劇情已?jīng)到這里了。
二、“飛槳們”的底氣在哪里?
中國(guó)本土深度學(xué)習(xí)平臺(tái)厚積薄發(fā)的依仗,來(lái)自中國(guó)對(duì)深度學(xué)習(xí)產(chǎn)業(yè)的特殊需求。
雖然從總體而言,深度學(xué)習(xí)平臺(tái)的發(fā)展方向都是更體系化,更專業(yè)化,更低門檻。但是因?yàn)閲?guó)內(nèi)外發(fā)展速度、應(yīng)用場(chǎng)景以及產(chǎn)業(yè)水平的差距,在在解決具體問題上,中國(guó)對(duì)深度學(xué)習(xí)平臺(tái)的要求,往往跟國(guó)外千差萬(wàn)別。
舉例而言,作為擁有14億人口的世界工廠,中國(guó)無(wú)論是制造業(yè)還是服務(wù)業(yè),任何一個(gè)程序,都可能應(yīng)用到十幾甚至幾十萬(wàn)個(gè)單位和機(jī)構(gòu),直接面向數(shù)億人,完全不同的用戶體量,一方面決定了中國(guó)場(chǎng)景需求跟國(guó)外需求不完全相同,超大規(guī)模深度學(xué)習(xí)模型訓(xùn)練技術(shù)的需求擺上臺(tái)面,另外還會(huì)催生更多千姿百態(tài)的、低數(shù)量級(jí)用戶完全不需要的應(yīng)用場(chǎng)景。
這樣的總體狀況,使得中國(guó)的深度學(xué)習(xí)對(duì)端到端的推理部署能力和在產(chǎn)業(yè)實(shí)踐當(dāng)中沉淀出來(lái)的模型更為重視。
其次AI市場(chǎng)規(guī)模的快速擴(kuò)張又導(dǎo)致人才相對(duì)稀缺,再加上總體產(chǎn)業(yè)發(fā)展水平還比較落后,因此對(duì)降低AI門檻的需求永無(wú)止境,更進(jìn)一步催化了低代碼乃至無(wú)代碼模型的發(fā)展,而這一切都很難從國(guó)外的深度學(xué)習(xí)平臺(tái)得到幫助,甚至反過(guò)來(lái)是中國(guó)用戶拖著國(guó)外平臺(tái)前進(jìn),這種溫度差,就是中國(guó)深度學(xué)習(xí)平臺(tái)發(fā)展的動(dòng)力。
但是,中國(guó)AI產(chǎn)業(yè)發(fā)展的需求,是給了所有的深度學(xué)習(xí)平臺(tái)同等的機(jī)會(huì),為什么飛槳做到了中國(guó)第一?這在很大程度上,是一個(gè)機(jī)會(huì)青睞了有準(zhǔn)備者的故事。
飛槳的競(jìng)爭(zhēng)優(yōu)勢(shì),首先來(lái)自技術(shù)應(yīng)用能力方面,來(lái)源于百度在AI領(lǐng)域數(shù)十年的技術(shù)積累。早在2013年,百度便成立全球第一個(gè)深度學(xué)習(xí)研究院;而在飛槳誕生之后,百度絕大多數(shù)人工智能項(xiàng)目都是基于飛槳研發(fā)和創(chuàng)新。
相比于其他在后來(lái)才建立的深度學(xué)習(xí)平臺(tái),飛槳的冷啟動(dòng)有了百度研發(fā)這個(gè)巨大的應(yīng)用場(chǎng)景,不僅提升了工具和框架的易用性和成熟度,而且先期積累了更多人工智能的應(yīng)用模型,特別是從2019年開始,百度AI的能力逐漸下沉,開始跟產(chǎn)業(yè)經(jīng)濟(jì)和生產(chǎn)一線相結(jié)合,在飛槳平臺(tái)上也展現(xiàn)出越來(lái)越多的產(chǎn)業(yè)項(xiàng)目,這些與產(chǎn)業(yè)相結(jié)合的人工智能應(yīng)用模型,使得飛槳獲得了更強(qiáng)的競(jìng)爭(zhēng)力。
因?yàn)橛羞@樣的先期發(fā)展基礎(chǔ),所以飛槳有著更強(qiáng)的比較優(yōu)勢(shì),所以很快迎來(lái)了迅速發(fā)展的機(jī)會(huì),平臺(tái)服務(wù)規(guī)模開始不斷擴(kuò)張。
相比于其他平臺(tái),飛槳不僅擁有便捷的開發(fā)框架,而且還有多端多平臺(tái)部署的高性能推理引擎、產(chǎn)業(yè)級(jí)開源模型庫(kù),以及更適合中國(guó)AI場(chǎng)景的超大規(guī)模深度學(xué)習(xí)模型訓(xùn)練技術(shù)。大規(guī)模分布式訓(xùn)練能力在真正的工業(yè)化場(chǎng)景應(yīng)用更加契合,因此用戶數(shù)實(shí)現(xiàn)快速增加。
根據(jù)《深度學(xué)習(xí)平臺(tái)發(fā)展報(bào)告(2022)》顯示,在過(guò)去一年半里,飛槳的項(xiàng)目貢獻(xiàn)人數(shù)(Contributors)增速為60%,關(guān)注度增速為37.6%。均超過(guò)了國(guó)際主流框架。而在總數(shù)上,無(wú)論是活躍度,還是關(guān)注度和貢獻(xiàn)人數(shù),飛槳均超過(guò)其余國(guó)產(chǎn)框架總和。
總體而言,飛槳發(fā)展的最根本動(dòng)力,還是來(lái)自于中國(guó)人工智能進(jìn)入大規(guī)模工程落地階段,深度學(xué)習(xí)隨著AI進(jìn)入千行百業(yè),而需求的推動(dòng)又引發(fā)中國(guó)AI能力的厚積薄發(fā),和AI研發(fā)者的迅速增加,最終帶動(dòng)了國(guó)產(chǎn)平臺(tái)的迅速發(fā)展。
從這種意義上講,飛槳們的崛起,是我國(guó)算法開發(fā)能力、產(chǎn)業(yè)和生態(tài)積累至今的總和。
三、“黃金十年”的舞臺(tái)
在未來(lái),AI將迎來(lái)“黃金十年”,而深度學(xué)習(xí)平臺(tái),有可能成為新時(shí)代的“操作系統(tǒng)”。
有機(jī)構(gòu)預(yù)測(cè),到2030年,AI可能使全球總產(chǎn)量增長(zhǎng)約13萬(wàn)億美元,并推動(dòng)全球GDP每年增長(zhǎng)約1.2%,而在這一輪人工智能帶動(dòng)的增長(zhǎng)中,深度學(xué)習(xí)仍是主導(dǎo)路線,并且會(huì)隨著產(chǎn)業(yè)發(fā)展對(duì)AI底層基礎(chǔ)設(shè)施提出更高要求,以科技巨頭引領(lǐng)的平臺(tái)化生態(tài)布局正不斷加速。正如百度CTO王海峰所言,在人工智能工業(yè)大生產(chǎn)階段,深度學(xué)習(xí)平臺(tái)下接芯片、上承應(yīng)用,相當(dāng)于“人工智能時(shí)代的操作系統(tǒng)”,處于人工智能技術(shù)體系的關(guān)鍵核心位置。
因此,飛槳們并非是一個(gè)“圖方便”的國(guó)內(nèi)自有平臺(tái),或者提升國(guó)內(nèi)AI產(chǎn)業(yè)獨(dú)立性的防御體系,而是是一張通往未來(lái)的船票。它的能力還未完全發(fā)揮,未來(lái)在驅(qū)動(dòng)產(chǎn)業(yè)賦能,推動(dòng)AI發(fā)展上還有更大的空間。
首先,當(dāng)前深度學(xué)習(xí)平臺(tái)主要是幫助軟件開發(fā)者,但是長(zhǎng)遠(yuǎn)來(lái)看,深度學(xué)習(xí)平臺(tái)是鏈接軟硬件的橋梁,平臺(tái)能夠與芯片企業(yè)共同圍繞軟硬協(xié)同進(jìn)行聯(lián)合優(yōu)化,從而提升對(duì)差異化的硬件芯片的適配能力,最終提升整體的AI性能,起到“操作系統(tǒng)”的作用,比如百度飛槳就與硬件廠商深入合作,進(jìn)行廣泛模型適配并開展軟硬一體聯(lián)合優(yōu)化,目前已與超過(guò)20個(gè)廠家,30種以上的芯片完成適配工作,并聯(lián)合發(fā)起硬件生態(tài)共創(chuàng)計(jì)劃。
其次,深度學(xué)習(xí)平臺(tái)還能夠進(jìn)一步提升賦能平臺(tái)廣度,向更多行業(yè)更多領(lǐng)域拓展,并通過(guò)提供端到端代碼實(shí)現(xiàn)方案降低行業(yè)創(chuàng)新門檻,如飛槳提供超過(guò)500個(gè)精選算法和預(yù)訓(xùn)練模型,其中就包含了經(jīng)過(guò)產(chǎn)業(yè)實(shí)踐長(zhǎng)期打磨的主流模型;結(jié)合產(chǎn)業(yè)實(shí)際場(chǎng)景、精心打造了精度與性能平衡PP系列特色模型,覆蓋目標(biāo)檢測(cè)、OCR、語(yǔ)音理解等多個(gè)高頻應(yīng)用場(chǎng)景,可以讓AI產(chǎn)業(yè)應(yīng)用時(shí)達(dá)到事半功倍的效果;飛槳產(chǎn)業(yè)范例庫(kù)和產(chǎn)業(yè)模型選型工具則以真實(shí)產(chǎn)業(yè)場(chǎng)景和數(shù)據(jù)為藍(lán)本進(jìn)行研發(fā),涵蓋智慧城市、智能制造等多個(gè)領(lǐng)域,助力企業(yè)靈活運(yùn)用模型和開發(fā)套件構(gòu)建完整的落地方案,直達(dá)項(xiàng)目落地,降低AI產(chǎn)業(yè)落地難度。
最后深度學(xué)習(xí)平臺(tái)不僅是AI開發(fā)者的聚集地,同時(shí)也是孵化器,當(dāng)前,深度學(xué)習(xí)平臺(tái)正通過(guò)組織培訓(xùn)、技術(shù)指導(dǎo)、賽事等活動(dòng)等方式,與開發(fā)者共建社區(qū)生態(tài)。同時(shí),通過(guò)組織人工智能賽事活動(dòng),推動(dòng)在前沿研究、產(chǎn)業(yè)應(yīng)用中的AI技術(shù)難點(diǎn)攻關(guān)。
總而言之,雖然從客觀上來(lái)講,飛槳等國(guó)內(nèi)平臺(tái)只是邁出了萬(wàn)里長(zhǎng)征第一步,距離其成為AI產(chǎn)業(yè)核心驅(qū)動(dòng)力的“完全形態(tài)”還有很長(zhǎng)的距離,但是深度學(xué)習(xí)平臺(tái)的增長(zhǎng)并非是線性增長(zhǎng),而是技術(shù)水平、算力、用戶規(guī)模、模型數(shù)量的復(fù)合型增長(zhǎng),在“乘數(shù)效應(yīng)”的驅(qū)動(dòng)下,可以想見,在不遠(yuǎn)的未來(lái),深度學(xué)習(xí)平臺(tái)會(huì)在近至自動(dòng)駕駛,遠(yuǎn)至天地探測(cè),小到蛋白質(zhì)折疊預(yù)測(cè),大到核聚變裝置控制的廣闊領(lǐng)域里,為我們的技術(shù)發(fā)展帶來(lái)新的曙光。
所以,中國(guó)的深度學(xué)習(xí)平臺(tái)并不只是逆襲,更是在順風(fēng)飛翔。
作者:錢皓
編輯:安吉拉
轉(zhuǎn)載請(qǐng)?jiān)谖恼麻_頭和結(jié)尾顯眼處標(biāo)注:作者、出處和鏈接。不按規(guī)范轉(zhuǎn)載侵權(quán)必究。
未經(jīng)授權(quán)嚴(yán)禁轉(zhuǎn)載,授權(quán)事宜請(qǐng)聯(lián)系作者本人,侵權(quán)必究。
本文禁止轉(zhuǎn)載,侵權(quán)必究。
授權(quán)事宜請(qǐng)至數(shù)英微信公眾號(hào)(ID: digitaling) 后臺(tái)授權(quán),侵權(quán)必究。



評(píng)論
評(píng)論
推薦評(píng)論
暫無(wú)評(píng)論哦,快來(lái)評(píng)論一下吧!
全部評(píng)論(0條)