久久人妻牲爱视频,亚洲无码视频区,黑人操人妻一区二区,aaa在线视频,日产精品久久久久久久,99熟妇诱惑视频,激情只爱无码,国产精品日韩一区二区,超碰成人三级在线

新火種AI|OpenAI核心資料被盜!谷歌承認(rèn)主動(dòng)攻擊,成本僅150元?

原創(chuàng) 收藏 評(píng)論
舉報(bào) 2024-03-15

作者:文子

編輯:小迪

谷歌,一招殺入OpenAI大本營(yíng)。



谷歌再放大招,竊取OpenAI模型機(jī)密

如果全世界只有一家公司能趕超OpenAI,那谷歌應(yīng)該是第一。

最近,谷歌重磅發(fā)布了一篇論文報(bào)告,里面提出了一種名為“模型竊取”的技術(shù)。通過(guò)模型竊取技術(shù),谷歌成功破解了ChatGPT基礎(chǔ)模型Ada和Babbage的投影矩陣,甚至連內(nèi)部隱藏維度的關(guān)鍵信息也是直接破獲,分別是1024和2048。

這一發(fā)現(xiàn)猶如一記重磅炸彈,在AI界引發(fā)了強(qiáng)烈的震動(dòng)。誰(shuí)也沒想到,號(hào)稱“CloseAI”的OpenAI竟然也會(huì)被竊取模型機(jī)密的一天。    

更恐怖的是,這種模型竊取技術(shù)還非常簡(jiǎn)單。只要你擁有ChatGPT這類封閉大模型的API,就可以通過(guò)API接口,發(fā)送不到2000次經(jīng)過(guò)精心設(shè)計(jì)好的查詢,然后去分析它生成的輸出,就可以逐步推斷出模型的內(nèi)部結(jié)構(gòu)和參數(shù)。

雖然這種方法不能完全復(fù)制原始模型,但已經(jīng)足以竊取它的部分能力。而且這種攻擊非常高效,不需要用太多的成本,就可以拿到模型的關(guān)鍵信息。

按照谷歌的調(diào)用次數(shù)來(lái)看,僅僅只需要不到20美金(約合150元人民幣)的成本,就可以完成模型竊取的操作,并且這種方法同樣適用于GPT-3.5和GPT-4。

換句話說(shuō),就是不費(fèi)吹灰之力獲得了一個(gè)大模型理解自然語(yǔ)言的能力,還能用來(lái)構(gòu)建一個(gè)性能相近的“山寨版”模型,既省事又省錢。

反觀OpenAI,被競(jìng)爭(zhēng)對(duì)手低價(jià)破解模型機(jī)密,真的坐得住嗎?坐不住。截至目前,OpenAI已經(jīng)修改了模型API,有心人想復(fù)現(xiàn)谷歌的操作是不可能了。

值得一提的是,谷歌研究團(tuán)隊(duì)中就有一位OpenAI研究員。不過(guò)作為正經(jīng)安全研究,他們?cè)谔崛∧P妥詈笠粚訁?shù)之前就已經(jīng)征得OpenAI同意,而在攻擊完成后,也刪除了所有相關(guān)數(shù)據(jù)。    

但不管怎么說(shuō),谷歌的實(shí)驗(yàn)足以證明一點(diǎn),哪怕OpenAI緊閉大門也并不保險(xiǎn)。


大模型全面受挫,敲響開閉源警鐘

既然封閉的大模型都無(wú)法幸免,開源的大模型又會(huì)如何呢?

基于這一點(diǎn),谷歌針對(duì)不同規(guī)模和結(jié)構(gòu)的開源模型進(jìn)行了一系列實(shí)驗(yàn),比如GPT-2的不同版本和LLaMA系列模型。

要知道,GPT-2是一個(gè)開源的預(yù)訓(xùn)練語(yǔ)言模型,分為小型模型(117M)和大型模型(345M)兩種。而在對(duì)GPT-2的攻擊中,谷歌通過(guò)分析模型的最終隱藏激活向量并執(zhí)行SVD發(fā)現(xiàn),盡管GPT-2小型模型理論上具有768個(gè)隱藏單元,但實(shí)際上只有757個(gè)有效的隱藏單元在起作用。

這也就意味著GPT-2可能在實(shí)際使用中,并沒有充分利用其設(shè)計(jì)的全部能力,或者在訓(xùn)練過(guò)程中某些維度的重要性不如其他維度。

此外,谷歌還研究了模型中的一種叫做“歸一化層”的東西對(duì)于攻擊的影響。一般來(lái)說(shuō),歸一化層的作用是讓訓(xùn)練更加穩(wěn)定,從而提升模型的表現(xiàn)。然而谷歌發(fā)現(xiàn),即使模型加入了歸一化層,攻擊的效果也并沒有減弱。這說(shuō)明即使考慮了現(xiàn)代深度學(xué)習(xí)模型中常見的復(fù)雜結(jié)構(gòu),攻擊方法也依然有效。    

為了進(jìn)一步驗(yàn)證攻擊的范圍,谷歌還將目光瞄向更大、更復(fù)雜的LLaMA模型。它是由Meta發(fā)布的大語(yǔ)言系列模型,完整的名字是Large Language Model Meta AI,可以說(shuō)LLaMA是目前全球最活躍的AI開源社區(qū)。

通過(guò)對(duì)LLaMA系列模型進(jìn)行攻擊,谷歌成功地從這些模型中提取了嵌入投影層的維度信息。值得注意的是,即使在這些模型采用先進(jìn)的技術(shù),如混合精度訓(xùn)練和量化,攻擊依然能夠成功,這表明攻擊方法的普適性和魯棒性。

可以說(shuō),谷歌給閉源和開源兩大領(lǐng)域同時(shí)敲響了一記警鐘。


AI三巨頭對(duì)線,2024誰(shuí)輸誰(shuí)贏?

從嚴(yán)格意義上來(lái)講,OpenAI、谷歌、Meta就是爭(zhēng)奪AGI圣杯的三大巨頭。

其中,Meta和OpenAI完全相反,前者走的是開源路線,而后者主要打造閉源模型。但谷歌和他們完全不一樣,閉源與開源雙線作戰(zhàn),閉源對(duì)抗OpenAI,開源對(duì)抗Meta。

在人工智能領(lǐng)域里,谷歌可以算是開源大模型的鼻祖。今天幾乎所有的大語(yǔ)言模型,都是基于谷歌在2017年發(fā)布的Transformer論文,這篇論文顛覆了整個(gè)自然語(yǔ)言處理領(lǐng)域的研究范式。而市面上最早的一批開源AI模型,也是谷歌率先發(fā)布的BERT和T5。    

然而,隨著OpenAI在2022年底發(fā)布閉源模型ChatGPT,谷歌也開始調(diào)整其策略,逐漸轉(zhuǎn)向閉源模型。這一轉(zhuǎn)變使得開源大模型的領(lǐng)導(dǎo)地位被Meta的LLaMA所取代,后來(lái)又有法國(guó)的開源大模型公司Mistra AI走紅,尤其是其MoE模型備受行業(yè)追捧。

直到谷歌今年再次發(fā)布開源大模型Gemma,已經(jīng)比Meta的LLaMA整整晚了一年。

很顯然,Gemma這次的發(fā)布標(biāo)志著谷歌在大模型戰(zhàn)略上的巨大轉(zhuǎn)變,這一舉動(dòng)意味著谷歌開始兼顧開源和閉源的新策略,而其背后的目的也是顯而易見。

眾所周知,當(dāng)前大模型領(lǐng)域的競(jìng)爭(zhēng)已經(jīng)形成了一種錯(cuò)綜復(fù)雜的打壓鏈格局。其中OpenAI牢牢站在鏈條頂端,而它所打壓的恰恰是那些有潛力追趕上它的競(jìng)爭(zhēng)對(duì)手,比如谷歌和Anthropic。而Mistral作為一股新興力量,估計(jì)也正在被列入其中。

如果非要排列一個(gè)打壓鏈條,那可以歸結(jié)為:OpenAI→Google &Anthropic & Mistral→ Meta→其它大模型公司。    

可以說(shuō),無(wú)論在閉源還是開源領(lǐng)域,谷歌都沒能確立絕對(duì)的領(lǐng)先地位。

所以這也不難理解,為什么有專業(yè)人士會(huì)認(rèn)為,谷歌選擇在此時(shí)重返開源賽場(chǎng),是被迫的。谷歌之所以開源主打的是性能最強(qiáng)大的小規(guī)模模型,就是希望腳踢M(jìn)eta和Mistral;而閉源主打的是規(guī)模大的效果最好的大模型,就是為了希望盡快追上OpenAI。

但無(wú)論如何,在未來(lái)的對(duì)壘格局里,谷歌已經(jīng)先發(fā)制人,成功將壓力給到OpenAI和Meta。

這一次,關(guān)鍵在于OpenAI和Meta該如何應(yīng)對(duì)。


本文系作者授權(quán)數(shù)英發(fā)表,內(nèi)容為作者獨(dú)立觀點(diǎn),不代表數(shù)英立場(chǎng)。
轉(zhuǎn)載請(qǐng)?jiān)谖恼麻_頭和結(jié)尾顯眼處標(biāo)注:作者、出處和鏈接。不按規(guī)范轉(zhuǎn)載侵權(quán)必究。
本文系作者授權(quán)數(shù)英發(fā)表,內(nèi)容為作者獨(dú)立觀點(diǎn),不代表數(shù)英立場(chǎng)。
未經(jīng)授權(quán)嚴(yán)禁轉(zhuǎn)載,授權(quán)事宜請(qǐng)聯(lián)系作者本人,侵權(quán)必究。
本內(nèi)容為作者獨(dú)立觀點(diǎn),不代表數(shù)英立場(chǎng)。
本文禁止轉(zhuǎn)載,侵權(quán)必究。
本文系數(shù)英原創(chuàng),未經(jīng)允許不得轉(zhuǎn)載。
授權(quán)事宜請(qǐng)至數(shù)英微信公眾號(hào)(ID: digitaling) 后臺(tái)授權(quán),侵權(quán)必究。

    評(píng)論

    文明發(fā)言,無(wú)意義評(píng)論將很快被刪除,異常行為可能被禁言
    DIGITALING
    登錄后參與評(píng)論

    評(píng)論

    文明發(fā)言,無(wú)意義評(píng)論將很快被刪除,異常行為可能被禁言
    800

    推薦評(píng)論

    暫無(wú)評(píng)論哦,快來(lái)評(píng)論一下吧!

    全部評(píng)論(0條)

    屯留县| 沙雅县| 绍兴县| 湖北省| 兴山县| 原阳县| 嵊泗县| 绥中县| 安新县| 商洛市| 永福县| 永春县| 西城区| 昆明市| 渑池县| 宝应县| 肃宁县| 略阳县| 平顶山市| 泉州市| 中西区| 咸宁市| 五大连池市| 南溪县| 遂川县| 新乐市| 年辖:市辖区| 华蓥市| 集贤县| 丹凤县| 铁力市| 拉孜县| 淮安市| 峨眉山市| 东台市| 合川市| 凉山| 民权县| 台北市| 开封县| 洛扎县|