新火種AI|實屬罕見!四大AI頂流同臺,有哪些關(guān)鍵信息值得關(guān)注?
作者:小巖
編輯:彩云
在有著“AI春晚”之稱的2024年智源大會上,非常難得的一幕出現(xiàn)了:當(dāng)下國內(nèi)的四大AI頂流公司——月之暗面,百川智能,智譜AI,面壁智能齊聚一堂,十分罕見的同臺了。
從體量上來說,四家大模型公司都稱得上是獨角獸級別,它們的創(chuàng)始人聚在一起,分享各自對大模型未來的觀點和看法,這對于整個行業(yè)來說,無疑是值得標(biāo)記的一筆。
有意思的是,這四家大模型獨角獸掌舵人——百川智能的CEO王小川,智譜AI CEO張鵬,月之暗面CEO楊植麟以及面壁智能聯(lián)合創(chuàng)始人,CEO李大海都出身于清華,是名副其實的師出同門。

關(guān)于價格,安全等話題:四家獨角獸給出的答案各有側(cè)重。
在智源大會上,四位出身于清華的大模型獨角獸掌舵人一同出席了《尖峰對話:通往AGI之路》環(huán)節(jié)。
在對話中,大家對于大模型的價格戰(zhàn)問題表達(dá)了自己的看法。王小川就公開表示,價格戰(zhàn)對于中國發(fā)展大模型是特別好的事,自己也是積極看待的。目前打響的大模型價格戰(zhàn),主要是云廠商之間的競爭。包括火山引擎,阿里云,騰訊云,百度云等。
可在此之前,王小川是旗幟鮮明的反對價格戰(zhàn)的,表示這是巨頭間的游戲,百川智能不愿意摻和進(jìn)去。
其實王小川先前的想法并非個例。零一萬物創(chuàng)始人李開復(fù)也在大會別的環(huán)節(jié)上表示,當(dāng)下AI市場存在一個比較嚴(yán)重的問題,就是很多大公司沒有認(rèn)識到軟件的價值,不愿意為軟件付費。結(jié)果很多大模型公司來競標(biāo),結(jié)果卻是越競越低,做到最后做一單賠一單,沒有利潤。也正因此,他認(rèn)為,零一萬物堅決做to C,不做“賠錢的to B”。而智源研究院的院長王仲遠(yuǎn)也認(rèn)為,當(dāng)下選擇大模型優(yōu)先考慮的肯定不是性價比,而是能否真正為自己的產(chǎn)品賦能。在此基礎(chǔ)之上,大模型的價格終歸會達(dá)到一個合理的水平。
大模型是否是通往AGI的基石:大家所存在的共識與非共識。
除了對于降價潮這樣的“周邊問題”表達(dá)看法,對于“大模型是否是通往AGI之路的基石”這一熱點話題,四位掌舵人也給出了自己的看法和觀點。

月之暗面的楊植麟認(rèn)為,大模型的第一性原理,就是要不斷提升模型的規(guī)模。這件事從本質(zhì)上來說,是在做壓縮,壓縮就會產(chǎn)生智能。當(dāng)然,這個過程會面臨很多的挑戰(zhàn),諸如數(shù)據(jù)流失,某些領(lǐng)域的數(shù)據(jù)資料較為稀缺等。由此可見,數(shù)據(jù)是當(dāng)前存在的最大的問題和變量,而規(guī)模定律或大模型本身并沒有什么問題。
楊植麟還表示,“如何定義AGI”這件事至關(guān)重要,但不必急于現(xiàn)在就給出一個精確量化的定義。AGI可能更多地是一種定性的概念,一種感覺上的共識。其核心作用在于,能夠使社會和個人對未來可能發(fā)生的變化有所準(zhǔn)備。畢竟,這項技術(shù)的發(fā)展速度可能異常迅猛。
百川智能的王小川則認(rèn)為,“基石”這個詞是沒有問題的,但它只是在逼近AGI。從根本上說,這需要一個范式的轉(zhuǎn)變,而今天大家看到的規(guī)模定律的成效只是邁出的第一步。王小川認(rèn)為,從某種程度上說,我們目前已經(jīng)進(jìn)入了AGI的時代,這個時代有能力吸引更多的科學(xué)家和資源,共同邁向AGI。但僅憑目前公開的規(guī)模定律無法完全實現(xiàn)AGI, 光靠Scaling Law,也是做不到AGI的。
智譜AI的張鵬則肯定大模型是基石之一。他認(rèn)為,當(dāng)下人工智能的從業(yè)者很“實用主義”,大家都十分關(guān)心到底能不能真正的解決問題,到底能不能真的向每個人心中定義的AGI路徑上進(jìn)行推動。目前來說,Scaling Law還在生效,還在往前前進(jìn),大模型也依然在很有效地推進(jìn)。但說到未來能否真的幫助人們到達(dá)頂峰,尚未可知。
或許是因為面壁智能的李大海出自數(shù)學(xué)專業(yè),他的表達(dá)較為嚴(yán)謹(jǐn)。他表示,大模型一定是當(dāng)前所有技術(shù)里,可以在通往AGI這個方向上走得最遠(yuǎn)的,但它能否直達(dá),現(xiàn)在來看還有很多未知因素。李大海表示,“聯(lián)想到《思考:快與慢》的觀點,人腦有兩個系統(tǒng):快速直觀的感性思考與慢速細(xì)致的理性思考。現(xiàn)在的云端大模型主要是在處理人的大腦系統(tǒng),一是“快思考”的工作;二是“慢思考”的系統(tǒng),即要做各種各樣推理,搜索空間去做搜索,組合,從而來完成一個任務(wù)”。
想要實現(xiàn)“慢思考”的能力,需要大模型通過Agent技術(shù)外部化或者把它內(nèi)化為自己的能力,抑或通過端側(cè)大模型的部署來實現(xiàn)。未來的大模型是否有這樣的能力?這需要大家去進(jìn)行進(jìn)一步的探索。

由此可見,在短期內(nèi)對對AGI的進(jìn)展進(jìn)行評估,會是一個極具挑戰(zhàn)性的問題。
大模型是否應(yīng)該開源?大家普遍共識:開源并不會削弱競爭力。
近期斯坦福的三位學(xué)生抄襲面壁智能MiniCPM大模型的事件正鬧的沸沸揚揚,而面壁智能的李大海也在會上首次公開做出了回應(yīng)。他表示,“我們完全沒有想到我們的工作會以這種方式出圈,挺惶恐的”。

這個具體事件要追溯到5月20日,面壁智能開源了MiniCPM大模型之后。5月29日,三位斯坦福的本科生在該模型基礎(chǔ)上做了非常簡單的高斯疊加,就號稱是自己的模型。這個模型一下子變得很受歡迎,因為該團(tuán)隊宣稱這個模型的多模態(tài)能力跟GPT4-V完全對標(biāo),但是參數(shù)只有后者的1%,并且只需要500美金就能夠訓(xùn)練出來。
事件發(fā)生僅僅過了一天,開元社區(qū)的熱心參與者便發(fā)現(xiàn)了事情的真相,并將此曝光。

在大會上,李大海對于這一事件進(jìn)行了表態(tài)。他表示,3位本科生所提到的“模型的多模態(tài)能力跟GPT4-V完全對標(biāo),但是參數(shù)只有后者的1%”是真實的,面壁智能確實具備這樣的實力,但其耗費的成本遠(yuǎn)遠(yuǎn)不止500美金,其實是需要花很多錢的。李大海認(rèn)為,這件事讓面壁智能更加堅定了開源的力量。開源力量很強大,不光有做原創(chuàng)工作的人,還有很參與者貢獻(xiàn)需求,貢獻(xiàn)反饋,這也是開源生態(tài)重要組成部分。持續(xù)做開源貢獻(xiàn),勢必能夠給公司帶來正向收益。
百川智能同樣是開源的參與者,王小川解釋了開源的動機:“第一,開源在市場上有這個需求,2023年6月開源了第一版,9月份開源了第二版。去年,中國對大模型充滿熱情與緊迫感,開源策略在市場上產(chǎn)生了積極影響。作為認(rèn)真開源的商業(yè)化廠商,百川獲得了市場的認(rèn)可,這對我們來說是一個巨大的鼓舞,無論是在人才儲備還是資本關(guān)注方面,都為行業(yè)樹立了標(biāo)桿。第二,開源也體現(xiàn)了一種心態(tài)。我們認(rèn)識到模型的快速迭代,今天的領(lǐng)先并不意味著明天的競爭力。因此,開源并沒有削弱我們的商業(yè)競爭力”。更重要的是,眾多公司參與開源,共同推動中國生態(tài)追趕美國,保護(hù)知識產(chǎn)權(quán),這會使整個生態(tài)持續(xù)繁榮的發(fā)展。
四家獨角獸大模型公司的同臺是具有極其重要的意義的,這不僅體現(xiàn)了行業(yè)內(nèi)的合作精神和開放交流的態(tài)度,也會推動整個行業(yè)的發(fā)展和創(chuàng)新。
轉(zhuǎn)載請在文章開頭和結(jié)尾顯眼處標(biāo)注:作者、出處和鏈接。不按規(guī)范轉(zhuǎn)載侵權(quán)必究。
未經(jīng)授權(quán)嚴(yán)禁轉(zhuǎn)載,授權(quán)事宜請聯(lián)系作者本人,侵權(quán)必究。
本文禁止轉(zhuǎn)載,侵權(quán)必究。
授權(quán)事宜請至數(shù)英微信公眾號(ID: digitaling) 后臺授權(quán),侵權(quán)必究。



評論
評論
推薦評論
暫無評論哦,快來評論一下吧!
全部評論(0條)