新火種AI|實屬罕見！四大AI頂流同臺，有哪些關(guān)鍵信息值得關(guān)注？

原創(chuàng) 贊收藏評論

舉報 2024-06-19

掃描,分享朋友圈

作者：小巖

編輯：彩云

在有著“AI春晚”之稱的2024年智源大會上，非常難得的一幕出現(xiàn)了：當(dāng)下國內(nèi)的四大AI頂流公司——月之暗面，百川智能，智譜AI，面壁智能齊聚一堂，十分罕見的同臺了。

從體量上來說，四家大模型公司都稱得上是獨角獸級別，它們的創(chuàng)始人聚在一起，分享各自對大模型未來的觀點和看法，這對于整個行業(yè)來說，無疑是值得標(biāo)記的一筆。

有意思的是，這四家大模型獨角獸掌舵人——百川智能的CEO王小川，智譜AI CEO張鵬，月之暗面CEO楊植麟以及面壁智能聯(lián)合創(chuàng)始人，CEO李大海都出身于清華，是名副其實的師出同門。

圖片1.png

關(guān)于價格，安全等話題：四家獨角獸給出的答案各有側(cè)重。

在智源大會上，四位出身于清華的大模型獨角獸掌舵人一同出席了《尖峰對話：通往AGI之路》環(huán)節(jié)。

在對話中，大家對于大模型的價格戰(zhàn)問題表達(dá)了自己的看法。王小川就公開表示，價格戰(zhàn)對于中國發(fā)展大模型是特別好的事，自己也是積極看待的。目前打響的大模型價格戰(zhàn)，主要是云廠商之間的競爭。包括火山引擎，阿里云，騰訊云，百度云等。

可在此之前，王小川是旗幟鮮明的反對價格戰(zhàn)的，表示這是巨頭間的游戲，百川智能不愿意摻和進(jìn)去。

其實王小川先前的想法并非個例。零一萬物創(chuàng)始人李開復(fù)也在大會別的環(huán)節(jié)上表示，當(dāng)下AI市場存在一個比較嚴(yán)重的問題，就是很多大公司沒有認(rèn)識到軟件的價值，不愿意為軟件付費。結(jié)果很多大模型公司來競標(biāo)，結(jié)果卻是越競越低，做到最后做一單賠一單，沒有利潤。也正因此，他認(rèn)為，零一萬物堅決做to C，不做“賠錢的to B”。而智源研究院的院長王仲遠(yuǎn)也認(rèn)為，當(dāng)下選擇大模型優(yōu)先考慮的肯定不是性價比，而是能否真正為自己的產(chǎn)品賦能。在此基礎(chǔ)之上，大模型的價格終歸會達(dá)到一個合理的水平。

大模型是否是通往AGI的基石：大家所存在的共識與非共識。

除了對于降價潮這樣的“周邊問題”表達(dá)看法，對于“大模型是否是通往AGI之路的基石”這一熱點話題，四位掌舵人也給出了自己的看法和觀點。

圖片2.png

月之暗面的楊植麟認(rèn)為，大模型的第一性原理，就是要不斷提升模型的規(guī)模。這件事從本質(zhì)上來說，是在做壓縮，壓縮就會產(chǎn)生智能。當(dāng)然，這個過程會面臨很多的挑戰(zhàn)，諸如數(shù)據(jù)流失，某些領(lǐng)域的數(shù)據(jù)資料較為稀缺等。由此可見，數(shù)據(jù)是當(dāng)前存在的最大的問題和變量，而規(guī)模定律或大模型本身并沒有什么問題。

楊植麟還表示，“如何定義AGI”這件事至關(guān)重要，但不必急于現(xiàn)在就給出一個精確量化的定義。AGI可能更多地是一種定性的概念，一種感覺上的共識。其核心作用在于，能夠使社會和個人對未來可能發(fā)生的變化有所準(zhǔn)備。畢竟，這項技術(shù)的發(fā)展速度可能異常迅猛。

百川智能的王小川則認(rèn)為，“基石”這個詞是沒有問題的，但它只是在逼近AGI。從根本上說，這需要一個范式的轉(zhuǎn)變，而今天大家看到的規(guī)模定律的成效只是邁出的第一步。王小川認(rèn)為，從某種程度上說，我們目前已經(jīng)進(jìn)入了AGI的時代，這個時代有能力吸引更多的科學(xué)家和資源，共同邁向AGI。但僅憑目前公開的規(guī)模定律無法完全實現(xiàn)AGI，光靠Scaling Law，也是做不到AGI的。

智譜AI的張鵬則肯定大模型是基石之一。他認(rèn)為，當(dāng)下人工智能的從業(yè)者很“實用主義”，大家都十分關(guān)心到底能不能真正的解決問題，到底能不能真的向每個人心中定義的AGI路徑上進(jìn)行推動。目前來說，Scaling Law還在生效，還在往前前進(jìn)，大模型也依然在很有效地推進(jìn)。但說到未來能否真的幫助人們到達(dá)頂峰，尚未可知。

或許是因為面壁智能的李大海出自數(shù)學(xué)專業(yè)，他的表達(dá)較為嚴(yán)謹(jǐn)。他表示，大模型一定是當(dāng)前所有技術(shù)里，可以在通往AGI這個方向上走得最遠(yuǎn)的，但它能否直達(dá)，現(xiàn)在來看還有很多未知因素。李大海表示，“聯(lián)想到《思考：快與慢》的觀點，人腦有兩個系統(tǒng)：快速直觀的感性思考與慢速細(xì)致的理性思考。現(xiàn)在的云端大模型主要是在處理人的大腦系統(tǒng)，一是“快思考”的工作；二是“慢思考”的系統(tǒng)，即要做各種各樣推理，搜索空間去做搜索，組合，從而來完成一個任務(wù)”。

想要實現(xiàn)“慢思考”的能力，需要大模型通過Agent技術(shù)外部化或者把它內(nèi)化為自己的能力，抑或通過端側(cè)大模型的部署來實現(xiàn)。未來的大模型是否有這樣的能力？這需要大家去進(jìn)行進(jìn)一步的探索。

圖片3.png

由此可見，在短期內(nèi)對對AGI的進(jìn)展進(jìn)行評估，會是一個極具挑戰(zhàn)性的問題。

大模型是否應(yīng)該開源？大家普遍共識：開源并不會削弱競爭力。

近期斯坦福的三位學(xué)生抄襲面壁智能MiniCPM大模型的事件正鬧的沸沸揚揚，而面壁智能的李大海也在會上首次公開做出了回應(yīng)。他表示，“我們完全沒有想到我們的工作會以這種方式出圈，挺惶恐的”。

圖片4.png

這個具體事件要追溯到5月20日，面壁智能開源了MiniCPM大模型之后。5月29日，三位斯坦福的本科生在該模型基礎(chǔ)上做了非常簡單的高斯疊加，就號稱是自己的模型。這個模型一下子變得很受歡迎，因為該團(tuán)隊宣稱這個模型的多模態(tài)能力跟GPT4-V完全對標(biāo)，但是參數(shù)只有后者的1%，并且只需要500美金就能夠訓(xùn)練出來。

事件發(fā)生僅僅過了一天，開元社區(qū)的熱心參與者便發(fā)現(xiàn)了事情的真相，并將此曝光。

圖片6.png

在大會上，李大海對于這一事件進(jìn)行了表態(tài)。他表示，3位本科生所提到的“模型的多模態(tài)能力跟GPT4-V完全對標(biāo)，但是參數(shù)只有后者的1%”是真實的，面壁智能確實具備這樣的實力，但其耗費的成本遠(yuǎn)遠(yuǎn)不止500美金，其實是需要花很多錢的。李大海認(rèn)為，這件事讓面壁智能更加堅定了開源的力量。開源力量很強大，不光有做原創(chuàng)工作的人，還有很參與者貢獻(xiàn)需求，貢獻(xiàn)反饋，這也是開源生態(tài)重要組成部分。持續(xù)做開源貢獻(xiàn)，勢必能夠給公司帶來正向收益。

百川智能同樣是開源的參與者，王小川解釋了開源的動機：“第一，開源在市場上有這個需求，2023年6月開源了第一版，9月份開源了第二版。去年，中國對大模型充滿熱情與緊迫感，開源策略在市場上產(chǎn)生了積極影響。作為認(rèn)真開源的商業(yè)化廠商，百川獲得了市場的認(rèn)可，這對我們來說是一個巨大的鼓舞，無論是在人才儲備還是資本關(guān)注方面，都為行業(yè)樹立了標(biāo)桿。第二，開源也體現(xiàn)了一種心態(tài)。我們認(rèn)識到模型的快速迭代，今天的領(lǐng)先并不意味著明天的競爭力。因此，開源并沒有削弱我們的商業(yè)競爭力”。更重要的是，眾多公司參與開源，共同推動中國生態(tài)追趕美國，保護(hù)知識產(chǎn)權(quán)，這會使整個生態(tài)持續(xù)繁榮的發(fā)展。

四家獨角獸大模型公司的同臺是具有極其重要的意義的，這不僅體現(xiàn)了行業(yè)內(nèi)的合作精神和開放交流的態(tài)度，也會推動整個行業(yè)的發(fā)展和創(chuàng)新。

本文系作者授權(quán)數(shù)英發(fā)表，內(nèi)容為作者獨立觀點，不代表數(shù)英立場。
未經(jīng)授權(quán)嚴(yán)禁轉(zhuǎn)載，授權(quán)事宜請聯(lián)系作者本人，侵權(quán)必究。