91高清在线视频,天堂va在线观看,成人h动漫精品一区二区器材,超碰在线成人,国产日本欧美在线,男人的天堂伊人网,影音先锋美女

每日經(jīng)濟(jì)新聞
要聞

每經(jīng)網(wǎng)首頁(yè) > 要聞 > 正文

羅福莉、朱軍、劉知遠(yuǎn)、安波與王仲遠(yuǎn)對(duì)談:“重構(gòu)世界”才剛剛開(kāi)始,語(yǔ)言模型與世界模型正并駕齊驅(qū)

2026-06-13 10:38:30

6月12日,第八屆“北京智源大會(huì)”圓桌環(huán)節(jié),多位學(xué)者與產(chǎn)業(yè)領(lǐng)軍者圍繞“重構(gòu)世界”展開(kāi)對(duì)談。對(duì)話涉及大模型能力躍升、AI自進(jìn)化等核心問(wèn)題。專家認(rèn)為,AI正從“執(zhí)行工具”變?yōu)椤皠?chuàng)造智能的智能”,語(yǔ)言模型現(xiàn)階段領(lǐng)先,世界模型剛剛起步,未來(lái)應(yīng)關(guān)注更通用、有泛化能力的世界模型,語(yǔ)言模型和世界模型有望互通。

每經(jīng)記者|可楊    每經(jīng)編輯|黃博文    

當(dāng)AI coding(利用人工智能技術(shù)輔助或自動(dòng)生成代碼的開(kāi)發(fā)方式)突破臨界點(diǎn)、智能體加速自進(jìn)化,“AI創(chuàng)造AI”已不再是遙遠(yuǎn)的設(shè)想。

6月12日,第八屆“北京智源大會(huì)”開(kāi)幕式圓桌環(huán)節(jié),在智源研究院院長(zhǎng)王仲遠(yuǎn)的主持下,小米MiMo大模型負(fù)責(zé)人羅福莉,清華大學(xué)教授、生數(shù)科技創(chuàng)始人朱軍,清華大學(xué)教授、面壁智能首席科學(xué)家劉知遠(yuǎn)以及南洋理工大學(xué)校長(zhǎng)講席教授安波,圍繞“重構(gòu)世界”這一主題展開(kāi)對(duì)談。

幾位長(zhǎng)期身處大模型研發(fā)一線的學(xué)者與產(chǎn)業(yè)領(lǐng)軍者,從最新模型的能力躍升談起,延伸至大語(yǔ)言模型與世界模型的路徑之爭(zhēng)、遞歸式自我改進(jìn)的現(xiàn)實(shí)進(jìn)展,以及AI(人工智能)自進(jìn)化是否已經(jīng)發(fā)生等核心問(wèn)題。

當(dāng)AI從“執(zhí)行工具”演變?yōu)椤皠?chuàng)造智能的智能”,數(shù)字世界與物理世界的重構(gòu)將沿著怎樣的路徑展開(kāi)?哪一條路會(huì)先抵達(dá)?以下為對(duì)話實(shí)錄的節(jié)選,我們進(jìn)行了不影響原意的整理:

Anthropic新模型是“中間產(chǎn)物”還是質(zhì)變臨界點(diǎn)?

羅福莉:其實(shí),F(xiàn)able 5(指Anthropic新模型)目前的訓(xùn)練結(jié)果,是一個(gè)非??茖W(xué)地去做Scaling的中間的產(chǎn)物。從發(fā)布的整個(gè)參數(shù)量級(jí)來(lái)看,我們猜測(cè)它應(yīng)該是目前最強(qiáng)、最大的開(kāi)源模型的幾倍。比如,在預(yù)訓(xùn)練數(shù)量級(jí)上,做了幾倍的Scaling(規(guī)模擴(kuò)張);其次,在預(yù)訓(xùn)練或者說(shuō)在強(qiáng)化學(xué)習(xí)上,應(yīng)該也有非常大的、至少是數(shù)量級(jí)的投入。

此外,由于我們從Chat(聊天機(jī)器人)時(shí)代邁向Agent(智能體)時(shí)代,模型的訓(xùn)練數(shù)據(jù)已經(jīng)從自然的互聯(lián)網(wǎng)文本數(shù)據(jù)邁向了人和AI共同產(chǎn)生的合成數(shù)據(jù),數(shù)據(jù)的Scaling也到了一個(gè)新的量級(jí)。

在我看來(lái),F(xiàn)able 5這款大模型,是在預(yù)訓(xùn)練參數(shù)規(guī)模、訓(xùn)練數(shù)據(jù)與Agent合成數(shù)據(jù),以及測(cè)試時(shí)規(guī)模擴(kuò)展(test-time Scaling)和強(qiáng)化學(xué)習(xí)相結(jié)合這三個(gè)維度上,完成了一個(gè)非常自然的外延拓展后形成的中間產(chǎn)物。

朱軍:模型規(guī)模與數(shù)據(jù)進(jìn)行Scaling時(shí),性能提升效果十分突出。其中也包括我們常說(shuō)的對(duì)物理世界各類物理規(guī)律的模擬與仿真,過(guò)去兩年多以來(lái),該方向的相關(guān)進(jìn)展是看得到的。一開(kāi)始大家可能會(huì)看到各種“幻覺(jué)”,但今天其實(shí)已經(jīng)可以做出非常高質(zhì)量的專業(yè)內(nèi)容,在部分場(chǎng)合可以達(dá)到影視級(jí)的標(biāo)準(zhǔn)。

我覺(jué)得這都是在走同一條路,即把模型做得更加精細(xì),數(shù)據(jù)質(zhì)量、規(guī)模,還有大規(guī)模訓(xùn)練,整體上有一個(gè)提升。但后面再邁向物理世界的時(shí)候,大家也會(huì)討論,這種物理規(guī)律是不是真的能夠?qū)W會(huì)?

我相信,當(dāng)基礎(chǔ)模型本身有了顯著提升之后,無(wú)論是較為嚴(yán)謹(jǐn)?shù)倪壿嬐评怼⑽锢硪?guī)律的建模,還是3D等任務(wù),基本都可以變得更加高效地完成。當(dāng)然,具體方式會(huì)因場(chǎng)景而異:有些場(chǎng)景可能并不需要非常精細(xì)、精準(zhǔn)的處理,大部分情況下依靠直觀的方式就能滿足需求。而這恰恰是模型帶來(lái)的最大好處。

我覺(jué)得有一個(gè)點(diǎn)是非常對(duì)的。大家常說(shuō)用Agent去解決問(wèn)題時(shí),之前會(huì)消耗很多Token(詞元),但現(xiàn)在新版本在解決多任務(wù)時(shí),Token消耗量變少了,我覺(jué)得這是一個(gè)非常正確的方向,也應(yīng)該是大家去追求的目標(biāo)。因?yàn)槲覀冊(cè)谧龊芏嗳蝿?wù)的時(shí)候,其實(shí)是需要有一個(gè)高于人的智能來(lái)幫我們調(diào)用工具和思考,我想這可能是大模型未來(lái)可以進(jìn)一步釋放出來(lái)的能力。

AI自進(jìn)化是否已經(jīng)發(fā)生?

安波:最近“自演化”這個(gè)概念特別火,無(wú)論是Prompt(提示詞)還是Agent,都是通過(guò)獲取更多人的使用數(shù)據(jù)或者得到更多反饋,從而讓模型能力持續(xù)增強(qiáng)。我覺(jué)得這一點(diǎn)是對(duì)的。

智能體還在起步階段,未來(lái)還有很長(zhǎng)的路要走?,F(xiàn)在可能很多智能體還停留在通用階段,我覺(jué)得未來(lái)更大的潛力,可能是其真正落到工業(yè)界的那些垂直領(lǐng)域,去解決大家特別在乎的那些問(wèn)題。

羅福莉:坦率來(lái)講,在上一代模型中,尤其是去年,我覺(jué)得頂尖模型的能力上限可能體現(xiàn)在非常好的“執(zhí)行”,尤其當(dāng)指令非常清晰的時(shí)候,執(zhí)行是比較完美的。但到今天,我們發(fā)現(xiàn)頂尖模型已經(jīng)從“執(zhí)行”外延到去解決一些抽象性的問(wèn)題。

拿一個(gè)完整的科研歷程舉例。從提出假設(shè),到設(shè)計(jì)實(shí)驗(yàn),到真正動(dòng)手執(zhí)行實(shí)驗(yàn),到設(shè)計(jì)合理的觀測(cè)指標(biāo)去驗(yàn)證實(shí)驗(yàn)的合理性,最后一步是需要和同行進(jìn)行密切交流,充分共享研究context(上下文),再去打磨整個(gè)假設(shè)或idea(想法),這是一個(gè)很完整的研究流程。

我們現(xiàn)在已經(jīng)能看到,大模型已經(jīng)從最初的“執(zhí)行”這一層能力,慢慢外延到能夠去設(shè)計(jì)合理的驗(yàn)證指標(biāo),驗(yàn)證自己執(zhí)行結(jié)果的準(zhǔn)確性,并能夠去規(guī)劃整個(gè)實(shí)驗(yàn)流程??赡墁F(xiàn)在唯一還有差距的地方是“提出假設(shè)”或者“提出值得驗(yàn)證的問(wèn)題”。

這某種程度上是一種研究的taste(注:指審美),或者說(shuō)研究判斷力,以及在后續(xù)過(guò)程中根據(jù)早期結(jié)果及時(shí)停止一些沒(méi)有意義的研究。這可能是目前頂尖模型和頂尖研究員之間的差距。

不過(guò),隨著更強(qiáng)大的模型以及一套更完善的、能夠?qū)崿F(xiàn)“遞歸自我提升”(Recursive Self-Improvement)的智能體系統(tǒng)的加入,其能力的邊界在不斷向外延伸,上述的差距在不斷縮小。

劉知遠(yuǎn):我最近這一年也非常關(guān)注這個(gè)問(wèn)題,我覺(jué)得可以從兩個(gè)角度來(lái)說(shuō)。

第一個(gè)角度是從整個(gè)科技發(fā)展的角度來(lái)看。當(dāng)下這個(gè)節(jié)點(diǎn)其實(shí)非常關(guān)鍵。原因在于,我們可以把即將到來(lái)的“智能革命”類比為歷史上的工業(yè)革命。工業(yè)革命的核心發(fā)展成果是用機(jī)器替代人的重復(fù)體力勞動(dòng),發(fā)展到極致就是用機(jī)器制造機(jī)器。也就是說(shuō),連機(jī)器制造本身都不需要人的體力參與了。

所以,我們可以設(shè)想,所謂的“智能革命”,就是要用AI替代人的重復(fù)腦力勞動(dòng)。從這個(gè)角度來(lái)講,用AI制造AI是一定會(huì)發(fā)生的事情,是人工智能發(fā)展到高級(jí)狀態(tài)的一個(gè)標(biāo)志。

從這個(gè)角度出發(fā),我們可以非常清晰地看到AI發(fā)展這個(gè)變革浪潮會(huì)快速到來(lái),工業(yè)革命大概花了幾百年時(shí)間才達(dá)成“用機(jī)器制造機(jī)器”,而我們現(xiàn)在用“AI制造AI”距離大模型出現(xiàn)也不過(guò)六七年時(shí)間,這個(gè)速度是值得我們特別關(guān)注的。

第二個(gè)角度,隨著AI技術(shù)本身的提升,針對(duì)“如何指導(dǎo)AI”這一方向,我們也需要明確優(yōu)質(zhì)的研究課題,并圍繞其開(kāi)展相應(yīng)的探索與技術(shù)突破。

Recursive(遞歸)的最外層,我理解還是要由人來(lái)驅(qū)動(dòng)——到底制造什么樣的AI、如何去服務(wù)我們的社會(huì)。我覺(jué)得,人作為這個(gè)社會(huì)的主體,人的主體性、主觀能動(dòng)性,應(yīng)該是整個(gè)“AI制造AI”最核心的驅(qū)動(dòng)。這應(yīng)該是人和AI之間的關(guān)系。

語(yǔ)言模型領(lǐng)跑,世界模型剛剛開(kāi)始

朱軍:我們說(shuō)的“涌現(xiàn)”或者“演化”的過(guò)程,從信息論的角度來(lái)看,一定是需要有額外的、新的東西被引入到系統(tǒng)里,除非系統(tǒng)里原本的東西還沒(méi)學(xué)完。比如文本或視頻數(shù)據(jù),互聯(lián)網(wǎng)上雖然有那么多,但可能我們之前沒(méi)有用好,或者沒(méi)有用全。在這種情況下,繼續(xù)在里面提升,還是能看到很大的進(jìn)步。

但如果我們放開(kāi)到物理世界,它本身完全是一個(gè)開(kāi)環(huán)系統(tǒng),和我們固定的數(shù)據(jù)集不是一個(gè)概念。當(dāng)然,現(xiàn)在這個(gè)階段,很多場(chǎng)景我們還沒(méi)有數(shù)字化,或者還沒(méi)有完全把數(shù)據(jù)準(zhǔn)備好。

從長(zhǎng)期視角來(lái)看,世界模型所涉及的在線學(xué)習(xí)、自主演化等研究方向,不僅技術(shù)難度更高,也具備更大的探索空間與發(fā)展?jié)摿Α?/p>

其實(shí),2020年前后,我們?cè)谧龇较蛞?guī)劃時(shí)就提出了“物理智能”這個(gè)概念。我們要構(gòu)建一個(gè)可演化、可進(jìn)化、有發(fā)育能力的環(huán)境,智能體可以進(jìn)入學(xué)習(xí)。當(dāng)然,這個(gè)學(xué)習(xí)過(guò)程也不是完全封閉的,它還可以走出來(lái)和真實(shí)世界交互,而交互過(guò)程中的反饋可以再回到整個(gè)底座環(huán)境。我想,今天大家說(shuō)的“世界模型”,在某種程度上是在實(shí)現(xiàn)這種想法。

我覺(jué)得,未來(lái)的世界模型一定是一個(gè)多模態(tài)的、通用的世界模型,有點(diǎn)類似于語(yǔ)言模型走向GPT這種通用基座的路徑。未來(lái)大家應(yīng)該更關(guān)注這種更通用、有泛化能力、“有眼睛”的世界模型。

羅福莉:我目前看到的是,語(yǔ)言模型和世界模型確實(shí)是并駕齊驅(qū)地往前走的,但現(xiàn)階段語(yǔ)言模型確實(shí)會(huì)走得更快一些,因?yàn)槲覀兡軌蚋玫貜拇a里還原出當(dāng)時(shí)智能誕生的環(huán)境,所以能在這樣的環(huán)境里搭建一套比較好的、能驅(qū)動(dòng)模型發(fā)揮出更高上限的Agent系統(tǒng),再疊加一個(gè)模型,讓它在環(huán)境里進(jìn)行更自由的探索,設(shè)計(jì)一個(gè)更精準(zhǔn)的獎(jiǎng)勵(lì)體系去激勵(lì)它的自我提升。這條路徑在這一段時(shí)間的digital world(數(shù)字世界)中是正在發(fā)生、正在Scaling的一條主要路徑。

我對(duì)世界模型關(guān)注的是它能否首先創(chuàng)造一個(gè)非常高效的世界模擬器。其中,效率非常關(guān)鍵。我現(xiàn)在還沒(méi)有看到一個(gè)非常高效的、長(zhǎng)程一致的視頻生成模型誕生。我覺(jué)得,如果有這樣一個(gè)高效的、能從視頻角度重構(gòu)整個(gè)世界的生成器,我們就可以在這個(gè)高效生成器的基礎(chǔ)上,疊加一套能觸達(dá)現(xiàn)實(shí)生活中更復(fù)雜任務(wù)的腳手架系統(tǒng),將這兩者結(jié)合起來(lái),從而去Scaling我們整個(gè)的范式。

這是我覺(jué)得語(yǔ)言模型和世界模型在大的層面上會(huì)互通的一點(diǎn)。但目前看來(lái),在這兩條路徑中,語(yǔ)言模型會(huì)先行,在這個(gè)方向上探索得更清楚。其次是世界模型的基礎(chǔ)架構(gòu),一個(gè)高效的模型技術(shù)架構(gòu),一套圍繞真實(shí)世界運(yùn)轉(zhuǎn)的系統(tǒng),以及如何在這兩者基礎(chǔ)上做強(qiáng)化學(xué)習(xí),慢慢誕生重構(gòu)世界最有可能的路徑。

朱軍:我同意,語(yǔ)言模型整體上確實(shí)給其他大模型很多啟發(fā),因?yàn)樗彩亲钤?、最成熟的一類去?yàn)證Scaling的模型。

從做世界模型的目標(biāo)來(lái)看,基本上要具備三點(diǎn):一是要能“看懂”、理解狀態(tài);二是要能預(yù)測(cè)和想象;三是要能規(guī)劃、做行動(dòng)。這三者缺一不可。

另外,從做模型的角度來(lái)說(shuō),我們需要數(shù)據(jù)、需要架構(gòu)?,F(xiàn)在能用來(lái)做大模型的數(shù)據(jù)是什么?最后我們發(fā)現(xiàn),和“世界”最相關(guān)的數(shù)據(jù)就是視頻數(shù)據(jù),它是最容易、最方便,而且記錄量最大的關(guān)于世界的數(shù)據(jù)。包括電影,傳統(tǒng)做法是演員先演,然后被記錄下來(lái);現(xiàn)在很多采數(shù)據(jù)的工作,也是把數(shù)據(jù)記錄成視頻的形式。我覺(jué)得這里面有大量關(guān)于物理世界本身的信息。

所以,恰恰是視頻模型在嘗試去做這件事。過(guò)去,我們也能看到,其在復(fù)雜場(chǎng)景的理解以及內(nèi)容生成上已經(jīng)做得很好;再往前走,就是把“Action”(動(dòng)作)更多地引入到里面去。

這條線現(xiàn)在越來(lái)越成為共識(shí),大家在架構(gòu)上也在不斷優(yōu)化,包括效率方面。當(dāng)然,和語(yǔ)言模型相比,可能還有一定提升空間。

我覺(jué)得,現(xiàn)在最高優(yōu)先級(jí)的還是要先把智能水平本身提上去;當(dāng)達(dá)到比較高的智能水平之后,可以有很多種手段把模型做小、做成特定的Policy model(策略模型)等,用于部署。

所以,總體來(lái)看,世界模型本身的復(fù)雜度會(huì)更高一些,相對(duì)早期一點(diǎn),但未來(lái)非??善?。

封面圖片來(lái)源:每經(jīng)媒資庫(kù)

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

5

0