要聞

羅福莉、朱軍、劉知遠(yuǎn)、安波與王仲遠(yuǎn)對(duì)談：“重構(gòu)世界”才剛剛開(kāi)始，語(yǔ)言模型與世界模型正并駕齊驅(qū)

2026-06-13 10:38:30

6月12日，第八屆“北京智源大會(huì)”圓桌環(huán)節(jié)，多位學(xué)者與產(chǎn)業(yè)領(lǐng)軍者圍繞“重構(gòu)世界”展開(kāi)對(duì)談。對(duì)話涉及大模型能力躍升、AI自進(jìn)化等核心問(wèn)題。專家認(rèn)為，AI正從“執(zhí)行工具”變?yōu)椤皠?chuàng)造智能的智能”，語(yǔ)言模型現(xiàn)階段領(lǐng)先，世界模型剛剛起步，未來(lái)應(yīng)關(guān)注更通用、有泛化能力的世界模型，語(yǔ)言模型和世界模型有望互通。

每經(jīng)記者｜可楊每經(jīng)編輯｜黃博文

當(dāng)AI coding（利用人工智能技術(shù)輔助或自動(dòng)生成代碼的開(kāi)發(fā)方式）突破臨界點(diǎn)、智能體加速自進(jìn)化，“AI創(chuàng)造AI”已不再是遙遠(yuǎn)的設(shè)想。

6月12日，第八屆“北京智源大會(huì)”開(kāi)幕式圓桌環(huán)節(jié)，在智源研究院院長(zhǎng)王仲遠(yuǎn)的主持下，小米MiMo大模型負(fù)責(zé)人羅福莉，清華大學(xué)教授、生數(shù)科技創(chuàng)始人朱軍，清華大學(xué)教授、面壁智能首席科學(xué)家劉知遠(yuǎn)以及南洋理工大學(xué)校長(zhǎng)講席教授安波，圍繞“重構(gòu)世界”這一主題展開(kāi)對(duì)談。

幾位長(zhǎng)期身處大模型研發(fā)一線的學(xué)者與產(chǎn)業(yè)領(lǐng)軍者，從最新模型的能力躍升談起，延伸至大語(yǔ)言模型與世界模型的路徑之爭(zhēng)、遞歸式自我改進(jìn)的現(xiàn)實(shí)進(jìn)展，以及AI（人工智能）自進(jìn)化是否已經(jīng)發(fā)生等核心問(wèn)題。

當(dāng)AI從“執(zhí)行工具”演變?yōu)椤皠?chuàng)造智能的智能”，數(shù)字世界與物理世界的重構(gòu)將沿著怎樣的路徑展開(kāi)？哪一條路會(huì)先抵達(dá)？以下為對(duì)話實(shí)錄的節(jié)選，我們進(jìn)行了不影響原意的整理：

Anthropic新模型是“中間產(chǎn)物”還是質(zhì)變臨界點(diǎn)？

羅福莉：其實(shí)，F(xiàn)able 5（指Anthropic新模型）目前的訓(xùn)練結(jié)果，是一個(gè)非?？茖W(xué)地去做Scaling的中間的產(chǎn)物。從發(fā)布的整個(gè)參數(shù)量級(jí)來(lái)看，我們猜測(cè)它應(yīng)該是目前最強(qiáng)、最大的開(kāi)源模型的幾倍。比如，在預(yù)訓(xùn)練數(shù)量級(jí)上，做了幾倍的Scaling（規(guī)模擴(kuò)張）；其次，在預(yù)訓(xùn)練或者說(shuō)在強(qiáng)化學(xué)習(xí)上，應(yīng)該也有非常大的、至少是數(shù)量級(jí)的投入。

此外，由于我們從Chat（聊天機(jī)器人）時(shí)代邁向Agent（智能體）時(shí)代，模型的訓(xùn)練數(shù)據(jù)已經(jīng)從自然的互聯(lián)網(wǎng)文本數(shù)據(jù)邁向了人和AI共同產(chǎn)生的合成數(shù)據(jù)，數(shù)據(jù)的Scaling也到了一個(gè)新的量級(jí)。

在我看來(lái)，F(xiàn)able 5這款大模型，是在預(yù)訓(xùn)練參數(shù)規(guī)模、訓(xùn)練數(shù)據(jù)與Agent合成數(shù)據(jù)，以及測(cè)試時(shí)規(guī)模擴(kuò)展（test-time Scaling）和強(qiáng)化學(xué)習(xí)相結(jié)合這三個(gè)維度上，完成了一個(gè)非常自然的外延拓展后形成的中間產(chǎn)物。

朱軍：模型規(guī)模與數(shù)據(jù)進(jìn)行Scaling時(shí)，性能提升效果十分突出。其中也包括我們常說(shuō)的對(duì)物理世界各類物理規(guī)律的模擬與仿真，過(guò)去兩年多以來(lái)，該方向的相關(guān)進(jìn)展是看得到的。一開(kāi)始大家可能會(huì)看到各種“幻覺(jué)”，但今天其實(shí)已經(jīng)可以做出非常高質(zhì)量的專業(yè)內(nèi)容，在部分場(chǎng)合可以達(dá)到影視級(jí)的標(biāo)準(zhǔn)。

我覺(jué)得這都是在走同一條路，即把模型做得更加精細(xì)，數(shù)據(jù)質(zhì)量、規(guī)模，還有大規(guī)模訓(xùn)練，整體上有一個(gè)提升。但后面再邁向物理世界的時(shí)候，大家也會(huì)討論，這種物理規(guī)律是不是真的能夠?qū)W會(huì)？

我相信，當(dāng)基礎(chǔ)模型本身有了顯著提升之后，無(wú)論是較為嚴(yán)謹(jǐn)?shù)倪壿嬐评怼⑽锢硪?guī)律的建模，還是3D等任務(wù)，基本都可以變得更加高效地完成。當(dāng)然，具體方式會(huì)因場(chǎng)景而異：有些場(chǎng)景可能并不需要非常精細(xì)、精準(zhǔn)的處理，大部分情況下依靠直觀的方式就能滿足需求。而這恰恰是模型帶來(lái)的最大好處。

我覺(jué)得有一個(gè)點(diǎn)是非常對(duì)的。大家常說(shuō)用Agent去解決問(wèn)題時(shí)，之前會(huì)消耗很多Token（詞元），但現(xiàn)在新版本在解決多任務(wù)時(shí)，Token消耗量變少了，我覺(jué)得這是一個(gè)非常正確的方向，也應(yīng)該是大家去追求的目標(biāo)。因?yàn)槲覀冊(cè)谧龊芏嗳蝿?wù)的時(shí)候，其實(shí)是需要有一個(gè)高于人的智能來(lái)幫我們調(diào)用工具和思考，我想這可能是大模型未來(lái)可以進(jìn)一步釋放出來(lái)的能力。

AI自進(jìn)化是否已經(jīng)發(fā)生？

安波：最近“自演化”這個(gè)概念特別火，無(wú)論是Prompt（提示詞）還是Agent，都是通過(guò)獲取更多人的使用數(shù)據(jù)或者得到更多反饋，從而讓模型能力持續(xù)增強(qiáng)。我覺(jué)得這一點(diǎn)是對(duì)的。

智能體還在起步階段，未來(lái)還有很長(zhǎng)的路要走?，F(xiàn)在可能很多智能體還停留在通用階段，我覺(jué)得未來(lái)更大的潛力，可能是其真正落到工業(yè)界的那些垂直領(lǐng)域，去解決大家特別在乎的那些問(wèn)題。

羅福莉：坦率來(lái)講，在上一代模型中，尤其是去年，我覺(jué)得頂尖模型的能力上限可能體現(xiàn)在非常好的“執(zhí)行”，尤其當(dāng)指令非常清晰的時(shí)候，執(zhí)行是比較完美的。但到今天，我們發(fā)現(xiàn)頂尖模型已經(jīng)從“執(zhí)行”外延到去解決一些抽象性的問(wèn)題。

拿一個(gè)完整的科研歷程舉例。從提出假設(shè)，到設(shè)計(jì)實(shí)驗(yàn)，到真正動(dòng)手執(zhí)行實(shí)驗(yàn)，到設(shè)計(jì)合理的觀測(cè)指標(biāo)去驗(yàn)證實(shí)驗(yàn)的合理性，最后一步是需要和同行進(jìn)行密切交流，充分共享研究context（上下文），再去打磨整個(gè)假設(shè)或idea（想法），這是一個(gè)很完整的研究流程。

我們現(xiàn)在已經(jīng)能看到，大模型已經(jīng)從最初的“執(zhí)行”這一層能力，慢慢外延到能夠去設(shè)計(jì)合理的驗(yàn)證指標(biāo)，驗(yàn)證自己執(zhí)行結(jié)果的準(zhǔn)確性，并能夠去規(guī)劃整個(gè)實(shí)驗(yàn)流程?？赡墁F(xiàn)在唯一還有差距的地方是“提出假設(shè)”或者“提出值得驗(yàn)證的問(wèn)題”。

這某種程度上是一種研究的taste（注：指審美），或者說(shuō)研究判斷力，以及在后續(xù)過(guò)程中根據(jù)早期結(jié)果及時(shí)停止一些沒(méi)有意義的研究。這可能是目前頂尖模型和頂尖研究員之間的差距。

不過(guò)，隨著更強(qiáng)大的模型以及一套更完善的、能夠?qū)崿F(xiàn)“遞歸自我提升”（Recursive Self-Improvement）的智能體系統(tǒng)的加入，其能力的邊界在不斷向外延伸，上述的差距在不斷縮小。

劉知遠(yuǎn)：我最近這一年也非常關(guān)注這個(gè)問(wèn)題，我覺(jué)得可以從兩個(gè)角度來(lái)說(shuō)。

第一個(gè)角度是從整個(gè)科技發(fā)展的角度來(lái)看。當(dāng)下這個(gè)節(jié)點(diǎn)其實(shí)非常關(guān)鍵。原因在于，我們可以把即將到來(lái)的“智能革命”類比為歷史上的工業(yè)革命。工業(yè)革命的核心發(fā)展成果是用機(jī)器替代人的重復(fù)體力勞動(dòng)，發(fā)展到極致就是用機(jī)器制造機(jī)器。也就是說(shuō)，連機(jī)器制造本身都不需要人的體力參與了。

所以，我們可以設(shè)想，所謂的“智能革命”，就是要用AI替代人的重復(fù)腦力勞動(dòng)。從這個(gè)角度來(lái)講，用AI制造AI是一定會(huì)發(fā)生的事情，是人工智能發(fā)展到高級(jí)狀態(tài)的一個(gè)標(biāo)志。

從這個(gè)角度出發(fā)，我們可以非常清晰地看到AI發(fā)展這個(gè)變革浪潮會(huì)快速到來(lái)，工業(yè)革命大概花了幾百年時(shí)間才達(dá)成“用機(jī)器制造機(jī)器”，而我們現(xiàn)在用“AI制造AI”距離大模型出現(xiàn)也不過(guò)六七年時(shí)間，這個(gè)速度是值得我們特別關(guān)注的。

第二個(gè)角度，隨著AI技術(shù)本身的提升，針對(duì)“如何指導(dǎo)AI”這一方向，我們也需要明確優(yōu)質(zhì)的研究課題，并圍繞其開(kāi)展相應(yīng)的探索與技術(shù)突破。

Recursive（遞歸）的最外層，我理解還是要由人來(lái)驅(qū)動(dòng)——到底制造什么樣的AI、如何去服務(wù)我們的社會(huì)。我覺(jué)得，人作為這個(gè)社會(huì)的主體，人的主體性、主觀能動(dòng)性，應(yīng)該是整個(gè)“AI制造AI”最核心的驅(qū)動(dòng)。這應(yīng)該是人和AI之間的關(guān)系。

語(yǔ)言模型領(lǐng)跑，世界模型剛剛開(kāi)始

朱軍：我們說(shuō)的“涌現(xiàn)”或者“演化”的過(guò)程，從信息論的角度來(lái)看，一定是需要有額外的、新的東西被引入到系統(tǒng)里，除非系統(tǒng)里原本的東西還沒(méi)學(xué)完。比如文本或視頻數(shù)據(jù)，互聯(lián)網(wǎng)上雖然有那么多，但可能我們之前沒(méi)有用好，或者沒(méi)有用全。在這種情況下，繼續(xù)在里面提升，還是能看到很大的進(jìn)步。

但如果我們放開(kāi)到物理世界，它本身完全是一個(gè)開(kāi)環(huán)系統(tǒng)，和我們固定的數(shù)據(jù)集不是一個(gè)概念。當(dāng)然，現(xiàn)在這個(gè)階段，很多場(chǎng)景我們還沒(méi)有數(shù)字化，或者還沒(méi)有完全把數(shù)據(jù)準(zhǔn)備好。

從長(zhǎng)期視角來(lái)看，世界模型所涉及的在線學(xué)習(xí)、自主演化等研究方向，不僅技術(shù)難度更高，也具備更大的探索空間與發(fā)展?jié)摿Α?/p>

其實(shí)，2020年前后，我們?cè)谧龇较蛞?guī)劃時(shí)就提出了“物理智能”這個(gè)概念。我們要構(gòu)建一個(gè)可演化、可進(jìn)化、有發(fā)育能力的環(huán)境，智能體可以進(jìn)入學(xué)習(xí)。當(dāng)然，這個(gè)學(xué)習(xí)過(guò)程也不是完全封閉的，它還可以走出來(lái)和真實(shí)世界交互，而交互過(guò)程中的反饋可以再回到整個(gè)底座環(huán)境。我想，今天大家說(shuō)的“世界模型”，在某種程度上是在實(shí)現(xiàn)這種想法。

我覺(jué)得，未來(lái)的世界模型一定是一個(gè)多模態(tài)的、通用的世界模型，有點(diǎn)類似于語(yǔ)言模型走向GPT這種通用基座的路徑。未來(lái)大家應(yīng)該更關(guān)注這種更通用、有泛化能力、“有眼睛”的世界模型。

羅福莉：我目前看到的是，語(yǔ)言模型和世界模型確實(shí)是并駕齊驅(qū)地往前走的，但現(xiàn)階段語(yǔ)言模型確實(shí)會(huì)走得更快一些，因?yàn)槲覀兡軌蚋玫貜拇a里還原出當(dāng)時(shí)智能誕生的環(huán)境，所以能在這樣的環(huán)境里搭建一套比較好的、能驅(qū)動(dòng)模型發(fā)揮出更高上限的Agent系統(tǒng)，再疊加一個(gè)模型，讓它在環(huán)境里進(jìn)行更自由的探索，設(shè)計(jì)一個(gè)更精準(zhǔn)的獎(jiǎng)勵(lì)體系去激勵(lì)它的自我提升。這條路徑在這一段時(shí)間的digital world（數(shù)字世界）中是正在發(fā)生、正在Scaling的一條主要路徑。

我對(duì)世界模型關(guān)注的是它能否首先創(chuàng)造一個(gè)非常高效的世界模擬器。其中，效率非常關(guān)鍵。我現(xiàn)在還沒(méi)有看到一個(gè)非常高效的、長(zhǎng)程一致的視頻生成模型誕生。我覺(jué)得，如果有這樣一個(gè)高效的、能從視頻角度重構(gòu)整個(gè)世界的生成器，我們就可以在這個(gè)高效生成器的基礎(chǔ)上，疊加一套能觸達(dá)現(xiàn)實(shí)生活中更復(fù)雜任務(wù)的腳手架系統(tǒng)，將這兩者結(jié)合起來(lái)，從而去Scaling我們整個(gè)的范式。

這是我覺(jué)得語(yǔ)言模型和世界模型在大的層面上會(huì)互通的一點(diǎn)。但目前看來(lái)，在這兩條路徑中，語(yǔ)言模型會(huì)先行，在這個(gè)方向上探索得更清楚。其次是世界模型的基礎(chǔ)架構(gòu)，一個(gè)高效的模型技術(shù)架構(gòu)，一套圍繞真實(shí)世界運(yùn)轉(zhuǎn)的系統(tǒng)，以及如何在這兩者基礎(chǔ)上做強(qiáng)化學(xué)習(xí)，慢慢誕生重構(gòu)世界最有可能的路徑。

朱軍：我同意，語(yǔ)言模型整體上確實(shí)給其他大模型很多啟發(fā)，因?yàn)樗彩亲钤?、最成熟的一類去?yàn)證Scaling的模型。

從做世界模型的目標(biāo)來(lái)看，基本上要具備三點(diǎn)：一是要能“看懂”、理解狀態(tài)；二是要能預(yù)測(cè)和想象；三是要能規(guī)劃、做行動(dòng)。這三者缺一不可。

另外，從做模型的角度來(lái)說(shuō)，我們需要數(shù)據(jù)、需要架構(gòu)?，F(xiàn)在能用來(lái)做大模型的數(shù)據(jù)是什么？最后我們發(fā)現(xiàn)，和“世界”最相關(guān)的數(shù)據(jù)就是視頻數(shù)據(jù)，它是最容易、最方便，而且記錄量最大的關(guān)于世界的數(shù)據(jù)。包括電影，傳統(tǒng)做法是演員先演，然后被記錄下來(lái)；現(xiàn)在很多采數(shù)據(jù)的工作，也是把數(shù)據(jù)記錄成視頻的形式。我覺(jué)得這里面有大量關(guān)于物理世界本身的信息。

所以，恰恰是視頻模型在嘗試去做這件事。過(guò)去，我們也能看到，其在復(fù)雜場(chǎng)景的理解以及內(nèi)容生成上已經(jīng)做得很好；再往前走，就是把“Action”（動(dòng)作）更多地引入到里面去。

這條線現(xiàn)在越來(lái)越成為共識(shí)，大家在架構(gòu)上也在不斷優(yōu)化，包括效率方面。當(dāng)然，和語(yǔ)言模型相比，可能還有一定提升空間。

我覺(jué)得，現(xiàn)在最高優(yōu)先級(jí)的還是要先把智能水平本身提上去；當(dāng)達(dá)到比較高的智能水平之后，可以有很多種手段把模型做小、做成特定的Policy model（策略模型）等，用于部署。

所以，總體來(lái)看，世界模型本身的復(fù)雜度會(huì)更高一些，相對(duì)早期一點(diǎn)，但未來(lái)非?？善?。

封面圖片來(lái)源：每經(jīng)媒資庫(kù)

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

上一篇文章

歐盟將啟動(dòng)烏克蘭和摩爾多瓦首階段入盟談判

返回每經(jīng)網(wǎng)首頁(yè)

下一篇文章

中央氣象臺(tái)6月13日10時(shí)繼續(xù)發(fā)布暴雨黃色預(yù)警

相關(guān)文章

熱文精選

點(diǎn)擊排行

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

91高清在线视频,天堂va在线观看,成人h动漫精品一区二区器材,超碰在线成人,国产日本欧美在线,男人的天堂伊人网,影音先锋美女

羅福莉、朱軍、劉知遠(yuǎn)、安波與王仲遠(yuǎn)對(duì)談：“重構(gòu)世界”才剛剛開(kāi)始，語(yǔ)言模型與世界模型正并駕齊驅(qū)

Anthropic新模型是“中間產(chǎn)物”還是質(zhì)變臨界點(diǎn)？

AI自進(jìn)化是否已經(jīng)發(fā)生？

語(yǔ)言模型領(lǐng)跑，世界模型剛剛開(kāi)始

羅福莉、朱軍、劉知遠(yuǎn)、安波與王仲遠(yuǎn)對(duì)談：“重構(gòu)世界”才剛剛開(kāi)始，語(yǔ)言模型與世界模型正并駕齊驅(qū)

Anthropic新模型是“中間產(chǎn)物”還是質(zhì)變臨界點(diǎn)？

AI自進(jìn)化是否已經(jīng)發(fā)生？