91高清在线视频,天堂va在线观看,成人h动漫精品一区二区器材,超碰在线成人,国产日本欧美在线,男人的天堂伊人网,影音先锋美女

每日經(jīng)濟(jì)新聞
今日報(bào)紙

每經(jīng)網(wǎng)首頁 > 今日報(bào)紙 > 正文

階躍星辰與智譜、MiniMax同臺競技,但仍需補(bǔ)齊生態(tài)欠賬

每日經(jīng)濟(jì)新聞 2026-06-09 22:24:36

每經(jīng)記者|鄭欣蔚    每經(jīng)編輯|畢陸名    

發(fā)布僅一周時(shí)間,階躍星辰最新開源基座模型Step 3.7 Flash便沖上海外熱榜,拿下了海外大模型評測平臺Artificial Analysis多個(gè)第一。近日,階躍星辰在其官方微信公眾號公布了這一消息。

《每日經(jīng)濟(jì)新聞》記者注意到,在上述平臺的輸出速度榜,Step3.7 Flash以409 詞元/秒位列主流模型第一,同時(shí)在端到端響應(yīng)時(shí)長、智能效率與速度價(jià)格比等關(guān)鍵指標(biāo)上均處于領(lǐng)先位置。此前,在該模型發(fā)布2天后,Step 3.7 Flash還登上OpenRouter Trending(一個(gè)大模型榜單)全球第二位,成為近期全球開發(fā)者社區(qū)最受關(guān)注的開源模型之一。

然而,高光之下,“百模大戰(zhàn)”的持續(xù)壓力同樣清晰:Step 3.7Flash發(fā)布同期,與階躍星辰同為“AI六小龍”的智譜已提前推出同速率高速API(應(yīng)用程序編程接口);6月1日,MiniMax攜百萬上下文新一代通用模型M3強(qiáng)勢卡位。

快思慢想研究院院長、特邀評論員田豐在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)表示,Step 3.7 Flash的推出是階躍星辰在效率基礎(chǔ)設(shè)施這一細(xì)分賽道建立了可驗(yàn)證的技術(shù)信號,但尚未形成可防御的差異化護(hù)城河。“相較于智譜、MiniMax等競爭對手,階躍星辰處于滯后位次?!碧镓S說,“滯后指的是在產(chǎn)品觸達(dá)層與開發(fā)者生態(tài)上仍存在系統(tǒng)性空缺,而非模型技術(shù)本身的落差。”

Step 3.7 Flash速度搶眼

“模型競爭正在從單純追求峰值智能,轉(zhuǎn)向追求單位成本下能夠持續(xù)交付多少有效智能。高效率Flash(通常指輕量、快速、低成本的模型版本)模型或?qū)⒉辉偈瞧炫災(zāi)P偷难a(bǔ)充,而會成為AI(人工智能)生產(chǎn)化時(shí)代最重要的基礎(chǔ)模型形態(tài)之一?!彪A躍星辰如此解釋其對Flash模型的押注。

Step 3.7 Flash 5月29日正式發(fā)布并開源。據(jù)官方介紹,Step3.7 Flash采用稀疏MoE(專家混合模型)架構(gòu),總參數(shù)196B(billion,10億)+1.8B(ViT)(參數(shù)量為18億的視覺模型),激活參數(shù)僅11B,在模型能力、推理成本與執(zhí)行效率之間實(shí)現(xiàn)更優(yōu)平衡。與此同時(shí),最高生成速度達(dá)400詞元/秒,適合高頻、多輪、低等待的Agent(智能體)應(yīng)用。

速度確實(shí)搶眼,但正如階躍星辰自述,Step 3.7 Flash追求的不僅僅是更快或者更便宜,而且是成為一款真正面向生產(chǎn)級Agent的高效率模型。在階躍星辰看來,隨著Agent從演示走向真實(shí)生產(chǎn)環(huán)境,模型不只要回答問題,還要理解復(fù)雜輸入、主動(dòng)搜索信息、穩(wěn)定調(diào)用工具,并在多輪任務(wù)中持續(xù)保持執(zhí)行軌跡。這對底層基礎(chǔ)模型提出了完全不同的要求,同時(shí),模型能力的關(guān)鍵指標(biāo)正在發(fā)生變化。

在“好用”這一維度上,階躍星辰亮出的成績單顯示,其中在τ2-bench Telecom(韜平方基準(zhǔn)中的電信客服評測領(lǐng)域)的低、中、高三檔推理難度下通過率均達(dá)到98%以上。

對于這一高分表現(xiàn),田豐在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)解讀稱,τ2-bench測試(一款面向大語言模型對話智能體的評測基準(zhǔn)工具)作為目前最貼近生產(chǎn)級Agent場景的工具調(diào)用基準(zhǔn)之一,測試的是模型在用戶、工具、數(shù)據(jù)庫三方交互中的一致性與抗錯(cuò)能力,98%以上的得分確實(shí)具有參考價(jià)值。

但他也潑了一盆冷水:τ2-bench的測試集中于零售、航空、電信等結(jié)構(gòu)化領(lǐng)域,現(xiàn)實(shí)Agent工作流中的長尾場景(非結(jié)構(gòu)化API、動(dòng)態(tài)上下文切換、多工具串聯(lián)失敗恢復(fù))覆蓋不足。此外,Step 3.7 Flash雖然在發(fā)布2天后登上OpenRouter Trending全球第二位,但數(shù)據(jù)顯示,Step 3.7 Flash發(fā)布一周內(nèi)周詞元消耗屬于中等活躍水平,尚不足以判斷規(guī)?;a(chǎn)采用。

在他看來,更需要關(guān)注的信號是,未來Step 3.7 Flash能否在OpenRouter榜單中穩(wěn)定排名前列,并維持?jǐn)?shù)月的調(diào)用增長曲線。

智譜、MiniMax貼身角逐

就在階躍星辰為Step 3.7Flash的登頂而收獲關(guān)注時(shí),智譜與MiniMax在同一時(shí)間窗口內(nèi)相繼出牌,持續(xù)的“百模大戰(zhàn)”壓力也映照出階躍星辰高光之下的陰影。

一方面,推理速度正日益成為行業(yè)標(biāo)配,而非差異化優(yōu)勢。5月22日,智譜已面向部分企業(yè)客戶推出GLM-5.1高速API“GLM-5.1highspeed”,在保留旗艦基座能力的前提下,輸出速度同樣達(dá)到400詞元/秒。一周時(shí)間,兩家國產(chǎn)大模型公司均創(chuàng)下幾乎同一速度紀(jì)錄。田豐指出:“這說明400詞元/秒已成為當(dāng)前推理系統(tǒng)工程的技術(shù)收斂點(diǎn),而非階躍星辰的獨(dú)特優(yōu)勢?!?/p>

事實(shí)上,速度賽道也從不缺少追逐者,F(xiàn)lash產(chǎn)品路線正在迎來行業(yè)的集結(jié)。例如,近期受到廣泛關(guān)注的DeepSeek-V4系列模型,同時(shí)推出Pro(專業(yè)增強(qiáng)版)和Flash兩條產(chǎn)品線,兩者均支持高達(dá)100萬詞元上下文,旗艦型號主打推理峰值,F(xiàn)lash型號主打效率。

另一方面,階躍星辰雖錨定生產(chǎn)級Agent推出最新開源基座模型,但其新模型的256K(千詞元)上下文窗口在面對“上下文即競爭力”的長程Agent場景時(shí),容易遭遇結(jié)構(gòu)性天花板。

Step 3.7 Flash發(fā)布3天后,MiniMax正式推出新一代通用模型M3,主打前沿Coding(編程)能力、1M(100萬個(gè)詞元)超長上下文、原生多模態(tài)的完整組合,與階躍星辰形成涇渭分明的技術(shù)路線。田豐認(rèn)為,MiniMax M3憑借百萬級上下文窗口應(yīng)對復(fù)雜任務(wù)上限的瓶頸,依靠能力完整性支撐更高API單價(jià)。階躍星辰則堅(jiān)持單位成本下的有效智能,錨定高頻輕量化Agent基礎(chǔ)設(shè)施。前者的能力峰值路線爭奪復(fù)雜任務(wù)定價(jià)權(quán),后者的速度路線鎖定基礎(chǔ)設(shè)施頻率。

“兩條路線不存在零和競爭,而是各自對應(yīng)Agent生產(chǎn)化的不同價(jià)值層。但階躍星辰更要警惕‘廉價(jià)但可替代’的陷阱——速度與成本的優(yōu)勢可以為階躍星辰贏得大量中低復(fù)雜度Agent場景,但這類場景的遷移成本也低,護(hù)城河易被侵蝕?!碧镓S說。

他進(jìn)一步指出,相較于智譜、MiniMax,階躍星辰在產(chǎn)品節(jié)奏與生態(tài)布局上存在一定滯后,這類短板彌補(bǔ)周期遠(yuǎn)長于技術(shù)迭代。滯后首先來自數(shù)次戰(zhàn)略搖擺。階躍星辰早年深耕C端(消費(fèi)者端)消費(fèi)應(yīng)用,主力產(chǎn)品“冒泡鴨”停運(yùn)后,從“超級模型+超級應(yīng)用”路線倉促切換至Agent基座研發(fā),戰(zhàn)略變更形成產(chǎn)品空窗期,資本市場估值隨之大幅震蕩。反觀智譜、MiniMax在IPO(首次公開募股)前就敲定清晰發(fā)展路徑,智譜依托GLM全系產(chǎn)品深耕政企MaaS(模型即服務(wù))商業(yè)化,MiniMax以Talkie等C端產(chǎn)品積累流量,構(gòu)筑全球化增長飛輪,二者早早完成用戶觸點(diǎn)沉淀。

其次是開發(fā)者生態(tài)密度的硬性差距。商業(yè)化數(shù)據(jù)直觀展現(xiàn)差距:MiniMax最新披露的業(yè)務(wù)數(shù)據(jù)顯示,其全球企業(yè)和開發(fā)者客戶數(shù)已超百萬,較半年前增長5倍,全球用戶規(guī)模約3億,過去兩個(gè)月年化經(jīng)常性收入增長超過100%,這背后是其長期沉淀的API調(diào)用黏性。智譜則依托CodeGeex王牌應(yīng)用牢牢鎖住編程開發(fā)者,2026年3月,其MaaS平臺注冊用戶突破400萬,API年度經(jīng)常性收入飆升至約17億元,較上年同期提升60倍。

“階躍星辰雖牽頭聯(lián)合十余家國產(chǎn)芯片廠商組建模芯生態(tài)聯(lián)盟,提前布局國產(chǎn)化算力適配,但合作止步于硬件基礎(chǔ)調(diào)試,沒能落地規(guī)?;渴鹋c開發(fā)者遷移成果?!碧镓S表示,“其生態(tài)聯(lián)盟更接近供給側(cè)協(xié)同,真正的生態(tài)壁壘需要以需求側(cè)的開發(fā)者黏性作為回路,這一閉環(huán)目前尚未形成?!?/p>

回到Step 3.7 Flash本身,這款產(chǎn)品憑借工具調(diào)用穩(wěn)定性與速度成本優(yōu)勢,為階躍星辰守住了效率賽道的入場資格,但無力在短時(shí)間內(nèi)修復(fù)多年積累的生態(tài)欠賬。其押注Flash模型的路線有其突圍價(jià)值,可一旦全行業(yè)集體扎堆布局Flash產(chǎn)品,階躍星辰若想不被淹沒,必須在同質(zhì)化中找到那個(gè)不可替代的答案。

如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

1

0