每日經(jīng)濟(jì)新聞 2026-04-24 16:42:09
4月24日,中國AI公司DeepSeek與全球行業(yè)領(lǐng)導(dǎo)者OpenAI,在同一天發(fā)布了各自的新一代模型——DeepSeek-V4和GPT-5.5。
在雙重利好催化下,科技股集體走強。港股科技作為國內(nèi)頂尖AI企業(yè)的聚集地,港股通恒生科技ETF(520840)大漲1.25%。港股通恒生科技ETF(520840)持倉股與DeepSeek指數(shù)(887754.W)重合率高達(dá)73.75%,在國內(nèi)尚無與Deepseek直接相關(guān)ETF的背景下, 港股通恒生科技ETF(520840)提供了一個純度超70%的分享Deepseek成長紅利的選項。
同時,作為大模型重要支撐,芯片板塊今日表現(xiàn)強勁。截止今日收盤,科創(chuàng)芯片ETF(588290)強勢上漲2.46%。
今日發(fā)布的DeepSeek V4、GPT-5.5,各自有什么亮點?
GPT-5.5:智能體能力的革命性提升
北京時間凌晨,OpenAI宣布推出GPT-5.5模型,官方稱這是其迄今為止最智能、最直觀易用的模型。
OpenAI總裁格雷格·布羅克曼強調(diào),GPT-5.5最大的亮點在于能快速理解用戶意圖,自主規(guī)劃并執(zhí)行多步驟復(fù)雜任務(wù),在代碼編寫調(diào)試、在線研究、數(shù)據(jù)分析及跨工具操作等場景表現(xiàn)出色。
根據(jù)OpenAI公布的第三方基準(zhǔn)測試數(shù)據(jù),GPT-5.5在多項關(guān)鍵指標(biāo)上實現(xiàn)了顯著躍升:
· 終端操作能力,GPT-5.5取得了82.7%的準(zhǔn)確率,遠(yuǎn)超前代GPT-5.4的75.1%。
· 軟件工程方面,在評估真實GitHub問題解決能力的SWE-Bench Pro測試中,得分達(dá)到58.6%;在內(nèi)部長周期工程任務(wù)測試Expert-SWE中,更是達(dá)到了73.1%。
· 科研與專業(yè)領(lǐng)域,在生物信息學(xué)評測BixBench中,它以80.5%的成績位列所有已公布模型之首。
效率與成本優(yōu)化是GPT-5.5的重要亮點。模型完成同等任務(wù)所需詞元消耗量大幅降低,百萬Token成本降至前代模型的1/35,每兆瓦Token輸出量提升50倍,在保持服務(wù)延遲與前代持平的同時,顯著提升能源利用效率與經(jīng)濟(jì)效益。
在第三方評測機構(gòu)Artificial Analysis的綜合智能指數(shù)榜單上,OpenAI憑借GPT-5.5系列拿下了第一名和第二名,前六中包攬了四席。該機構(gòu)認(rèn)為,“GPT-5.5讓OpenAI重回AI領(lǐng)域的第一位,打破了與Anthropic和谷歌的三方平局”。
DeepSeek-V4:百萬字級別上下文突破
今日午間,DeepSeek全新一代模型DeepSeek-V4預(yù)覽版正式上線并同步開源。
該模型最引人注目的特點是標(biāo)配百萬字超長上下文能力,打破了長文本處理的場景限制。
根據(jù)實測,在100萬token上下文場景下,DeepSeek-V4-Pro的單token推理FLOPs僅為前代V3.2的27%,KV緩存占用僅為10%。高配版本的DeepSeek-V4-Flash進(jìn)一步將單token推理FLOPs降至V3.2的10%,KV緩存占用僅為7%。
若換算為實際性能,同等算力下能夠服務(wù)的長上下文并發(fā)量達(dá)到原來的3到4倍,相較前代產(chǎn)品提升顯著。
在性能表現(xiàn)上,DeepSeek-V4-Pro在世界知識測評中大幅領(lǐng)先其他開源模型,僅稍遜于頂尖閉源模型Gemini-Pro-3.1。
DeepSeek-V4在Agent能力上實現(xiàn)顯著增強。在AgenticCoding評測中,V4-Pro已達(dá)到當(dāng)前開源模型最佳水平,并在其他Agent相關(guān)評測中同樣表現(xiàn)優(yōu)異。該模型同時支持思考模式切換、Json輸出、工具調(diào)用、對話前綴續(xù)寫等企業(yè)級功能,可覆蓋開發(fā)、辦公、法律、金融等復(fù)雜場景需求。
從技術(shù)到生態(tài),AI競爭進(jìn)入深水區(qū)
兩大巨頭的同日發(fā)布,標(biāo)志著全球AI競爭已從單純的技術(shù)參數(shù)比拼,進(jìn)入到了應(yīng)用場景、生態(tài)建設(shè)和商業(yè)化能力的全方位競爭階段。
DeepSeek通過開源策略和與國產(chǎn)芯片的深度綁定,正在構(gòu)建自主可控的AI技術(shù)生態(tài)。其百萬字上下文能力的突破,為處理長文檔、復(fù)雜代碼庫和多輪對話等場景提供了新的可能性,特別是在法律、金融、科研等專業(yè)領(lǐng)域具有重要應(yīng)用價值。
OpenAI則通過GPT-5.5的智能體能力提升,進(jìn)一步鞏固了其在商業(yè)化應(yīng)用和用戶體驗方面的領(lǐng)先地位。Token成本的大幅降低和效率的顯著提升,將使得更多企業(yè)和開發(fā)者能夠負(fù)擔(dān)得起高性能AI服務(wù),加速AI技術(shù)的普及和應(yīng)用。
值得注意的是,兩家公司都在強調(diào)“智能體”(Agent)能力的重要性。無論是DeepSeek-V4在AgenticCoding評測中的優(yōu)異表現(xiàn),還是GPT-5.5在自主規(guī)劃執(zhí)行多步驟復(fù)雜任務(wù)方面的突破,都顯示出AI正從簡單的問答工具向能夠獨立完成復(fù)雜任務(wù)的智能助手演進(jìn)。
隨著AI技術(shù)不斷成熟,未來的競爭將不再局限于模型性能的單一維度,而是擴(kuò)展到生態(tài)建設(shè)、應(yīng)用創(chuàng)新、安全可控等多個層面。(聲明:以上信息僅供參考,不構(gòu)成投資建議。市場有風(fēng)險,投資需謹(jǐn)慎。)
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP