昨夜有多少人熬夜了?
等了一年多,北京時間8月8日凌晨1點多,在全球矚目中,OpenAI終于正式發布新一代大語言模型 GPT-5,并破天荒地向所有用戶免費開放基礎版。
OpenAI CEO 山姆·奧特曼在發布會上表示:“如果說 GPT-4 還只是大學生,GPT-5 就是一位真正的專家。” 他將這次升級比作“讓我再也回不去”的技術飛躍,就像第一款配備視網膜屏的 iPhone 帶來的體驗一樣。
與以往不同,GPT-5是一個統一系統,不再分為常規模型和單獨的推理模型,而是由三個核心部分構成:一個智能高效的基礎模型,能夠回答大多數問題;一個用于解決更復雜問題的深度推理模型(GPT?5 Thinking);以及一個實時路由器(智能分流系統),可根據對話類型、復雜度、工具需求以及用戶的明確指示(例如提示中寫道“請深入思考這個問題”)快速判斷應使用哪個模型。

OpenAI稱,這是迄今為止最強大的 AI 系統,在編程、數學、寫作、醫療、視覺感知等多個領域都實現了重大飛躍。
只是發布會剛剛結束,全網似乎罵聲不少,眾望所歸的“GPT5時代”,就這?

硅谷又有人要失業了?
依舊是熟悉的“屠榜”。
在最新的數學推理測試 AIME 2025 中,GPT-5 無工具模式得分高達 94.6%,接近人類頂尖水平;在 SWE-Bench 編程驗證測試中得分74.9%,大幅超越上一代模型;在多模態理解的 MMMU 基準中更是達到 84.2%,證明它不僅能讀懂文字,還能深入理解圖片、圖表、視頻等多模態內容。

圖|GPT-5編程得分
新版本引入“實時路由器”技術,能根據任務復雜度自動選擇推理模式,既保證深度,又減少算力浪費。簡單說,GPT-5學會了“先想清楚,再動手干”,效率與精度雙贏。
奧特曼在發布會上也表示:“GPT-5真的讓我第一次覺得,我們的主力模型已經達到了可以讓你向一位真正的專家、一位博士級專家提出任何問題。”并且他還稱“它最酷的能力之一,就是能即時為你寫出高質量軟件。按需軟件這個概念,將會成為GPT-5時代的標志性特征之一。”
它的編程能力官方堪稱史上最強。奧特曼表示,GPT-5是“全球最強的編程與寫作模型”。
在OpenAI的測試中,該模型在基準測試SWE-Bench、SWE-Lancer和 Aider Polyglot中的編程表現優于所有其他模型。在真實世界編程測試中,GPT-5在SWE-bench Verified中的得分為74.9%,在Aider Polyglot中的得分為88%。
在發布會上,OpenAI負責后訓練工作的負責人揚·杜布瓦(Yann Dubois)現場演示了如何用GPT-5生成一個帶有互動游戲的法語學習網站。
短短幾秒內,GPT-5就寫出了數百行代碼,并生成了該網站的前端界面。杜布瓦簡單點擊瀏覽了網站的各個功能,發現一切似乎都按預期正常運行。

在朝著“微信”進化了
OpenAI此次為GPT-5加入了4種交互人格——憤世嫉俗者、機器人、傾聽者、書呆子。這意味著,用戶不僅能得到精準答案,還能體驗不同的溝通風格。據測試,這一改進讓“諂媚式回答”減少了 60% 以上,讓對話更真實、更有棱角。
這次GPT或許要朝著“微信”的方向進化了。

它現在支持用戶自主定制聊天窗口的色彩風格,還具備了長期對話記憶的集成能力。更厲害的是,新功能還能直接與谷歌郵箱、日歷無縫對接。
如此一來,ChatGPT就能全方位融入生活與工作,為用戶精準規劃日程,貼心提醒重要紀念日。
在醫療健康領域,GPT-5也有顯著進步。
HealthBench 測試得分 46.2%,可解析復雜醫療報告并提供實用建議,為遠程醫療、健康咨詢帶來新可能。
微軟、Cursor等平臺已在第一時間接入GPT-5,編程輔助工具市場或將迎來新一輪洗牌。網友預測,GPT-5的普及會讓更多人輕松寫出高質量代碼,甚至可能讓部分初級程序員失業。與此同時,教育、科研、設計等行業的AI滲透速度也會加快。

急著賺錢的OpenAI,走向平庸
OpenAI的此次更新之所以招致如此大的吐槽,本質上還在于一個以“顛覆式創新”引領市場的佼佼者,直接走上“平庸”之路。
此次模型更新不置可否的是提升巨大,值得褒獎,無論是幻覺率的大幅下降,還是人人都免費的態度,都可以看出OpenAI此舉意在讓更多人用上好用的大模型。
背后也是OpenAI的野心,根據其8月5日的最新官方公告,ChatGPT的周活躍用戶將達到7億,每天處理的用戶消息量已突破30億條。從活躍用戶數來看,僅過去兩個月,就增長了2億。作為對比,谷歌AI搜索摘要(AI Overviews)月活約20億,Gemini聊天機器人月活超4.5億。截至Q1,微信合并WeChat全球月活則是14.02億。
OpenAI的商業化也在提速,其付費用戶數從2025年6月的300萬增至目前的500萬,年化收入(ARR)從6月的100億美元增至 130億美元,預計年底突破200億美元。
對商業乃至更大用戶群體的圖謀,讓OpenAI的考量變得復雜。

今年5月,山姆·奧特曼還任命了一位新CEO——菲吉·西莫(Fidji Simo),作為“應用CEO”(CEO of Applications),她負責領導OpenAI的產品、業務和其他職能,向奧特曼匯報。這位女將曾在Facebook任職十余年,來OpenAI顯然是為下一階段ChatGPT的增長和商業化負責。雖然彼時奧特曼曾稱,他將更專注于研究、計算和安全系統。但從GPT5交出的作業來說,奧特曼的表現很難打出高分。
頗為有意思的是,曾幾何時,賺錢和商業化,從1到100的大規模落地應用曾是中國公司的主戰場,中國有全球發達的互聯網,有繁榮的用戶生態。
但今天,越來越多中國公司在AI上,暫時放棄了商業化。轉而去追求模型能力的提升,當然,當前仍未有太多業績成果交付。
今年7月時,360公司董事長周鴻祎在2025中國互聯網大會上曾表示,DeepSeek創始人梁文鋒一門心思做AGI,根本沒有想做一個App。
周鴻祎還稱,梁文鋒是一個有夢想的人,不屑于做App,不在乎日活、融資和收費的問題。一個最了不起的地方是:DeepSeek是世界第一個把大模型免費、開源的,這對中國大模型產業的發展做出了很大的貢獻。