GPT-5,終于來了。
北京時間8月8日凌晨1點,OpenAI CEO Sam Altman 沒有爽約。在發布會前一天,他在 X(原 Twitter)上寫道:“明天上午10點(太平洋時間)發布 GPT-5,發布會會比以往更長,一個小時左右。”

結果,這場被全網盯緊的發布整整持續了 1小時18分鐘,堪稱“最重頭戲”。
Altman 的造勢從來不是空喊。這位硅谷最有話語權的“AI布道者”在會前甚至自曝:“測試完 GPT5,我感覺自己一無是處。”看似夸張的說法,卻意外地成為這場發布的真實注腳。
在開場介紹GPT-5時,奧特曼簡單回顧了下從GPT-3到4,再到5的歷程。他自己比喻說,“GPT-3像個高中生,GPT-4像個大學生,而GPT-5則已經變成了一名專家,一名各個領域的專家。”

GPT-5 并沒有讓人失望,它甚至可能讓打工人們開始焦慮,首當其沖的就是程序員。
這次發布會最大的信息量,不是語言理解能力有多強、創作能力有多豐富,而是它在代碼編寫、調試、部署上的全新維度:GPT-5 不再是“會寫代碼的語言模型”,它是一個工程級開發助手。
這場發布會上,OpenAI 花了將近一半時間在“現場寫代碼”。它兩分鐘就可以搭建出一個完整網站,五分鐘做出一款語言學習App,并能精準識別并修復 Bug。它不僅聽懂復雜需求,還能結構清晰地拆解任務、實現功能、給出部署建議——這種能力,已不是“輔助編程”,而是直接搶活干了。
對于熟悉 AI 編程工具的人來說,這意味著什么?意味著 Copilot 要退休了,意味著 Replit 要被重塑,意味著 Cursor 等“AI IDE”要被全面整合。Altman 在現場甚至直接說:“這是我們有史以來最強的編程模型。”
而背后支撐這一切的,是 GPT-5 在推理能力、上下文管理、多模態理解等多個維度上的飛躍。OpenAI 此次還發布了面向不同用戶的模型矩陣,包括:GPT-5 Standard、GPT-5 Mini(輕量版)、GPT-5 Nano(嵌入式和移動端使用)。
這三個版本面向 API 和企業客戶開放,按百萬 tokens 計費。輸入價格分別是 1.25 / 0.25 / 0.05 美元,輸出價格為 10 / 2 / 0.4 美元——極具市場穿透力。對于開發者而言,這是“從業門檻”被再一次降維打擊。

值得一提的是,Altman 雖并未過多談 AGI,但業內都清楚:GPT-5已經不局限于在AI大模型的世界里內卷,而是不斷突破上限,在AGI的道路上完成大躍進。
這不是一次“模型升級”,而是一次生產力結構的重構。
GPT-5 登場的這一刻,AI 世界的天花板,再次被抬高。而我們,是否準備好面對它帶來的新范式,還很難說。
接下來,筆者將還原出這場發布會最精彩的部分:
在現場演示之前,OpenAI先是一如既往地展示了GPT-5的一連串標桿成績。
首先,GPT-5最驚艷的就是,在編碼能力方面實現全面碾壓。
SWE?Bench Verified:作為檢測模型修復真實軟件工程問題能力的標準,GPT?5 在這一評測中取得驚人的 74.9%,領先于 o3 的 69.1%,展現了更高效、更精準的代碼理解與生成能力。
Aider Polyglot:這是一個跨語言代碼編輯測試,GPT?5 成績飆升至 88%,錯誤率相比之前整整降低了三分之一。

其次,GPT-5還極大降低了大模型所產生的幻覺問題,并實現在可靠性和事實準確性方面雙雙提升。
在回答事實類問題時,GPT?5 的“幻覺”錯誤率,相對 GPT?4o減少約 45%,而相對 o3則減少約80%。
在GPT-5發布會上,除了代碼能力,奧特曼特別重點強調的就是GPT-5在健康醫療領域的表現。在醫療場景測試(如 HealthBench Hard Hallucinations),它的生成錯誤率僅為 1.6%,遠低于 GPT?4o 的 12.9% 和 o3 的 15.8%。

程序員馬上要失業了?
GPT-5最為炸裂的部分,就是代碼能力。
這一次,GPT?5 真的在發布會上秀瘋了。幾乎從開始演示到結束,一共有四個“全場景、真交互”的代碼能力展示,讓在場開發者和遠程觀眾都忍不住感慨:“程序員,真的要慌了。”
1、兩分鐘生成SVG動畫
Prompt:讓我迅速了解什么是伯努利效應(Bernouli effect)
在這個prompt下,GPT-5迅速給出了關于伯努利效應的詳細解釋。而當用戶再要求用SVG動畫演示時,GPT-5則直接開始進入深度思考模式,兩分鐘生成了420行代碼,最終我們看到了這個可交互的動畫。
值得注意的是,用戶可以自由調整飛行速度和角度,氣流線條也跟著實時變動。這不僅是可視化的知識輸出,更是個性化、具備教學輔助價值的模擬系統。

2、五分鐘搭建APP
Prompt:“我是英語母語者,為正在學法語的搭檔做一個互動式學習 App,要有卡片、猜詞、游戲,最好做成一只老鼠吃芝士學單詞。”
GPT?5 不僅“聽懂”了需求,還在五分鐘內把需求全量落地:卡片式界面、互動功能、學習進度追蹤全都上線。

而那個“老鼠吃芝士”的小游戲,更是讓人拍案叫絕——每當老鼠吃掉一塊芝士,就會自動播放一個法語單詞語音,學習與娛樂真正無縫融合。
你甚至能看到這個 AI 在用戶沒有明確要求的細節上主動優化交互邏輯,足以說明其理解層級已經躍升。

3、修復代碼bug
這一幕的設定就像現實工作場景:一名工程師把一個看似正常、實則問題百出的項目代碼交給 GPT?5,希望它能發現潛在問題。
過去,AI 模型寫代碼已經夠勉強,找 bug 更是無從談起。而這次,GPT?5 不僅找出了關鍵問題,還提出了解決方案,并在模擬運行中無誤通過。
要知道,這是第一次,有開發者把真實工程任務直接交給 AI 獨立完成且成功運行。這不僅意味著自動化寫代碼,它的下一步,可能是參與整個軟件生命周期管理。

4、五分鐘創建可視化財務看板
Prompt:請為我的AI智能體公司創建一個財務儀表盤,公司已完成D輪融資。
用戶將企業的各類數據一股腦拋給 GPT?5,模型在五分鐘內交出了一份堪比創業公司 CFO 級別的動態財務看板。所有數據項都自動映射,支持調整、更新、篩選,UI 也堪稱“即用級別”。

GPT-5發布會的一個多小時里,奧特曼還多次強調,“GPT-5是我們做過最強的代碼模型”。
而為了進一步實錘這個判斷,OpenAI 甚至還請來了 Cursor 的 CEO Michael Truell 站臺。他在發布會上宣布,GPT?5 將在未來幾天內正式登陸 Cursor 編輯器。
GPT-5讓AI去“模板化”
如果說前兩個部分還讓人覺得 GPT?5 是個優秀的“工具人”,那么第三部分,它則徹底展現出 AI 向“智能伴侶”進化的潛力。
GPT?5 這次發布的最大突破之一,就是它極具深度的個性化能力。
而這種個性化,不再是表面地更換“主題色”那么簡單,而是——能參與到你的人生決策中來。

GPT-5現已支持更換聊天框顏色
在現場展示中,GPT?5 首先展示了一個“超級個人助理”的身份:
它可以接入用戶的日歷、郵件,自動檢查你漏掉的事務,比如一封未處理的會議邀請,甚至你平時的健身頻率;并基于這些信息,為你自動生成個性化的日程規劃。你再也不需要手動設置提醒、記會議、安排生活了——GPT?5 會根據你自己過去的行為模式,像一個了解你的生活教練一樣來管理一切。
這就好像拆掉了 Chatbot 與 Agent 之間的最后一道墻。
過去半年,海內外AI公司紛紛入局Agent,微軟、谷歌、Anthropic 接連發布自己的 Agent 系統;就連 OpenAI 自己也在上個月小范圍推出首個原生 Agent。但這一切,在 GPT?5 面前,顯得更像是“預演”。
不過,GPT-5 的 Agent 化,是基于它本身認知能力提升之上的自然進化。
它不靠預設流程,而是基于理解你、記住你、聯動外部信息,來動態調整策略、生成建議,真正做到了“定制級智能體”。

而 GPT?5 最讓人動容的演示,也是奧特曼刻意強調的一個“終極話題”——GPT-5在健康醫療領域的應用。
來到GPT-5發布會現場的這位女士是身患三種癌癥的患者。面對醫生發來的復雜醫學報告,她一頭霧水,而最終治療方案的選擇又完全壓在她自己身上。
GPT?5 于是登場:它不僅將難懂的醫學術語翻譯成日常語言,還就每種治療方案的利弊做出清晰對比,甚至幫助她從心理與生活角度評估哪種路徑更適合她的狀態。

在這場AI競技場上,海外已經開始卷起來。
一個晚上,奧特曼連發12條X;
而就在GPT-5發布會期間,在X上刷屏的不止奧特曼,還有馬斯克——他說“Grok在一般推理任務上已經超過GPT-5。”