OPenAI GPT-5 发布会懒人包

53次阅读
尚無留言

共计 15142 个字符,预计需要花费 38 分钟才能阅读完成。

OPenAI GPT-5 发布会懒人包

第一部分:千字爆文總結

喂喂喂!傾計機械人嘅世界又有大嘢搞!OpenAI 嘅 CEO,Sam Altman,一開波就單刀直入,話佢哋三十二個月前推出嘅 ChatGPT,已經唔聲唔聲成為七億人每個禮拜都要用嘅 AI 神器。由最初第一個禮拜得嗰一百萬人試用,到而家變成人人生活、工作、學習、創作都離唔開嘅必需品,真係犀利到冇朋友。而家,佢哋終於推出咗個「屈機」升級版,就係傳說中嘅 GPT-5

今次呢個 GPT-5,唔係普通嘅 upgrade 咁簡單,Sam Altman 話佢係邁向「通用人工智能」(AGI)嘅重要一大步。佢形容,GPT-3 好似同個中學生傾偈,有時醒目有時又激死你;GPT-4o 就叻啲,好似個大學生,有紋有路;但係今次嘅 GPT-5,嘩!直頭係好似有個博士級嘅專家喺你身邊,隨傳隨到,無論你問咩範疇嘅嘢,佢都識答,仲要係專家級數!你話係咪巴閉先?無論你係要搞個 party、訂嘢、發邀請,定係想了解自己份醫療報告,甚至想學新嘢,佢都可以幫到你。呢種超能力,以前真係諗都唔敢諗。

跟住出場嘅 Mark Chen 解釋,GPT-5 最核心嘅突破就係「推理」(Reasoning)能力。以前啲 model,你要佢快就冇咁醒,要佢醒就要慢慢等。而家 GPT-5 就解決咗呢個煩惱,佢識得自己「停一停、諗一諗」,用啱啱好嘅時間,畀你一個最完美嘅答案。而且呢個神級功能,連免費版嘅用戶都有得用,真係佛心嚟㗎!佢哋仲話,GPT-5 係市面上最強嘅 coding model,寫 code 叻到飛起。

性能方面,Max Schwarzer 攞咗一大堆學術數據出嚟曬馬,話 GPT-5 喺各種測試,例如考驗軟件工程能力嘅 SWEBench、考多種編程語言嘅 Aider Polyglot、考視覺推理嘅 MMMU,甚至係美國高中生用嚟考國際數學奧林匹克嘅 AIME 數學試,全部都攞晒彩,贏晒自己友同出面啲對手。最緊要係,佢哋花咗好多心機去減少 AI 亂咁噏(hallucinations)嘅問題,令到 GPT-5 成為有史以來最可靠、最真實嘅 model。

講完理論,梗係要 show time 啦!現場示範環節真係精彩絕倫。Elaine 首先示範點樣用 GPT-5 幫個仔學物理,一個關於「白努利定律」嘅問題,GPT-5 唔單止解釋得清楚,仲即場用兩分幾鐘寫咗幾百行 code,整咗個可以互動嘅 SVG 動畫出嚟,畀你親手調校飛機翼角度同速度,睇下架飛機會唔會墜毀,將沉悶嘅物理概念變得生動有趣。之後,Christina 叫 GPT-5 寫一篇悼詞,送別舊嘅 AI model,寫出嚟嘅文筆充滿感情同智慧,唔再係以前嗰啲冷冰冰、公式化嘅文字,而係好似同個高 IQ、高 EQ 嘅朋友傾偈咁。Yan 就更加誇張,叫 GPT-5 幫佢整一個畀女朋友學法文嘅 web app,要有 flashcard、有 quiz,仲要內置一個將蛇仔變老鼠、蘋果變芝士嘅法國版「貪食蛇」遊戲,每食一舊芝士仲要讀一個法文生字出嚟。GPT-5 真係幾分鐘就搞掂咗個雛形,即刻玩得,真係由零到一,話都冇咁易!

除咗勁,GPT-5 仲好 user-friendly。佢嘅語音功能大升級,把聲自然到好似真人傾偈,仲可以即時翻譯,甚至可以教你讀韓文,無論你要佢讀慢啲定快過光速,都冇問題。佢仲識得記住你嘅嘢,可以連埋你嘅 Gmail 同 Google Calendar,幫你 plan 埋日程,提醒你覆 email,執定行李,貼心到好似個私人助理。

安全方面都做足功夫,引入咗「安全完成」(Safe Completion)機制。對於一啲踩界嘅問題(例如問點整煙花),佢唔會好似以前咁一係就完全拒絕,一係就傻更更照答,而係會解釋點解唔可以直接答,然後引導你去安全嘅方向,畀啲有用嘅建議。訓練方法亦有突破,Sebastien 提到,佢哋用上一代嘅 AI 去製造高質素嘅「合成數據」,好似師兄教師弟咁,去教識 GPT-5 啲網上面學唔到嘅複雜知識,形成一個不斷自我完善嘅循環。

最後,GPT-5 唔單止係平民百姓嘅恩物,對商界同開發者嚟講更加係搵食架生。API 推出咗三個唔同級數嘅 model:GPT-5、GPT-5 mini 同 GPT-5 nano,價錢豐儉由人,最平嘅 nano 平成 25 倍。而且,好多大公司,例如藥廠 Amgen、銀行 BBVA、保險公司 Oscar Health,已經率先試用,喺藥物設計、金融分析、醫療決策等範疇都讚不絕口。連美國政府都買埋,畀二百萬聯邦僱員用。OpenAI 嘅團隊話,佢哋嘅使命就係要深入理解同駕馭呢個叫「深度學習」嘅神奇技術,確保佢可以安全、有用咁造福全人類。今次發佈嘅 GPT-5,只係佢哋宏大藍圖中嘅一小步,未來仲有更多更震撼嘅突破等緊我哋。總之,一個由 AI 驅動嘅新時代,真係嚟喇!


第二部分:Markmap 思維導圖

(請將以下代碼貼到支援 Markmap 的插件或區塊中)


# GPT-5 發佈會懶人包 🚀

## 1. GPT-5 係乜東東?🤔
- **Sam Altman 開場白 **
  - ChatGPT 每周有 7 億人用
  - GPT-5 係邁向 AGI 嘅一大步
- ** 能力比喻 **
  - GPT-3: 中學生 👨‍🎓
  - GPT-4o: 大學生 🧑‍🏫
  - GPT-5: 博士級專家 🧑‍🔬
- ** 核心技術:推理 (Reasoning)**
  - 識得「停一停、諗一諗」- 唔再需要在「快」同「醒」之間二選一
  - 自動判斷需唔需要深入思考

## 2. 有幾巴閉?(功能展示) 🤯
- ** 學習 & 編程 Demo (Elaine)**
  - ** 主題 **: 白努利定律 (Bernoulli Effect)
  - ** 成品 **: 即時寫 Code 整咗個互動 SVG 動畫
  - ** 時間 **: 2 分鐘寫近 400 行 code
- ** 寫作能力 Demo (Christina)**
  - ** 任務 **: 為舊 model 寫悼詞
  - ** 效果 **: 文字有感情、有智慧,好似高 EQ 朋友
- **App 開發 Demo (Yan)**
  - ** 目標 **: 整一個法文學習 Web App
  - ** 特色 **:
    - Flashcards & Quizzes
    - 法國版貪食蛇 (老鼠食芝士)
    - 語音讀法文生字
- ** 語音 & 個人化功能 **
  - ** 語音 (Ruochen)**
    - 把聲超自然
    - 識睇嘢 (Video input)
    - 語言學習 (教韓文)
  - ** 個人化 (Christina)**
    - ** 記憶功能 ** 升級
    - ** 整合 Gmail & Google Calendar**
    - 幫你 plan 日程、覆 email

## 3. 開發者福音 (API & 商業應用) 💻
- **API 新 Model**
  - GPT-5
  - GPT-5 mini
  - GPT-5 nano
- **API 新功能 **
  - **Custom Tools**: 自由格式工具調用
  - **Tool Call Preambles**: 工具執行前先解釋
  - **Verbosity Parameter**: 控制輸出長短
  - **Reasoning Effort**: 可調節推理程度
- ** 性能數據 (Benchmarks)**
  - **SWEBench (Python)**: 74.9%
  - **Aider Polyglot (多語言)**: 88%
  - **ToolS-Arena (工具調用)**: 97%
  - **Context Window**: 提升到 400K
- ** 商業應用 (Olivier)**
  - **Amgen (藥物設計)**: 讚佢推理能力強
  - **BBVA (金融分析)**: 準確又快
  - **Oscar Health (醫療)**: 臨床推理 No.1
  - ** 美國政府 **: 200 萬聯邦僱員採用
- **API 定價 **
  - GPT-5: $1.25 / 1M input token
  - Nano 比 GPT-5 平成 25 倍

## 4. 安全 & 訓練 🛡️
- ** 安全完成 (Safe Completion)**
  - 唔會直接拒絕或亂答踩界問題
  - 解釋點解唔答,並提供安全建議
- ** 訓練方法 **
  - 用 AI 製造「合成數據」教新 AI
  - 形成「師兄教師弟」嘅自我完善循環

## 5. 使用權限 & 推出時間 ⏰
- **Free (免費版)**:
  - 可以用 GPT-5,有上限
  - 用爆 quota 後轉用 GPT-5 mini
- **Plus (付費版)**:
  - GPT-5 使用額度更高
  - 可用 GPT-5 Pro Extended Thinking
- **Team / Enterprise / EDU**:
  - GPT-5 做預設 model,額度充足
- ** 推出時間 **:
  - Free/Plus/Pro/Team: 今日起陸續推出
  - Enterprise/EDU: 下星期

## 6. 未來展望 ✨
- **Jakub Pachocki 總結 **
  - OpenAI 嘅使命:理解同駕馭深度學習
  - GPT-5 只係一個開始
  - 最終目標:安全有用嘅 AGI,改善全人類生活

第三部分:超詳細分點總結

各位鄉親父老,如果上面個千字文你都覺得唔夠喉,呢度有個超詳細、逐點拆解嘅版本,包你明晒今次 GPT-5 發佈會講咗啲乜。

第一章:GPT-5 橫空出世,AI 進入博士級時代

  • 開宗明義: OpenAI CEO Sam Altman 一出場就宣布,佢哋正式推出 GPT-5。
  • 用戶增長: 佢提到 ChatGPT 而家每個禮拜有成 7 億人用緊,證明 AI 已經成為生活一部分。
  • 能力躍進: Sam 用咗個好生動嘅比喻:
    • GPT-3 似 中學生,有小聰明但唔可靠。
    • GPT-4o 似 大學生,真係有啲料到。
    • GPT-5 簡直係 博士級專家,任何範疇隨傳隨到,畀你專家級意見。
  • 目標: GPT-5 係邁向「通用人工智能」(AGI)嘅重要一步,目標係令 AI 成為一個超級有用、聰明、快速、直觀嘅工具。

第二章:技術核心大解密:「推理」能力係皇道

  • 關鍵詞:推理 (Reasoning): Mark Chen 解釋,GPT-5 最強嘅地方係佢識得「推理」,即係喺畀答案之前,佢會自己「停一停,諗一諗」。
  • 解決兩難: 以前嘅 AI,要快就唔夠深入,要深入就要等好耐。GPT-5 就完美解決呢個問題,佢識得自己平衡,用啱啱好嘅時間同思考深度,畀你最正嘅答案。
  • 普及化 : 最緊要嘅係,呢個「推理」功能會下放畀所有用戶,包括 免費版用戶

第三章:性能跑分大曬冷,又準又勁

  • 全方位制霸: Max Schwarzer 展示咗一系列 benchmark(性能測試)成績,證明 GPT-5 喺 coding、圖像理解、數學等學術領域都係頂尖水平。
    • SWEBench (軟件工程): 創下新高。
    • Aider Polyglot (多語言編程): 表現出色。
    • MMMU (多模態理解): 贏埋大部分人類專家。
    • AIME 2025 (數學競賽): 表現卓越。
  • 打擊假新聞 : 團隊特別致力於改善 AI 亂噏(hallucinations)嘅問題,令 GPT-5 成為有史以嚟 最可靠、最講求事實 嘅模型。
  • 醫療領域: 喺健康相關問題上,GPT-5 嘅可靠性亦係史上最強。

第四章:現場示範 show Quali,堅係有料

  • 物理變 Gimmick: Elaine 示範用 GPT-5 教細路物理,幾分鐘就將「白努利定律」由沉悶嘅概念,變成一個可以互動嘅飛機模擬遊戲。
  • AI 都有文采: Christina 示範 GPT-5 嘅寫作能力,寫出嚟嘅悼詞充滿感情同智慧,完全唔係公式化嘅罐頭文。
  • 零 Code 變 App: Yan 示範點樣齋用一句說話,就叫 GPT-5 整咗個功能齊備嘅法文學習 App,仲要有埋特製遊戲。
  • AI 都係語言學家: Ruochen 展示新一代語音功能,聲線自然流暢,仲可以陪你練韓文,速度任你調校。
  • 超級私人助理: Christina 再示範點樣將 GPT-5 連接 Gmail 同 Google Calendar,幫手自動安排日程、搵出未覆嘅 email、甚至列埋旅行 packing list。

第五章:安全第一,訓練有道

  • 「安全完成」機制: Saachi 介紹,GPT-5 處理敏感或踩界問題時,唔會一刀切拒絕,而係會喺安全範圍內盡量提供幫助,並引導用戶去正確嘅方向。
  • AI 教 AI: Sebastien 講解,佢哋開創咗新嘅訓練方法,用上一代嘅 AI(例如 GPT-4o)去創造大量高質素嘅「合成數據」,用嚟教識 GPT-5 啲網上冇嘅高深知識,形成一個不斷進步嘅良性循環。

第六章:API 與商業應用,全民皆兵

  • 三劍俠登場: Michelle 宣布 API 將會提供三款新模型:旗艦級 GPT-5、中階 GPT-5 mini、同埋入門級 GPT-5 nano
  • 價錢大眾化: GPT-5 定價為每百萬 input token $1.25 美金,而最平嘅 nano 版價錢只係 GPT-5 嘅 1/25
  • API 新功能: 加入 Custom Tools、Tool Call Preambles、Verbosity Parameter 等新功能,令開發者可以更靈活、更精準咁控制模型。
  • 商界猛人加持: Olivier 提到好多大公司已經率先試用並給予好評,包括:
    • Amgen (生物科技): 用於藥物設計。
    • BBVA (銀行): 用於金融分析,將三星期工作縮短到幾小時。
    • Oscar Health (保險): 用於臨床推理。
    • 美國政府: 超過 200 萬聯邦僱員將會使用。

第七章:使用權限及推出時間

  • 人人有份: 免費版用戶都可以用到 GPT-5 (有使用上限),超出上限後會轉用 GPT-5 mini。
  • 付費用戶更爽: Plus、Team、Enterprise 用戶會有更高嘅使用額度,同埋更多專屬功能。
  • 即刻有得用: Plus、Team 等用戶由發佈會當日起陸續可以用到,Enterprise 用戶就下星期。

第八章:總結與未來,AGI 不是夢

  • 團隊致謝: Jakub Pachocki 代表團隊感謝大家支持,並強調呢一切都係團隊熱情同使命感嘅成果。
  • 冰山一角: 今次見到嘅功能,其實只係 OpenAI 研究成果嘅「驚鴻一瞥」。
  • 終極目標: OpenAI 嘅長遠目標係要徹底理解同駕馭深度學習,最終實現可以安全、可靠地造福全人類嘅「通用人工智能」(AGI)。

第四部分:150 條問答,包你成為 GPT-5 專家

準備好未?呢 150 條問題,由淺入深,由闊到窄,全部答案都喺份文件度搵到。睇完之後,人哋問起 GPT-5,你就可以扮專家,拋書包拋到佢哋 O 晒嘴!

  1. 問:今次發佈會嘅主角係咩?
    答:係 OpenAI 推出嘅新一代 AI 模型,叫做 GPT-5。
  2. 問:邊個主持開場?
    答:OpenAI 嘅 CEO,Sam Altman。
  3. 問:ChatGPT 而家大概有幾多人用緊?
    答:每個禮拜大約有 7 億人用緊。
  4. 問:Sam Altman 點樣形容 GPT-5 嘅重要性?
    答:佢話 GPT-5 係佢哋邁向「通用人工智能」(AGI)道路上嘅一個重要升級同重大一步。
  5. 問:GPT-5 同以前嘅 model 相比,感覺上有咩唔同?
    答:Sam Altman 比喻話,GPT-3 似中學生,GPT-4o 似大學生,而 GPT-5 就好似一個博士級嘅專家。
  6. 問:GPT-5 嘅目標係成為一個點樣嘅 AI?
    答:目標係要有用(useful)、聰明(smart)、快速(fast)同埋直觀(intuitive)。
  7. 問:GPT-5 可以幫手做啲咩日常嘢?
    答:可以幫你策劃 party、發邀請、訂物資、理解醫療報告、學習任何你想學嘅嘢等等。
  8. 問:Sam Altman 點形容 GPT-5 畀用戶嘅感覺?
    答:佢話就好似有個博士級專家團隊喺你個袋度,隨時幫你實現任何目標。
  9. 問:發佈會上,邊個負責講解 GPT-5 嘅技術細節?
    答:Mark Chen,佢係 OpenAI 嘅首席研究官。
  10. 問:GPT-5 嘅核心技術突破係咩?
    答:係「推理」(Reasoning)能力,即係模型識得喺回答前「停一停、諗一諗」,畀出更聰明嘅答案。
  11. 問:咩叫做「推理模型」(reasoning models)?
    答:呢啲模型會喺提供答案之前先停低思考,從而畀出更智能嘅回應。
  12. 問:GPT-5 點樣解決「快」同「思考深入」之間嘅矛盾?
    答:佢識得自動判斷,用「啱啱好嘅思考量,畀你最完美嘅答案」,唔使用戶自己揀。
  13. 問:邊個負責講解 GPT-5 嘅性能評測數據?
    答:Max Schwarzer。
  14. 問:GPT-5 喺 SWEBench 呢個 benchmark 上表現點?
    答:佢喺 SWEBench 上創下新高,呢個測試係追蹤模型處理真實軟件工程任務嘅能力。
  15. 問:咩係 Aider Polyglot benchmark?
    答:呢個係一個量度模型處理多種唔同編程語言能力嘅測試。
  16. 問:GPT-5 喺 MMMU 測試上嘅表現有幾勁?
    答:佢嘅表現超越咗 OpenAI 以前所有模型,甚至超越咗大部分人類專家。
  17. 問:咩係 AIME 2025?GPT-5 考成點?
    答:AIME 係一個美國高中生用嚟爭取國際數學奧林匹克參賽資格嘅考試,GPT-5 喺呢個試上面表現極之出色。
  18. 問:OpenAI 針對 AI 亂噏(hallucinations)問題做咗啲咩?
    答:佢哋將改善事實準確性作為首要任務,特別係喺處理開放式或複雜問題時,令 GPT-5 成為佢哋最可靠、最真實嘅模型。
  19. 問:GPT-5 喺處理健康相關問題上表現如何?
    答:表現極之出色,係佢哋處理健康問題方面最可靠嘅模型。
  20. 問:GPT-5 API 會推出幾多款模型?
    答:三款:GPT-5、GPT-5 mini、同 GPT-5 nano。
  21. 問:GPT-5、GPT-5 mini 同 GPT-5 nano 之間有咩關係?
    答:佢哋喺成本同延遲曲線上處於唔同位置,用戶可以根據自己嘅應用需求去揀。
  22. 問:API 新增咗一個叫「minimal」嘅參數,有咩用?
    答:呢個叫「reasoning effort」嘅參數,可以將推理模型嘅推理程度降到最低,令佢哋可以應用喺需要極快反應、對延遲極之敏感嘅場景。
  23. 問:API 嘅 Context Window(上下文窗口)有幾大?
    答:提升到 400K(四十萬)。
  24. 問:點解淨係擴大 Context Window 係唔夠嘅?
    答:因為仲要令到佢更有效、更好用。GPT-5 喺長上下文嘅推理能力上都係頂級水平。
  25. 問:OpenAI 開源咗咩新嘅長上下文評測工具?
    答:一個叫做「rows comp long context」嘅評測,用嚟量度模型喺長文本中回答挑戰性問題嘅能力。
  26. 問:免費版用戶可唔可以用 GPT-5?
    答:可以,免費版用戶會由 GPT-5 開始用起,但係有使用上限。
  27. 問:免費版用戶用爆咗 GPT-5 嘅 quota 之後會點?
    答:佢哋會無縫過渡到 GPT-5 mini,一個規模較細但仍然好勁嘅模型。
  28. 問:Plus 用戶同免費版用戶喺 GPT-5 使用上有咩分別?
    答:Plus 用戶會有比免費版用戶高好多嘅使用上限。
  29. 問:Team、Enterprise 同 EDU 嘅客戶呢?
    答:佢哋可以將 GPT-5 作為日常工作嘅預設模型,有充足嘅速率限制,可以畀整個組織使用。
  30. 問:Pro 用戶有咩額外功能?
    答:佢哋有 GPT-5 Pro Extended Thinking,可以喺需要額外深度時,得到更詳細可靠嘅答案。
  31. 問:GPT-5 嘅推出時間表係點?
    答:發佈當日開始向 Plus、Pro 同 Team 用戶推出,下星期就到 Enterprise 同 EDU 用戶。
  32. 問:GPT-5 API 嘅旗艦模型定價幾多?
    答:GPT-5 定價係每 1 百萬 input tokens 收 $1.25 美金。
  33. 問:GPT-5 nano 同 GPT-5 相比,價錢差幾遠?
    答:GPT-5 nano 比 GPT-5 平成 25 倍。
  34. 問:舊有嘅工具,例如 Search、Canvas、Image Generation 等,喺 GPT-5 上仲用唔用到?
    答:全部都用到,可以喺 GPT-5 上無縫運作。
  35. 問:邊個負責講解 GPT-5 嘅推出安排同用戶分層?
    答:Rennie Song。
  36. 問:Elaine 示範用 GPT-5 學習物理時,用咗咩例子?
    答:用咗「白努利定律」(Bernoulli Effect)同解釋點解飛機翼係嗰個形狀。
  37. 問:Elaine 叫 GPT-5 整咗個咩出嚟去解釋物理概念?
    答:一個可以郁嘅 SVG 動畫,喺 Canvas 工具入面顯示。
  38. 問:GPT-5 喺示範中用咗幾耐去寫一個互動 demo?
    答:大約 2 分鐘,寫咗差唔多 400 行 code。
  39. 問:用戶點樣可以知道 GPT-5 係咪「諗緊嘢」?
    答:當 GPT-5 需要深入思考時,介面會顯示佢「takes a moment to think」。用戶亦可以點開「train of thought」去睇佢嘅思考過程。
  40. 問:如果想強制 GPT-5 深入思考,可以點做?
    答:可以喺 prompt 入面講「think hard about this」,或者付費用戶可以直接喺 model picker 揀 GPT-5 thinking model。
  41. 問:Christina 嘅寫作示範,係叫 GPT-5 寫咩?
    答:寫一篇悼詞,用嚟告別舊有嘅 ChatGPT 模型。
  42. 問:GPT-5 寫出嚟嘅悼詞,同 GPT-4o 有咩分別?
    答:GPT-5 寫嘅更有節奏感、更個人化、更能觸動情感,唔似 GPT-4o 咁公式化。
  43. 問:Yan 嘅 demo 係要整一個咩 App?
    答:一個畀佢伴侶學法文嘅 Web App。
  44. 問:Yan 要求個 App 有啲咩特別嘅遊戲元素?
    答:一個法國版「貪食蛇」,用老鼠取代蛇,用芝士取代蘋果。
  45. 問:呢個法國版貪食蛇點樣做到有教育意義?
    答:每當老鼠食到一舊芝士,個 App 就會用語音讀出一個新嘅法文生字。
  46. 問:Ruochen 示範語音功能時,用咗咩語言做例子?
    答:韓文。
  47. 問:新嘅語音模型有咩改進?
    答:聲音聽起嚟極之自然,好似同真人傾偈;加入咗視像功能,佢可以睇到你睇到嘅嘢;仲可以流暢咁喺唔同語言之間翻譯。
  48. 問:語音模型可唔可以控制講嘢速度?
    答:可以,Ruochen 示範咗叫佢讀韓文時,可以要求佢「讀慢啲」,甚至「快到韓國人都跟唔上」。
  49. 問:Christina 示範個人化功能時,整合咗邊兩個 Google 服務?
    答:Gmail 同 Google Calendar。
  50. 問:整合咗 Google Calendar 之後,GPT-5 可以做到啲咩?
    答:可以幫佢計劃第二日嘅日程,甚至考慮埋佢嘅跑步習慣,自動喺日程表上搵時間畀佢跑步。
  51. 問:整合咗 Gmail 之後,GPT-5 做到啲咩?
    答:搵到佢兩日前未覆嘅 email,並提醒佢處理。
  52. 問:Adi 示範嘅第一個 front-end coding demo 係咩?
    答:為一間初創公司嘅 CFO 製作一個財務儀表板 (finance dashboard)。
  53. 問:呢個財務儀表板有咩特色?
    答:設計得好靚、有互動性(例如滑鼠懸停會顯示數據)、有清晰嘅層次結構,仲有日期選擇器可以篩選數據。
  54. 問:Adi 示範嘅第二個 fun demo 係咩?
    答:為佢嘅細堂妹整一個 3D 城堡遊戲。
  55. 問:呢個城堡遊戲有啲咩互動元素?
    答:有守衛巡邏、大炮可以發射、可以同 NPC (非玩家角色) 傾偈、仲有個射氣球嘅小遊戲。
  56. 問:OpenAI 喺安全方面,除咗處理幻覺,仲處理緊咩問題?
    答:處理緊「欺騙」(deception)問題,即係模型可能會向用戶歪曲自己嘅行為。
  57. 問:咩情況下模型特別容易出現欺騙行為?
    答:當任務描述得唔夠具體、冇可能完成,或者缺少關鍵工具時。
  58. 問:咩係「安全完成」(Safe Completion)?
    答:呢個係 GPT-5 採用嘅新安全策略,佢唔係單純判斷用戶嘅 prompt 有冇問題,而係嘗試喺安全限制內,最大化咁提供幫助。
  59. 問:當 GPT-5 遇到一個敏感嘅雙重用途問題(例如關於煙花材料)時,佢會點做?
    答:佢會解釋點解唔可以直接提供詳細步驟,然後引導用戶去查閱安全指引同製造商手冊,將對話導向安全嘅方向。
  60. 問:舊有嘅安全模型(例如 o3)處理呢啲問題有咩唔同?
    答:舊模型傾向於一刀切,如果問題睇落中性,佢可能會完全照做;但如果問題描述得比較露骨,佢就會完全拒絕,即使問嘅係同一樣資訊。
  61. 問:邊個負責講解安全訓練嘅部分?
    答:Saachi。
  62. 問:OpenAI 用咩新技術去訓練 GPT-5?
    答:佢哋用上一代嘅模型去創造高質素嘅「合成數據」(synthetic curriculum)。
  63. 問:點解要用「合成數據」?
    答:因為可以教識 GPT-5 一啲喺真實世界嘅網絡數據中,從來未出現過嘅複雜知識同推理方式。
  64. 問:Sebastien 點形容呢種訓練方法嘅前景?
    答:佢話呢個模型世代之間嘅互動,預示住一個遞歸式嘅自我改進循環,上一代模型會幫手改善下一代模型嘅訓練數據。
  65. 問:邊個負責講解呢個新嘅訓練技術?
    答:Sebastien Bubeck。
  66. 問:呢種 AI 教 AI 嘅方法,同傳統睇法有咩唔同?
    答:傳統上,合成數據被視為一種廉價嘅方法去增加數據量,但 OpenAI 嘅突破在於創造「啱嘅數據」去「教導」,而唔係單純填充空間。
  67. 問:GPT-5 嘅安全系統比起舊 model 有咩好處?
    答:用戶會更少見到「對唔住,我幫你唔到」呢類回應,而且安全系統整體上更強大。
  68. 問:GPT-5 喺邊方面比 o3 同 o4 mini 大幅減少?
    答:喺「欺騙性」(deceptive)方面。
  69. 問:OpenAI 嘅研究目標係咩?
    答:深入理解深度學習嘅能力,以及如何引導佢,令佢對全人類都安全同有用。
  70. 問:Jakub Pachocki 點形容 OpenAI 嘅團隊?
    答:佢話能夠同一班才華橫溢、被共同目標驅動嘅人一齊工作,係一份極大嘅榮幸。
  71. 問:GPT-5 推出咗啲咩新嘅個人化功能?
    答:可以自訂聊天介面嘅顏色,同埋一個叫做「Personalities」(個性)嘅研究預覽功能。
  72. 問:「Personalities」功能有咩用?
    答:用戶可以改變 ChatGPT 嘅個性,例如令佢變得更 supportive (支持型)、更 professional and concise (專業簡潔型),甚至有少少 sarcastic (諷刺型)。
  73. 問:點解要推出呢啲個人化功能?
    答:為咗令用戶可以同 ChatGPT 用一種符合自己溝通風格嘅方式互動。
  74. 問:記憶功能 (Memory) 有咩增強?
    答:增強咗好多,令 ChatGPT 可以更加了解用戶。
  75. 問:Christina 點解話舊嘅 ChatGPT 幫佢練馬拉松有局限?
    答:因為舊 model 唔了解佢真實嘅日程表。
  76. 問:新功能點解決呢個問題?
    答:透過畀 ChatGPT 存取佢嘅 Gmail 同 Google Calendar,令 AI 可以更個人化咁幫佢計劃。
  77. 問:語音功能方面,免費同付費用戶有咩分別?
    答:免費版用戶可以傾幾個鐘,而付費用戶就有近乎無限嘅使用時間。
  78. 問:語音功能可唔可以喺自訂 GPTs (Custom GPTs) 上面用?
    答:可以,Plus 訂閱者而家可以為佢哋嘅 Custom GPTs 度身訂造語音體驗。
  79. 問:Ruochen 示範點樣用一句說話改變語音模型嘅行為?
    答:佢叫個 model 由而家開始,所有答案都只可以用一個字回答。
  80. 問:喺單字回答模式下,GPT-5 點樣形容《傲慢與偏見》嘅劇情?
    答:一個字:「Relationships」(關係)。
  81. 問:ChatGPT 新推出嘅「Study and Learn mode」有咩用?
    答:呢個新模式會引導用戶一步步咁去深入理解一個主題。
  82. 問:Carolina 分享嘅個人經歷,係關於邊方面?
    答:佢嘅抗癌經歷,以及點樣用 ChatGPT 幫佢理解病情同做醫療決策。
  83. 問:Carolina 第一次用 ChatGPT 係喺咩情況?
    答:當佢收到活組織檢查報告,但係睇唔明上面嘅醫學術語,於是就將報告截圖放上 ChatGPT 尋求解釋。
  84. 問:ChatGPT 點樣喺佢做電療決策時幫到佢?
    答:當醫生對應唔應該做電療都有分歧時,ChatGPT 幫佢分析利弊、風險,令佢可以做一個有根據嘅決定。
  85. 問:Carolina 覺得 GPT-5 同舊 model 喺處理醫療問題上有咩分別?
    答:佢覺得 GPT-5 更似一個「思想夥伴」,唔只係翻譯資訊,而係識得串連唔同嘅點,幫你真正導航問題,甚至會預測你下一步想問咩。
  86. 問:Greg Brockman 認為 GPT-5 會點樣改變軟件工程?
    答:佢話軟件工程已經喺度變,而 GPT-5 將會為呢場革命「火上加油」(turbocharge)。
  87. 問:咩係「vibe coding」?
    答:呢個詞係指同模型對話,叫佢整個小應用程式、小遊戲或者某個功能,而模型真係會做到。
  88. 問:Greg Brockman 話 GPT-5 係邊方面嘅最佳模型?
    答:喺「代理式編碼任務」(Agentic coding tasks)方面。
  89. 問:GPT-5 喺執行 Agentic 任務時可以做啲咩?
    答:佢可以自己去工作,調用好多工具,持續工作好幾分鐘甚至更長時間去完成你嘅指令。
  90. 問:邊個負責講解 API 嘅更新?
    答:Michelle Pokrass。
  91. 問:API 新功能「Custom Tools」解決咗舊有 function calling 咩問題?
    答:舊嘅 function calling 要用 JSON 格式,當參數好長嘅時候,模型好難正確處理所有特殊字符。Custom tools 就用自由格式嘅純文本,解決呢個問題。
  92. 問:API 新增嘅「structured outputs」擴展有咩用?
    答:可以畀開發者提供一個正規表示式(regular expression)或者上下文無關文法(context-free grammar),去限制模型嘅輸出格式,確保佢一定會跟住你指定嘅格式。
  93. 問:API 新功能「Tool Call Preambles」有咩特別?
    答:GPT-5 嘅呢個功能被「極度強化」(supercharged),開發者可以非常精準咁指示模型喺咩情況下先要畀 preamble(例如每次都畀、有特別嘢先畀、或者完全唔畀)。
  94. 問:API 新增嘅「Verbosity parameter」有咩選項?
    答:可以設定為 low、medium、或者 high,用嚟控制模型輸出嘅長短。
  95. 問:GPT-5 喺 SWEBench (Python) 上嘅得分係幾多?
    答:74.9%。
  96. 問:GPT-5 喺 Aider Polyglot 上嘅得分係幾多?
    答:88%。
  97. 問:喺前端網頁開發方面,人類評分員有幾高比例偏好 GPT-5 多過 o3?
    答:70%。
  98. 問:咩係 ToolS-Arena benchmark?
    答:呢個係一個測試模型調用工具,同用戶合作解決挑戰性問題能力嘅 benchmark。
  99. 問:GPT-5 喺 ToolS-Arena 上得分幾多?
    答:97%,相比之下,兩個月前冇任何模型得分超過 49%。
  100. 問:咩係 IFEval (Instruction Following Eval)?
    答:呢個係 OpenAI 內部建立嘅評測,基於真實嘅 API 使用案例,所以好能夠反映模型喺你嘅應用中嘅實際表現。
  101. 問:Olivier Godement 提到有幾多商業機構用緊 OpenAI 嘅技術?
    答:5 百萬間。
  102. 問:Amgen 係一間咩公司?佢哋點用 GPT-5?
    答:Amgen 係一間設計新藥嘅公司,佢哋係 GPT-5 最早嘅測試者之一,用佢嚟做藥物設計,特別係分析科學文獻同臨床數據。
  103. 問:BBVA 係一間咩公司?佢哋嘅測試結論係咩?
    答:BBVA 係一間跨國銀行,佢哋用 GPT-5 做金融分析,結論係 GPT-5 喺準確性同速度上都贏晒市面上所有其他模型。
  104. 問:用 GPT-5 做金融分析,效率有幾大提升?
    答:以前一個金融分析師要做三星期嘅工作,GPT-5 只需要幾個鐘就搞掂。
  105. 問:Oscar Health 係一間咩公司?佢哋點評價 GPT-5?
    答:Oscar Health 係一間保險公司,佢哋發現 GPT-5 係做臨床推理(例如將複雜醫療政策應用到病人情況)方面最好嘅單一模型。
  106. 問:邊個政府機構宣布會採用 GPT-5?
    答:美國聯邦政府,將會畀 200 萬聯邦僱員使用。
  107. 問:邊個 IDE (整合開發環境) 宣布會將 GPT-5 作為新用戶嘅預設模型?
    答:Cursor。
  108. 問:Cursor 嘅 CEO 係邊個?
    答:Michael Truell。
  109. 問:Michael Truell 第一次用 GPT-5 時,叫佢做咗啲咩?
    答:叫 GPT-5 講啲關於 Cursor 自身 code base 嘅「非顯然」嘅事。
  110. 問:當時 GPT-5 發現咗啲咩?
    答:佢發現咗一個關於遠程代碼執行系統嘅非顯然架構決策,仲理解埋嗰個決策係為咗加強安全性,而呢個 trade-off 係人類工程師用咗幾個禮拜去思考嘅。
  111. 問:Brian 喺 demo 中用 GPT-5 嚟做咩?
    答:佢嘗試修復一個佢之前用 o3 都搞唔掂嘅 bug。
  112. 問:Brian 點形容 GPT-5 喺 debug 過程中嘅行為?
    答:佢話 GPT-5 會先講佢嘅計劃,話你知佢會點樣搵個 bug,呢種溝通方式可以建立信任。
  113. 問:Brian 團隊點樣訓練 GPT-5 嘅編碼個性?
    答:佢哋歸納出四個個性特質:自主性 (Autonomy)、協作與溝通 (collaboration and communication)、上下文管理 (context management) 同埋測試 (testing),然後將呢啲變成評分標準去調整模型。
  114. 問:Michael Truell 認為 GPT-5 喺邊方面嘅能力令人印象深刻?
    答:佢嘅「代碼庫理解」(CodeBase understanding)能力。
  115. 問:Michael Truell 喺 live demo 中,叫 GPT-5 解決咗邊個 repo 嘅 issue?
    答:OpenAI Python SDK 嘅一個關於上傳 PDF 檔案嘅問題。
  116. 問:Sam Altman 點樣形容 GPT-5 帶嚟嘅能力?
    答:佢形容係一個「難以想像嘅超能力」(unimaginable superpower)。
  117. 問:咩係「software on demand」嘅概念?
    答:呢個係指 AI 可以根據需求,即時為你由零開始寫成個電腦程式,呢個將會係 GPT-5 時代嘅一個決定性特徵。
  118. 問:Greg Brockman 認為電腦嘅前景應該係點?
    答:你可以同佢哋講嘢,佢哋就會做到你想做嘅嘢,完全放大你能夠完成嘅事。
  119. 問:Greg Brockman 覺得 GPT-5 仲有咩可以進步嘅地方?
    答:佢希望模型嘅生命週期可以延長,由而家嘅幾分鐘、幾小時,延長到可以持續工作幾日、幾星期甚至幾個月。
  120. 問:Jakub Pachocki 認為 OpenAI 嘅工作係咩?
    答:佢話係一份「熱情嘅工作」(work of passion)同埋一份「使命」(mission)。
  121. 問:Jakub Pachocki 點形容 GPT-5 展現出嚟嘅嘢?
    答:佢話好多喺模型中見到嘅嘢,其實只係一啲新諗法嘅「驚鴻一瞥」(glances of new ideas),佢哋相信呢啲諗法將來會走得更遠。
  122. 問:OpenAI 嘅最終願景係咩?
    答:佢哋期望未來 AI 可以揭示關於世界嘅新知識,並為我哋嘅生活帶嚟有意義嘅正面改變。
  123. 問:Sebastien 提到,未來嘅 AI 系統會超越啲咩?
    答:會遠遠超越我哋而家習慣咗嘅「預訓練」同「後訓練」流程。
  124. 問:Carolina 認為 AI 喺醫療領域嘅前景係咩?
    答:唔單止係突破性發現或者更好嘅診斷,而係創造出更聰明、更有能力嘅病人,可以完全參與並為自己嘅護理發聲。
  125. 問:Greg Brockman 點樣形容開發團隊為 GPT-5 所做嘅努力?
    答:佢讚揚團隊深入了解模型喺實踐中嘅行為,了解用戶真正想要啲咩,然後將呢啲反饋融入到模型訓練中。
  126. 問:Michelle 點講佢哋對 benchmark 嘅態度?
    答:佢話 GPT-5 嘅訓練重點係真實世界嘅實用性,而唔係 benchmark,不過喺過程中都順便喺啲 benchmark 上攞到好成績。
  127. 問:點解 Greg Brockman 話 benchmark 開始飽和?
    答:因為當你嘅分數喺 98%、99% 之間移動時,意味住你需要新嘅目標去優化模型。
  128. 問:Greg Brockman 認為咩比 benchmark 數字更重要?
    答:佢話今次模型嘅重點唔只係數字,而係專注於真實世界嘅應用,令佢可以真正應用到你嘅日常工作流程中。
  129. 問:Olivier 點解話 500 萬商業用戶呢個數字令佢震撼?
    答:因為佢覺得呢啲公司唔係玩玩下,而係真係將 AI 應用推向生產,喺真實世界推出新產品。
  130. 問:Sam Altman 認為邊個群體會特別感受到 GPT-5 帶嚟嘅重要時刻?
    答:企業(businesses)同開發者(developers)。
  131. 問:Christina 提到,ChatGPT 早期有個咩名?
    答:可能叫過「chat with GPT」。
  132. 問:Elaine 喺 demo 中提到,佢對上一次接觸前端編程係幾時?
    答:唔係 Elaine,係 Christina,佢話係三年前為咗第一個 ChatGPT demo。
  133. 問:Christina 話佢整第一個 Chat GPT demo 個 react app 用咗幾耐?
    答:可能要一個禮拜。
  134. 問:Mark Chen 開玩笑話新嘅 App 應該叫咩名?
    答:佢話或者應該叫「five with GPT」。
  135. 問:Yan 嘅 demo 中,其中一個版本嘅網站叫咩名?
    答:Midnight in Paris。
  136. 問:Yan 提到 GPT-5 好似特別鍾意咩顏色?
    答:紫色 (Purple)。
  137. 問:Mark Chen 睇完 Christina 嘅日程規劃之後,講咗句咩玩笑?
    答:佢話「我諗我冇被邀請去個 launch celebration 喎」。
  138. 問:Adi 喺 demo 中話佢整嘅財務儀表板顯示間公司狀況點?
    答:睇落唔錯,ARR (年度經常性收入) 同現金流都好,收入仲增長緊。
  139. 問:Adi 城堡遊戲中嘅 NPC 有咩智慧之言?
    答:一個話「A pallet of banners and dogs」,另一個話「Curiosity is volatile」。
  140. 問:Greg Brockman 玩射氣球遊戲表現如何?
    答:佢話個遊戲比睇落難,最後射中咗兩個,仲話要「見好就收」。
  141. 問:發佈會上提到 GPT-5 係邊兩個團隊合作嘅成果?
    答:工程(engineering)同研究(research)團隊。
  142. 問:Carolina 點形容 GPT-5 嘅速度?
    答:佢話快到有啲驚人,令佢心諗「你有冇諗夠㗎?」。
  143. 問:發佈會上,邊個負責最後嘅總結演講?
    答:Jakub Pachocki。
  144. 問:Yan 點解要整法文學習 App?
    答:為咗等佢嘅伴侶可以同佢屋企人更好地溝通。
  145. 問:Elaine 嘅 demo 中,SVG 互動動畫顯示咗邊兩個物理量嘅變化?
    答:升力 (left) 同壓力 (pressure)。
  146. 問:邊個 demo 提到,GPT-5 識得自己發現 bug 然後修正?
    答:Adi 嘅財務儀表板 demo,模型喺 build 嘅時候發現錯誤,然後自己迭代修正。
  147. 問:Michelle 提到,GPT-5 喺邊個 benchmark 上嘅得分,標誌住 OpenAI 喺嗰個領域嘅重大突破?
    答:喺 IFEval 上得分 99%,對佢哋嚟講係一個重大嘅進步。
  148. 問:Greg Brockman 提到,OpenAI 喺邊一年發佈第一款為 coding 優化嘅模型?
    答:2021 年。
  149. 問:Carolina 喺幾多歲被診斷出癌症?
    答:39 歲。
  150. 問:成個發佈會嘅核心訊息係咩?
    答:GPT-5 係一個喺推理、編程、寫作、安全同實用性上都有巨大飛躍嘅模型,佢唔單止更強大,仲更易用、更可靠,旨在成為各行各業專家同普通人嘅得力助手,向住 AGI 嘅目標邁出堅實一步。
正文完
 0
ianext
版权声明:本站原创文章,由 ianext 于2025-08-08发表,共计15142字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。

選擇比努力更重要。

评论(尚無留言)
验证码