有別於前一陣子,OpenAI一直被Gemini壓著打,OpenAI要扳回一城,這個月宣布,ChatGPT推出GPT‑5.4(GPT‑5.4Thinking)、API 和 Codex,強調這是專為專業工作打造,它能先提供思考計畫,讓你在模型生成回答過程即時調整方向,也能操作電腦,幫忙發email、寫行事曆,更有製作和編輯PPT和Excel的功能,但這些都要付費,免費只能使用到GPT-5.3。
Thinking先說明再查詢 保持切題相關
GPT‑5.4 Thinking 會先提供思考計畫,讓使用者在模型生成回應的過程中即時調整方向,無需額外對話來回,就能得到更貼近需求的最終成果。GPT‑5.4 Thinking 也提升了深度網路研究能力,特別是在處理非常具體的查詢時,同時在需要較長推理過程的問題維持脈絡。綜合改進,模型更快產生更高品質的回答,與目前任務保持切題相關。
GPT‑5.4是具備原生、最先進的電腦操作能力,能智慧操作電腦,並跨不同應用程式執行複雜的工作流程。模型最多支援 100 萬 Token 的上下文,讓智慧體能在長時間任務中進行規劃、執行與驗證。GPT‑5.4 也改善模型在龐大工具與連接器生態系中的運作方式。智慧體可透過「工具搜尋」,更有效率地找到並運用合適工具,AI代理人可透過電腦介面直接操作應用程式與瀏覽器。

44種職業評測 83%項目與業界專業人士相仿或更佳
模擬真實職場的GDPval評測中,找來金融、製造、醫療、政府與資訊服務等9個產業、44種職業,執行的任務包括財務試算表、製作銷售簡報、規畫排班與設計工程流程等,再由專業人士盲測評分,結果為GPT‑5.4 在 83% 的項目中,表現與業界專業人士相仿或更好。
不過,目前ChatGPT for Excel僅開放美國、加拿大和澳洲的Plus以上方案訂閱者試用。未來還會推出可在Google試算表中使用的「ChatGPT for Google Sheets」。

OpenAI提升了GPT‑5.4建立與編輯簡報和文件的能力。在內部基準測試中,模擬初級投資銀行分析師可能執行的試算表建模任務,GPT‑5.4 的平均得分為 87.5%,而評估簡報能力的測試題組中,評估人員在 68.0% 的情況下更偏好 GPT‑5.4 生成的簡報,原因包括美感更佳、視覺呈現更多樣,且更有效運用圖像生成。

GPT-5.4是首個具備原生電腦操作能力的通用模型,在開發與智慧體領域邁出重要一步。寫程式碼這部分,透過螢幕截圖判斷桌面情境,做出滑鼠操作跟鍵盤打字輸入的操作能力,GPT‑5.4 取得 75.0% 的成功率,成績為目前最佳。目前能做到發送Email、記錄行事曆等。另外,還有「工具搜尋」和「工具呼叫」2大功能,能輔助工程師在作業時,能更減少時間使用。有專家建議要把控制權交給AI,還是要留意資安及隱私。官網建議可要求AI只回答使用者設定的任務,並加強相關防護機制。
◤貼近更天然的療癒◢
◤飯店住宿券免費抽◢





