電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)2025年8月8日凌晨1點(diǎn),OpenAI以一場長達(dá)1小時(shí)的線上發(fā)布會正式推出GPT-5。這場被業(yè)界稱為“AI進(jìn)化分水嶺”的發(fā)布,終結(jié)了長達(dá)兩年的技術(shù)猜測,更以多維度性能躍升重新定義了人工智能的能力邊界。OpenAI首席執(zhí)行官山姆·奧特曼在發(fā)布會上直言:“這不僅是模型的升級,更是通往通用人工智能(AGI)的關(guān)鍵里程碑?!?br />
GPT-5:集成模型,能力躍升
GPT-5是一款集成模型(integrated model),它巧妙地融合了大語言模型GPT系列和推理模型o系列。這一創(chuàng)新設(shè)計(jì)意義重大,用戶在使用時(shí)無需再手動切換各類不同模型,極大地提升了使用的便捷性和效率。例如,奧特曼在其個(gè)人社交平臺上連發(fā)十余條推文介紹GPT-5,首條就著重強(qiáng)調(diào)“GPT-5是一個(gè)集成模型,這意味著不再需要模型切換器,它將自行決定何時(shí)需要更深入地思考”。
GPT-5首次采用了內(nèi)嵌式三位一體集成架構(gòu),系統(tǒng)由三部分組成。GPT-5-main模型負(fù)責(zé)處理常規(guī)問題,GPT-5-thinking深度思考模型用于解決復(fù)雜任務(wù),實(shí)時(shí)決策的路由機(jī)制則根據(jù)對話類型、復(fù)雜程度、工具需求以及用戶的明確意圖,快速決定使用哪個(gè)模型,自主決定是否進(jìn)入深度思考模式,自動匹配最適合的模型。此外,還有一個(gè)額度使用完后啟動的mini版本。這種架構(gòu)設(shè)計(jì)使得GPT-5能夠更加智能、高效地應(yīng)對各種任務(wù)。
OpenAI公開的測試數(shù)據(jù)顯示,GPT-5在多個(gè)關(guān)鍵領(lǐng)域展現(xiàn)出了頂尖性能。在數(shù)學(xué)領(lǐng)域,GPT-5在2025年AIME測試中無工具輔助達(dá)到94.6%,大幅超過了o3模型;在編程領(lǐng)域,在SWE-bench Verified(一項(xiàng)基于GitHub真實(shí)編程任務(wù)的測試)中,GPT-5首次嘗試的得分達(dá)到74.9%,略優(yōu)于Anthropic最新的Claude Opus 4.1模型(得分74.5%)和谷歌DeepMind的Gemini 2.5 Pro模型(得分59.6%),展現(xiàn)出前沿水平;在視覺感知和健康領(lǐng)域,GPT-5的表現(xiàn)同樣出色,大幅超越包括GPT-4o、o1、o3和o4-mini在內(nèi)的所有前代模型。在大模型競技場LMArena上,剛剛上線的GPT-5憑借著極強(qiáng)的性能在所有細(xì)分類目中都位列第一。
“AI幻覺”一直是所有大模型難以克服的痛點(diǎn),而GPT-5在減少AI幻覺方面展現(xiàn)出了行業(yè)領(lǐng)先的水平。與GPT-4o相比,GPT-5的事實(shí)錯(cuò)誤率降低了45%;在深度思考模式下,事實(shí)錯(cuò)誤率更是比o3大幅下降80%,變得更加準(zhǔn)確可靠。在開放性事實(shí)準(zhǔn)確性基準(zhǔn)LongFact和FActScore測試中,GPT-5的幻覺率比o3減少大約六倍,長篇內(nèi)容生成的準(zhǔn)確性顯著提升。這使得GPT-5在提供信息時(shí)更加值得信賴,為用戶提供了更可靠的交互體驗(yàn)。
能耗方面,GPT-5通過混合專家模型(MoE)架構(gòu),在保持性能的同時(shí)大幅降低計(jì)算資源消耗。實(shí)測數(shù)據(jù)顯示,其輸出token數(shù)量較前代減少50%-80%,這意味著在相同硬件條件下,GPT-5可支持更多并發(fā)用戶或更復(fù)雜的任務(wù)。
GPT-5:應(yīng)用多元,前景廣闊
在應(yīng)用場景方面,GPT-5展現(xiàn)出了強(qiáng)大的實(shí)力和廣泛的適用性?,F(xiàn)場展示的多個(gè)案例令人印象深刻,例如GPT-5編碼能力突出,只需幾句話就可以創(chuàng)建一個(gè)名為"Jumping Ball Runner”的游戲。該游戲界面色彩豐富,游戲角色采用卡通風(fēng)格設(shè)計(jì),且具備最高分記錄功能、重試按鈕、趣味音效等多種特色功能。此外,GPT-5還可以在幾分鐘內(nèi)開發(fā)一個(gè)學(xué)習(xí)法語的網(wǎng)絡(luò)應(yīng)用、一個(gè)復(fù)雜的財(cái)務(wù)分析模版等等。
對于創(chuàng)意工作者來說,GPT-5也是一大助力。一位用喜劇傳遞科普內(nèi)容的博主,利用GPT-5寫劇本、寫段子、測試角色邏輯和情緒動機(jī)、出分鏡,甚至用語音和GPT-5“對戲”。在正經(jīng)的科研場景中,GPT-5同樣表現(xiàn)出色,免疫學(xué)教授用GPT-5解讀實(shí)驗(yàn)數(shù)據(jù),模型不僅能解釋結(jié)果,還會預(yù)測未來實(shí)驗(yàn)趨勢,并主動提出下一步實(shí)驗(yàn)方案,大大壓縮了科研迭代周期。
在醫(yī)療健康領(lǐng)域,GPT-5也發(fā)揮著積極作用。一位名為Carolina的用戶在短短一周內(nèi)被診斷出三種不同形式的癌癥,但她一直在排隊(duì)等候報(bào)告解讀,于是她將醫(yī)院報(bào)告截圖上傳給GPT-5,模型迅速將復(fù)雜的醫(yī)學(xué)術(shù)語轉(zhuǎn)化為易于理解的語言。在后續(xù)治療過程中,GPT-5不僅持續(xù)幫助她解讀術(shù)語,還協(xié)助她評估治療選項(xiàng)、準(zhǔn)備就診問題,甚至在是否接受放射治療的決策上給予Carolina情感支持。盡管OpenAI并不把GPT-5定位為醫(yī)療設(shè)備,但它可以成為“健康素養(yǎng)支持工具”,讓患者在慌亂和未知里,不再完全仰賴醫(yī)生,而是成為有準(zhǔn)備、有信息支持、能了解身體情況的患者。
GPT-5擁有GPT-5、GPT-5-mini、GPT-5-nano和GPT-5-pro四個(gè)版本,以滿足不同用戶的需求。免費(fèi)用戶的GPT-5用量有限,超過限額后將自動轉(zhuǎn)至GPT-5-mini,GPT-5-pro僅供Pro訂閱用戶使用。在定價(jià)方面,GPT-5、GPT-5-mini、GPT-5-nano三款模型可面向開發(fā)者提供API服務(wù),三款模型的輸入、輸出價(jià)格分別為每百萬token 1.25美元/10美元、每百萬token 0.5美元/5美元、每百萬token 0.15美元/1.5美元。與主要競爭對手Anthropic和谷歌相比,OpenAI的GPT-5模型對于開發(fā)人員來說成本相當(dāng)甚至更低,這無疑將吸引更多的開發(fā)者使用GPT-5進(jìn)行創(chuàng)新和應(yīng)用開發(fā)。
GPT-5的發(fā)布也引起了眾多合作伙伴的關(guān)注和積極響應(yīng)。微軟首席執(zhí)行官薩蒂亞·納德拉在8月6日的X帖子中表達(dá)了對GPT-5的贊嘆,他提到從首次在必應(yīng)中向世界展示GPT-4以來,僅僅過去了兩年半的時(shí)間,就已經(jīng)取得了如此巨大的進(jìn)步。新模型將于8月6日登陸微軟產(chǎn)品,微軟365 Copilot將獲得GPT-5,以及面向消費(fèi)者的Copilot和Azure AI Foundry,開發(fā)人員可以使用它們將人工智能模型整合到第三方應(yīng)用程序中。幫助企業(yè)管理計(jì)算機(jī)文件的Box公司最近幾周一直在各種數(shù)據(jù)集中測試GPT-5,Box公司首席執(zhí)行官艾倫·列維表示,之前的人工智能模型在該公司許多最先進(jìn)的測試中都失敗了,因?yàn)樗鼈冸y以理解長文檔中的復(fù)雜數(shù)學(xué)或邏輯,但GPT-5是一個(gè)“徹底的突破”,該模型能夠保留更多它正在查看的信息,然后使用更高水平的推理和邏輯能力來做出決策。
總結(jié)
GPT-5的發(fā)布是OpenAI在人工智能領(lǐng)域的一次重大突破。它以集成模型的創(chuàng)新設(shè)計(jì)、在多個(gè)領(lǐng)域的能力提升、顯著降低的幻覺率等亮點(diǎn),為用戶帶來了更智能、更準(zhǔn)確、更便捷的交互體驗(yàn)。其廣泛的應(yīng)用場景、多樣的版本選擇和合理的定價(jià)策略,以及與眾多合作伙伴的積極合作,都為GPT-5的未來發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)。我們有理由相信,GPT-5將推動人工智能技術(shù)向更高水平發(fā)展,為人們的生活和工作帶來更多的改變和驚喜,成為數(shù)字世界的重要基礎(chǔ)設(shè)施,就像曾經(jīng)的Office 365、Google和百度等產(chǎn)品一樣,深刻地融入我們的生活。
發(fā)布評論請先 登錄
Altera Agilex 3/5 FPGA和SoC的功能特性

微軟企業(yè)級應(yīng)用AI能力全面升級
OpenAI或在周五凌晨發(fā)布GPT-5 OpenAI以低價(jià)向美國政府提供ChatGPT

全新STM32MP257開發(fā)板震撼發(fā)布!異核架構(gòu)x接口豐富x邊緣AI,助力ARM嵌入式工業(yè)4.0應(yīng)用!
OpenAI即將發(fā)布GPT-4.5與GPT-5
OpenAI即將推出GPT-5模型
OpenAI CEO預(yù)告GPT-4.5及GPT-5未來規(guī)劃
GPT-5研發(fā)進(jìn)度滯后,成果與成本不匹配
OpenAI GPT-5開發(fā)滯后:訓(xùn)練成本高昂
Meta重磅發(fā)布Llama 3.3 70B:開源AI模型的新里程碑

評論