chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

亞馬遜云科技Amazon Bedrock模型再更新,Anthropic最新版Claude4模型現(xiàn)已上線

全球TMT ? 來源:全球TMT ? 作者:全球TMT ? 2025-08-06 19:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群


北京2025年8月6日 /美通社/ -- 亞馬遜科技宣布,Anthropic最新一代模型Claude Opus 4.1與Claude Sonnet 4,現(xiàn)已在Amazon Bedrock全面上線。這批新型雙模推理模型支持在即時(shí)響應(yīng)與"深度思考"模式間動態(tài)切換,為編碼、高級推理及多步驟工作流樹立了全新行業(yè)標(biāo)桿,能夠在復(fù)雜且長耗時(shí)的任務(wù)中保持穩(wěn)定性能,驅(qū)動AI Agents將耗時(shí)數(shù)小時(shí)的工作壓縮至分鐘級完成。

將Claude Opus 4.1和Claude Sonnet 4引入Amazon Bedrock,為客戶提供了Anthropic最先進(jìn)模型的選擇,簡化了客戶借助企業(yè)級安全保障和負(fù)責(zé)任的AI管控機(jī)制,構(gòu)建更優(yōu)質(zhì)、更具變革性應(yīng)用程序的流程。

wKgZPGiTP7KARxZVAACO3BrLz7A445.jpg


評估方法說明:
1.使用pass@1指標(biāo),結(jié)合bash、編輯器工具對Opus 4.1、Opus 4和Sonnet 4進(jìn)行測試。在10次試驗(yàn)中取平均值,單次嘗試修補(bǔ),測試時(shí)不進(jìn)行額外計(jì)算,采用核采樣(nucleus sampling)方法,設(shè)置top_p值為0.95。
2.本文報(bào)告的所有分?jǐn)?shù)均基于默認(rèn)Agent框架("Terminus 1"),并在5次試驗(yàn)中取平均值。
3.Claude在MMMLU上的得分,取自14種非英語語言得分的平均值。
4.Opus 4.1、Opus 4和Sonnet 4在AIME上的測試采用核采樣方法,設(shè)置top_p值為0.95。

全新的Claude 4模型從根本上改變了團(tuán)隊(duì)處理復(fù)雜項(xiàng)目的方式。對于那些需要持續(xù)投入精力和深厚專業(yè)知識的大型企業(yè)而言,這一變革尤為顯著。Claude 4雙模推理模型支持客戶在即時(shí)響應(yīng)與深度推演間靈活選擇,這些模型可徹底改變企業(yè)將AI應(yīng)用于復(fù)雜任務(wù)和日常高容量業(yè)務(wù)操作的方式。兩款模型均旨在為跨數(shù)千個(gè)步驟的多步驟工作流,提供更強(qiáng)大、更自主的AI Agents支持。Claude Opus 4.1也是Anthropic迄今為止功能最強(qiáng)的模型,編程能力冠絕業(yè)界。

Claude Opus 4.1如同一位精明能干的協(xié)作伙伴,在Agentic搜索與研究、內(nèi)容創(chuàng)作以及記憶和上下文管理方面表現(xiàn)出色,能夠綜合提煉深刻見解、產(chǎn)出高質(zhì)量內(nèi)容并實(shí)現(xiàn)高效總結(jié)。

Claude Opus 4.1可直接替代Opus 4,它在實(shí)際編碼和Agent任務(wù)中,展現(xiàn)出更出色的性能和精準(zhǔn)度。Anthropic表示,Claude Opus 4.1是其迄今為止最智能的模型,且在編碼和Agent領(lǐng)域處于行業(yè)領(lǐng)先地位。該模型具備先進(jìn)的編碼能力,能夠獨(dú)立規(guī)劃并執(zhí)行復(fù)雜的端到端開發(fā)任務(wù),同時(shí)根據(jù)用戶風(fēng)格進(jìn)行調(diào)整,并始終保持高質(zhì)量輸出。此外,該模型還改進(jìn)了前端代碼生成功能,在有效處理復(fù)雜邏輯的同時(shí),能輸出高質(zhì)量的視覺效果。

另外,Opus 4.1具備出色的長期任務(wù)處理能力和復(fù)雜問題解決能力,是持續(xù)推理和長鏈行動中的理想虛擬協(xié)作伙伴。它還能提升AI Agents的性能,使其能夠以極高的準(zhǔn)確度應(yīng)對復(fù)雜的多步驟任務(wù)。

Claude Sonnet 4則以高效性著稱,將敏捷思維與實(shí)用智能完美融合,適用于各類項(xiàng)目。憑借速度與性能的平衡,Claude Sonnet 4可在各項(xiàng)任務(wù)間無縫切換,秉持務(wù)實(shí)態(tài)度,確保首次執(zhí)行即能圓滿完成。

Claude Sonnet 4在編碼和推理能力上,均超越了其前代產(chǎn)品Claude Sonnet 3.7,并在性能與成本優(yōu)化之間實(shí)現(xiàn)了平衡,非常適合處理大批量應(yīng)用場景,成為大多數(shù)生產(chǎn)應(yīng)用的理想之選。Claude Sonnet 4的應(yīng)用范圍十分廣泛,既能為實(shí)時(shí)客戶支持Agent提供支持,也能處理代碼審查、漏洞修復(fù)等日常開發(fā)任務(wù),還可作為特定任務(wù)的子Agent同時(shí)處理搜索、數(shù)據(jù)分析或內(nèi)容合成等多項(xiàng)任務(wù)。旅游和酒店業(yè)客戶可以借助Claude Sonnet 4實(shí)時(shí)處理客戶請求,并以近乎實(shí)時(shí)的速度提供個(gè)性化回復(fù)。

這兩款模型均具備 "深度思考"功能,使Claude能夠在深度推理和行動執(zhí)行兩種模式間靈活切換。Claude可根據(jù)需要進(jìn)行數(shù)據(jù)分析,并在工作過程中不斷提高準(zhǔn)確性,從而更精準(zhǔn)地預(yù)判并執(zhí)行后續(xù)步驟。

Anthropic公司增長與營收部門負(fù)責(zé)人Kate Jensen表示:"Claude Opus 4和Claude Sonnet 4將AI從一種工具,轉(zhuǎn)變?yōu)槊總€(gè)人、每個(gè)團(tuán)隊(duì)的真正協(xié)作伙伴。我們的客戶將看到項(xiàng)目周期大幅縮短——在許多情況下,能從數(shù)周縮短至數(shù)小時(shí)。Claude 4系列模型在編碼、高級推理及多步驟工作流方面樹立了新標(biāo)桿,同時(shí)能全面理解業(yè)務(wù)背景并輸出精準(zhǔn)結(jié)果。其真正的突破在于,Claude承擔(dān)了大量繁重工作,讓團(tuán)隊(duì)人才得以專注于戰(zhàn)略性工作。"

核心信息

新一代Claude模型標(biāo)志著Agentic AI能力的重大飛躍,徹底改變了企業(yè)將AI應(yīng)用于專業(yè)復(fù)雜任務(wù)和日常高容量運(yùn)營的方式。Claude Opus 4.1和Claude Sonnet 4不再局限于內(nèi)容生成,而是更像專業(yè)的虛擬協(xié)作伙伴,能夠在復(fù)雜任務(wù)中保持專注,留存相關(guān)上下文信息,無需提供持續(xù)指導(dǎo)即可提供完整的解決方案。

這一能力革新了企業(yè)應(yīng)對挑戰(zhàn)的方式,從軟件開發(fā)到營銷策略制定均可適用。對于日常用戶而言,這意味著他們可以使用更懂自身需求的AI,且該AI能獨(dú)立承擔(dān)項(xiàng)目中更大比例的工作。

數(shù)據(jù)解讀:

兩款模型均配備20萬token的上下文窗口,能讓用戶處理和生成大篇幅內(nèi)容(如文檔分析和研究工作),且始終保持內(nèi)容質(zhì)量與連貫性。token是模型可處理的最小文本數(shù)據(jù)單位(例如一個(gè)單詞、短語或單個(gè)字符)。較長的響應(yīng)在豐富的代碼生成和內(nèi)容創(chuàng)作中效果尤為顯著。

據(jù)Anthropic介紹,Claude Opus 4.1在SWE-bench基準(zhǔn)測試中,將其頂尖的編碼性能提升至74.5%,實(shí)現(xiàn)了穩(wěn)定且顯著的進(jìn)步,助力開發(fā)人員及其應(yīng)用始終保持領(lǐng)先地位。與前代產(chǎn)品相比,Claude Opus 4.1能夠更專注更精準(zhǔn)地瀏覽大型代碼庫,并擅長處理長時(shí)間運(yùn)行的任務(wù),對編碼Agent的規(guī)劃和協(xié)調(diào)能力也有所提升。除編碼外,Opus 4.1還增強(qiáng)了Claude的深度研究和數(shù)據(jù)分析能力,尤其是在細(xì)節(jié)追蹤和Agent搜索方面。

兩款模型能夠在提供快速直接答案與逐步推理解答之間靈活切換,在關(guān)鍵行業(yè)基準(zhǔn)測試中,大幅提升了多步驟工作流程的性能表現(xiàn)。

據(jù)Anthropic公司稱,Claude Opus 4.1和Claude Sonnet 4預(yù)示著未來AI系統(tǒng),將在創(chuàng)意工作和知識型工作中成為能力日益強(qiáng)大的合作伙伴。例如,它們可在企業(yè)中承擔(dān)更多專業(yè)角色,如處理日常分析工作、跨部門協(xié)作,甚至在極少監(jiān)督的情況下管理完整的工作流程。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    36975

    瀏覽量

    289794
  • 亞馬遜
    +關(guān)注

    關(guān)注

    8

    文章

    2710

    瀏覽量

    85282
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    IT崗位天塌了!Claude 4震撼發(fā)布:AI編程大模型再進(jìn)化

    電子發(fā)燒友網(wǎng)報(bào)道(文 / 吳子鵬)5 月 23 日凌晨,著名大模型平臺 Anthropic 召開首屆開發(fā)者大會,重磅發(fā)布最新大模型 ——Claude
    的頭像 發(fā)表于 05-26 07:52 ?5435次閱讀
    IT崗位天塌了!<b class='flag-5'>Claude</b> <b class='flag-5'>4</b>震撼發(fā)布:AI編程大<b class='flag-5'>模型</b>再進(jìn)化

    亞馬遜科技Amazon Bedrock AgentCore正式可用,引領(lǐng)Agent走向全面落地

    Amazon Bedrock AgentCore打破原型困境,助力Agent安全、可擴(kuò)展、高可靠地投入生產(chǎn) ? 北京——2025年10月14日 ?亞馬遜科技宣布,
    的頭像 發(fā)表于 10-14 17:06 ?363次閱讀
    <b class='flag-5'>亞馬遜</b><b class='flag-5'>云</b>科技<b class='flag-5'>Amazon</b> <b class='flag-5'>Bedrock</b> AgentCore正式可用,引領(lǐng)Agent走向全面落地

    亞馬遜科技宣布推出Qwen3與DeepSeek-V3.1模型的完全托管服務(wù)

    亞馬遜科技致力于成為運(yùn)行開放權(quán)重模型的最佳平臺,在Amazon Bedrock上新增五個(gè)模型
    的頭像 發(fā)表于 09-19 10:11 ?375次閱讀

    亞馬遜科技現(xiàn)已上線OpenAI開放權(quán)重模型

    客戶現(xiàn)可通過Amazon BedrockAmazon SageMaker AI使用OpenAI開放權(quán)重模型,實(shí)現(xiàn)將先進(jìn)的開放權(quán)重模型與全球
    的頭像 發(fā)表于 08-06 19:29 ?584次閱讀

    亞馬遜功能最強(qiáng)模型Amazon Nova Premier現(xiàn)已正式可用

    是目前亞馬遜功能最強(qiáng)大的模型,適用于處理復(fù)雜任務(wù),并可作為教師模型來蒸餾定制模型。 作為現(xiàn)有Amazon Nova理解
    的頭像 發(fā)表于 05-09 18:18 ?345次閱讀
    <b class='flag-5'>亞馬遜</b>功能最強(qiáng)<b class='flag-5'>模型</b><b class='flag-5'>Amazon</b> Nova Premier<b class='flag-5'>現(xiàn)已</b>正式可用

    科技獲亞馬遜科技生成式AI能力認(rèn)證

    近日,管理服務(wù)提供商聚科技成功獲得亞馬遜科技生成式AI能力認(rèn)證。此次認(rèn)證標(biāo)志著聚科技在利用亞馬遜
    的頭像 發(fā)表于 02-19 10:33 ?701次閱讀

    科技榮獲亞馬遜科技生成式AI能力認(rèn)證

    Bedrock等技術(shù),從應(yīng)用范圍、模型選擇、數(shù)據(jù)處理、模型調(diào)優(yōu)到應(yīng)用集成與部署等方面,助力企業(yè)加速生成式AI應(yīng)用落地。此外,聚科技還基于亞馬遜
    的頭像 發(fā)表于 02-14 16:07 ?587次閱讀

    亞馬遜科技發(fā)布Amazon Trainium2實(shí)例

    近期,亞馬遜科技宣布了一項(xiàng)重要更新:基于Amazon Trainium2的全新Amazon Elastic Compute Cloud(
    的頭像 發(fā)表于 12-27 14:57 ?788次閱讀

    亞馬遜科技發(fā)布Amazon Bedrock新功能

    近日,亞馬遜科技宣布了一項(xiàng)重要更新——為其完全托管的Amazon Bedrock服務(wù)增添了多項(xiàng)創(chuàng)新功能。
    的頭像 發(fā)表于 12-25 15:52 ?644次閱讀

    Amazon Bedrock全新升級,引領(lǐng)生成式AI應(yīng)用新紀(jì)元

    近日,亞馬遜科技宣布了對Amazon Bedrock的重大升級,推出了三項(xiàng)創(chuàng)新功能,進(jìn)一步鞏固了其在生成式人工智能領(lǐng)域的領(lǐng)先地位。 Amazon
    的頭像 發(fā)表于 12-24 11:43 ?798次閱讀

    Luma AI全新視頻模型Ray 2即將面向消費(fèi)者、專業(yè)人士和開發(fā)者開放

    通過與亞馬遜科技展開戰(zhàn)略合作,全新Ray 2視頻模型將在Amazon Bedrock上可用 北京2024年12月17日??/美通社/ --
    的頭像 發(fā)表于 12-18 09:49 ?950次閱讀

    Amazon Bedrock全新升級,新增業(yè)界領(lǐng)先的AI防護(hù)、新智能體功能和模型定制能力

    通社/ -- 亞馬遜科技在2024 re:Invent全球大會上,宣布推出Amazon Bedrock的三項(xiàng)新功能。Amazon
    的頭像 發(fā)表于 12-12 15:56 ?675次閱讀

    Amazon Bedrock推出多個(gè)新模型和全新強(qiáng)大的推理和數(shù)據(jù)處理功能

    :Invent全球大會上,宣布推出Amazon Bedrock的多項(xiàng)創(chuàng)新功能。Amazon Bedrock亞馬遜
    的頭像 發(fā)表于 12-07 19:31 ?1315次閱讀
    <b class='flag-5'>Amazon</b> <b class='flag-5'>Bedrock</b>推出多個(gè)新<b class='flag-5'>模型</b>和全新強(qiáng)大的推理和數(shù)據(jù)處理功能

    亞馬遜科技宣布Amazon Trainium2實(shí)例正式可用

    30-40% 全新?Amazon EC2 Trn2 UltraServers采用NeuronLink超速互連技術(shù),將四個(gè)Trn2服務(wù)器連接成一個(gè)大型服務(wù)器,能夠在亞馬遜科技上為超大規(guī)模模型
    的頭像 發(fā)表于 12-06 09:15 ?758次閱讀
    <b class='flag-5'>亞馬遜</b><b class='flag-5'>云</b>科技宣布<b class='flag-5'>Amazon</b> Trainium2實(shí)例正式可用

    亞馬遜追加40億美元投資,深化與Anthropic戰(zhàn)略合作

    近日,亞馬遜宣布與人工智能公司Anthropic進(jìn)一步深化戰(zhàn)略合作,以推動雙方在人工智能領(lǐng)域的共同發(fā)展。 作為合作的重要一環(huán),Anthropic選擇了亞馬遜
    的頭像 發(fā)表于 11-26 11:13 ?795次閱讀