chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大模型,站在“向下競底”和“向上定價”的分岔路口

腦極體 ? 來源: 腦極體 ? 作者: 腦極體 ? 2024-05-21 17:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2024年以來,大模型的價格出現(xiàn)了顯著的下降趨勢,并且是全球性的。

海外AI巨頭,OpenAI和谷歌都在五月的新品發(fā)布會上,下調(diào)了模型調(diào)用價格。

OpenAI的GPT-4o支持免費試用,調(diào)用API的價格也比GPT-4-turbo降低了一半,為5 美元/百萬tokens。谷歌的當(dāng)家王牌Gemini大模型系列,Gemini 1.5 Flash 的價格為0.35美元/百萬tokens,比GPT-4o 便宜得多。

wKgaomZMY7iAD5qNAABN7OFT82M279.jpg

同樣的“價格戰(zhàn)”,也在國內(nèi)開打。

5月13日智譜AI上線了新的價格體系,入門級產(chǎn)品GLM-3 Turbo模型,調(diào)用價格從5 元/百萬tokens,降至1元/百萬tokens。緊隨其后的字節(jié)跳動,正式發(fā)布豆包大模型家族,其中的豆包通用模型Pro 32k模型,定價為0.0008元/千tokens。

當(dāng)一串代表價格的數(shù)字,成為各家發(fā)布會上最顯眼的一頁、最廣為傳播的信息,其他廠商為了不失去曝光度,不流失現(xiàn)有用戶,當(dāng)然也要有所表示,被動跟進,加入“價格戰(zhàn)”。

就在今天,5月21日,阿里云也拋出重磅炸彈,宣布通義千問主力模型Qwen-Long,API輸入價格降至0.0005元/千tokens。

大模型價格正在競底,但究其本質(zhì),向下競底是不具備“向上定價”的條件。將“降價”而非“賣貴”作為核心競爭力的大模型,是走不長遠的。

降價的本質(zhì),是無法“向上定價”

大模型百萬tokens價格一再跳水,OpenAI說是為了“造福世界”,谷歌說是為了擴大AI用戶,國產(chǎn)大模型廠商也紛紛表示要讓利個人和企業(yè)開發(fā)者。

那為什么ChatGPT、Gemini剛問世的時候,就敢于強勢向開發(fā)者收錢呢?那時怎么不踐行“造福世界”的初心呢?

我們越過那些官方的宣傳辭藻,來看幾組行業(yè)數(shù)據(jù),就會發(fā)現(xiàn):降價是一種必然。

第一,模型能力正在趨同,OpenAI/谷歌也沒有護城河。

數(shù)據(jù)顯示,自GPT-4發(fā)布以來,多個模型在GPT-4水平性能上的巨大收斂,然而并沒有明顯領(lǐng)先的模型。

就是大家都在向GPT-4看齊,但誰都沒有突出優(yōu)勢。能力趨同的前提下,不得不放棄收費,靠降價/免費來爭奪用戶,保住地盤。

wKgZomZMY7iAb5cvAACWY1Bq360468.jpg

第二,大模型的邊際收益正在持續(xù)走低。

Gary Marcus 博士在“Evidence that LLMs are reaching a point of diminishing returns — and what that might mean”《LLMs正達到收益遞減的證據(jù)——及其可能意味著什么》一文中提到,從GPT-2到GPT-4甚至GPT-4 Turbo的性能變化,已經(jīng)出現(xiàn)了性能遞減的跡象。

在收益遞減的背景下,意味著處理相同的任務(wù),開發(fā)者的實際成本是在上升的。在AI創(chuàng)新商業(yè)化前景還不明朗的市場環(huán)境下,為了保住現(xiàn)有用戶,大模型廠商必須給出有吸引力的對策。包括提供更小的模型,比如谷歌推出的Gemini 1.5 Flash,通過“蒸餾”實現(xiàn)了與Gemini 1.5 Pro性能接近、成本更低。另一個手段就是直接降價。

綜上,大模型降價的本質(zhì),是因同質(zhì)化競爭+投入產(chǎn)出比降低,而無法賣貴、不敢賣貴的必然選擇。

向下競底的前途,是沒有前途

論跡不論心,只要大模型廠商的降價行動,能夠切實惠及企業(yè)和開發(fā)者,當(dāng)然是受市場歡迎的。

問題就在這里,企業(yè)和開發(fā)者能從中獲得多大收益呢?

有人說,降低成本能推動大模型的“價值創(chuàng)造”,是錯誤的因果歸因。大模型的“價值創(chuàng)造”,是以大模型本身為錨點,而非價格。

最直接的例子,ChatGPT問世即付費,當(dāng)時很多從業(yè)者都很開心,認為市場終于重返工程師主導(dǎo)的文化,技術(shù)為王,代碼競爭,“沒有那些精心設(shè)計的流量游戲或者運營技巧,沒人會動砍一刀送1000個token的心思”。說明明碼標價、為好東西付費的模式,才是開發(fā)者心中的良性商業(yè)模式。

差的商業(yè)模式是什么?是模型能力不行,企業(yè)和個人開發(fā)者投入了大量時間、精力,結(jié)果無法建立競爭力,無法從應(yīng)用創(chuàng)新中獲得商業(yè)回報。

有一個SaaS開發(fā)者直言:“我們折騰了一年(做基于LLM的產(chǎn)品),也有不少用戶提出了付費需求,但我們感覺做不到SLA,全部婉拒了。”所謂SLA,是指一定開銷下,服務(wù)商與用戶之間的一種協(xié)定,來保障服務(wù)的性能和可靠性。

開發(fā)者和ISV服務(wù)商,如果被低價吸引,但底座模型的能力卻不行,不能解決用戶的問題,賺不到錢,還投入了大量研發(fā)資金和工程團隊,那最后實際的沉沒成本,可比調(diào)用省下的仨瓜倆棗大多了。

正如微軟所強調(diào)的那樣,大模型“仍將是解決眾多復(fù)雜任務(wù)的黃金標準”。所以,良性的商業(yè)模式,是大模型能力持續(xù)提升,商業(yè)化版本上同時兼顧普惠。

以下圖來說,逐步進入到低價高質(zhì)的綠色區(qū)域,也是“最具吸引力象限”。

wKgZomZMY7mAdwgGAABP_9NdIFo423.jpg

從圖中不難看到,GPT-4o是目前質(zhì)量最高、價格相對降低的位置。

而放眼國內(nèi)的廠商,模型能力如果達不到OpenAI的水平,一味拼價格并不是一個好策略。

可以推演一下,打價格戰(zhàn),會發(fā)生三種情況:

最樂觀、最好的結(jié)果,是大模型廠商靠低價吸引用戶,用戶數(shù)量和使用量的規(guī)?;黾樱軌虻托踔脸^降價的虧損,實現(xiàn)盈利。而即使是最好的情況,大模型企業(yè)也會在短期內(nèi),利潤受到擠壓,財務(wù)表現(xiàn)可能會受到來自資本市場或投資人的壓力。

至少目前來看,可能性很小。降價或許能夠吸引不少用戶嘗鮮、試用,但最終模型能力才是沉淀下來的主因,留存率并不一定理想。

用戶增長不確定,大模型投資成本卻在節(jié)節(jié)攀升,意味著大模型廠商的風(fēng)險敞口不斷擴大,由此帶來打價格戰(zhàn)的一種最壞情況:國內(nèi)大模型廠商被迫跟進價格戰(zhàn),不斷壓縮本就不大的盈利空間。

Anthropic的CEO曾向媒體透露,目前正在訓(xùn)練的模型成本已接近10億美元,到2025年和2026年,將飆升至50億或100億美元。

這意味著,一旦大模型企業(yè)為了“價格戰(zhàn)”,現(xiàn)金流會持續(xù)承壓,缺乏充足的資金投入到招募AI人才、升級基礎(chǔ)設(shè)施、部署數(shù)據(jù)中心、升級網(wǎng)絡(luò)等投資中去,模型進化與迭代也會受到影響,從而讓國產(chǎn)基座模型進入發(fā)展瓶頸期,與世界一流水平的差距越拉越大。

需要注意的是,社會各界用戶早已在各個模型廠商的宣傳布道中,拔高了對大模型的期望值。一味推廣低質(zhì)低價的使用體驗,讓人們對AI失去信心,覺得大模型不夠萬能、啥都干不好,對這一輪大模型主導(dǎo)的AI熱潮,將是極大的負面影響。

當(dāng)然,也不必過于焦慮。最壞情況和最好情況一樣,發(fā)生的概率不大。現(xiàn)實中最有可能的,是大模型行業(yè)在最佳和最壞情況之間震蕩。

一部分模型性能領(lǐng)先、商業(yè)模式向好、客情關(guān)系良好、現(xiàn)金流相對充裕的廠商,能夠在跟進降價的同時,保持對底層創(chuàng)新的持續(xù)投資,但長期可以攤薄研發(fā)成本,靠規(guī)模增長來實現(xiàn)收入上漲。而注定也有一部分企業(yè)會在價格戰(zhàn)與現(xiàn)金流壓力下,被震蕩出局。

一個AI公司創(chuàng)始人就表示:其實挺期待AGI到來的,雖然能秒滅我們這種小團隊,但至少大家都解脫了。

說到底,一味打價格戰(zhàn),AI巨頭有沒有前途,不一定,但創(chuàng)新型小公司,一定危險。

降價的前提,是有“向上定價”的實力

有必要疊個甲,我們不反對大模型降價,鼓勵大模型廠商為個人和企業(yè)開發(fā)者減輕負擔(dān)。

只不過,當(dāng)輿論各方都關(guān)注“低價”的時候,當(dāng)一場大模型發(fā)布會的亮點是百萬token價格小數(shù)點后有幾位,當(dāng)大模型的商業(yè)模式從技術(shù)為王,變成“羊毛出在豬身上”、把用戶當(dāng)成流量商品……有必要再重申一下:新技術(shù),是大模型產(chǎn)業(yè)的“震中”。

高科技領(lǐng)域,新技術(shù)層出不窮。企業(yè)要在一波又一波技術(shù)浪潮中,同時扮演“顛覆者”和“防御者”。拿大模型來說,廠商必須有至少兩個梯隊來參與競爭。

一個梯隊負責(zé)進攻,孵化全新的模型和產(chǎn)品,追逐技術(shù)上的顛覆式創(chuàng)新;另一個梯隊負責(zé)防御,通過低價、生態(tài)等守住現(xiàn)有業(yè)務(wù)和用戶,抵御對手的襲擊。

而當(dāng)前,大模型廠商的更優(yōu)先事務(wù),不是“向下降價”,而是塑造“向上定價”的可能性。

將自家大模型矩陣中的某一些特定模型,做一個極致低價,是很容易操作和吸引眼球的。能把大模型賣出去,向上定價,向價格段的上游遷移,才是AI實力的體現(xiàn),才能讓企業(yè)保有更長的生命力。

舉個例子,GPT-4o雖然免費,但免費版本只提供有限的次數(shù),而天花板級別的語音交互能力又帶來了極強的付費潛力。此外,GPT-5也早就被曝已經(jīng)做出來了,只是OpenAI沒決定好何時推向市場。谷歌也采用類似的策略,更低價格、更低成本的模型,與高性能的付費模型,以及龐大的軟硬件生態(tài)來讓AI落地,共同構(gòu)成商業(yè)版圖。

當(dāng)前國產(chǎn)大模型亟待完成的,是能力突破的技術(shù)進擊。

從我們了解的大模型使用情況來看,企業(yè)和個人開發(fā)者最在意的商業(yè)化問題,仍然要靠模型本身的進化來解決,比如說:

目前階段,很多任務(wù)場景,大模型連兜底的效果都還沒有搞定,距離SLA級別的收費標準差距很大,無法達到商用;

精調(diào)雖然可以滿足一部分場景,但難以泛化。有些場景的大模型精調(diào)效果,還不如用傳統(tǒng)的小模型。這不是大模型“夠不夠便宜”的問題,是“為什么要用”的問題;

最終用戶愿意付費的AI應(yīng)用,必須真正做到降本增效,學(xué)習(xí)成本高一點都不會用。這就需要服務(wù)商和開發(fā)者詳細地拆解任務(wù)流程,不忽視任何微小的業(yè)務(wù)細節(jié),量身定制,降低整個開發(fā)過程的周期和難度,或許比降價更有吸引力。

其實,大模型質(zhì)價比的“最具吸引力象限”,已經(jīng)說明了,質(zhì)量做高的前提下,實現(xiàn)價格更優(yōu),才是大模型商業(yè)化的可持續(xù)之路。

向下競底只是權(quán)宜之計,能夠“向上定價”的大模型才有未來。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Gemini
    +關(guān)注

    關(guān)注

    0

    文章

    68

    瀏覽量

    7924
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    280067
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1210

    瀏覽量

    8931
  • ChatGPT
    +關(guān)注

    關(guān)注

    29

    文章

    1590

    瀏覽量

    9112
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3146

    瀏覽量

    4076
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    LG UltraGear系列職業(yè)電顯示器新品發(fā)布

    2025年初,LG電子隆重推出兩款UltraGear系列電顯示器新品——GX7炫系列27GX790A和G8極系列27G850A,再次刷新顯示器性能標準,重新定義高端電顯示器的技
    的頭像 發(fā)表于 02-25 10:28 ?755次閱讀

    DLP500YX如何使得入射光和出射光在同一水平面,為什么旋轉(zhuǎn)了45度后垂直入射,反射光卻是斜向上或者向下出射?

    DLP500YX如何使得入射光和出射光在同一水平面,為什么旋轉(zhuǎn)了45度后垂直入射,反射光卻是斜向上或者向下出射?
    發(fā)表于 02-21 14:31

    人工智能的下一站在哪里

    DeepSeek的爆發(fā)進一步推動了AI行業(yè)的發(fā)展速度,這讓人們不得不想象AI的下一站在哪里?維智科技所深耕的時空大模型與AI發(fā)展的邏輯軌跡又是如何聯(lián)系的?
    的頭像 發(fā)表于 02-14 10:27 ?448次閱讀

    達爾優(yōu)A75HE電磁軸鍵盤震撼發(fā)布:引領(lǐng)電新潮流

    近日,達爾優(yōu)與歐希德強強聯(lián)手,推出了其最新的電磁軸鍵盤——A75HE。這款鍵盤憑借其卓越的性能和獨特的設(shè)計,迅速在電愛好者中引起了廣泛關(guān)注。
    的頭像 發(fā)表于 12-17 17:36 ?639次閱讀

    TLV2553檢測電壓整體向上偏移的原因?

    采用TLV2553測量電壓值,當(dāng)采集電壓大于2V時,整體向上偏移比較大。 后來更換REF+和REF-之間的電容,當(dāng)電容C1設(shè)置為100nF時,采集到的電壓值整體向上(比實際值偏大)偏移;當(dāng)更換電容
    發(fā)表于 12-11 06:57

    本源產(chǎn)品丨量子期權(quán)定價真機應(yīng)用

    讓量子計算機走出實驗室造中國自主可控量子計算機金融領(lǐng)域中的期權(quán)定價過程,是根據(jù)影響期權(quán)價格的因素,通過適當(dāng)?shù)臄?shù)學(xué)模型,去分析模擬期權(quán)價格的市場變動情況,最后獲得合理理論價格的過程。隨著期權(quán)復(fù)雜度
    的頭像 發(fā)表于 11-08 01:05 ?458次閱讀
    本源產(chǎn)品丨量子期權(quán)<b class='flag-5'>定價</b>真機應(yīng)用

    AIC3106的噪如何消除?

    噪; 4、對AIC3106的內(nèi)部相關(guān)寄存器進行重新配置,最終得到如附件中的音頻文件,戴耳機,把電腦音量調(diào)到最大,也會有底噪。 請問有沒有其它好的辦法把此類噪濾除?
    發(fā)表于 11-04 08:03

    TPA3100D2的噪問題怎么解決?

    3100D2的噪問題怎么解決?謝謝
    發(fā)表于 10-31 06:58

    TAS5805M躁過大怎么解決?

    輸出是LC filter: 10uH, 0.68uF 目前量測躁過大, 是否有甚么建議? 謝謝~
    發(fā)表于 10-15 06:24

    基于模型設(shè)計如何加速科技創(chuàng)新

    在科技飛速發(fā)展的今天,工程師和科學(xué)家們不斷面臨新的挑戰(zhàn)和機遇。MathWorks 作為全球領(lǐng)先的數(shù)學(xué)計算和仿真平臺,始終站在技術(shù)創(chuàng)新的前沿,推動各行各業(yè)的技術(shù)進步。從能源、汽車、醫(yī)療到通信,MathWorks 的基于模型設(shè)計(MBD)方法論正在改變著傳統(tǒng)的工程設(shè)計和開發(fā)流
    的頭像 發(fā)表于 10-14 10:48 ?632次閱讀
    基于<b class='flag-5'>模型</b>設(shè)計如何加速科技創(chuàng)新

    tlv320aic3106噪過大要如何解決?

    你們好,目前我使用3106,發(fā)現(xiàn)噪過大,驗證場景如下: (1)MIC3L/MIC3R輸入線性音頻,直接綁定HPLCOM/HPRCOM,發(fā)現(xiàn)有明顯的噪, (2)斷開MIC3L/MIC3R的音源
    發(fā)表于 10-12 08:23

    淺談基于負荷時空均衡和彈性響應(yīng)的電動汽車快充電價定價策略

    摘要:為了引導(dǎo)電動汽車有序充電,提出了一種考慮負荷時空均衡和彈性響應(yīng)的電動汽車快充電價定價策略。引入交通流理論描述交通路網(wǎng),建立電動汽車快充負荷時空分布模型;考慮配電網(wǎng)調(diào)度和電動汽車快充負荷的彈性
    的頭像 發(fā)表于 09-13 16:02 ?761次閱讀
    淺談基于負荷時空均衡和彈性響應(yīng)的電動汽車快充電價<b class='flag-5'>定價</b>策略

    RUCKUS助您實現(xiàn)卓越電體驗

    在充滿活力、快節(jié)奏的電世界中,強大、可靠且高性能網(wǎng)絡(luò)是至關(guān)重要的。隨著電行業(yè)以前所未有的速度持續(xù)發(fā)展,對能夠滿足日益增長的帶寬和低延遲連接的先進網(wǎng)絡(luò)解決方案的需求也在水漲船高。而這正是領(lǐng)先的目標驅(qū)動型網(wǎng)絡(luò)供應(yīng)商RUCKUS可以發(fā)揮作用的領(lǐng)域。
    的頭像 發(fā)表于 08-16 15:59 ?884次閱讀

    技嘉科技最新OLED電顯示器榮獲紅點設(shè)計大獎

    技嘉科技近日傳來喜訊,其最新推出的兩款OLED電顯示器——AORUS FO32U2P與GIGABYTE MO34WQC2,在設(shè)計領(lǐng)域大放異彩,雙雙榮獲享有盛譽的紅點設(shè)計大獎,彰顯了技嘉在電顯示技術(shù)與設(shè)計美學(xué)上的卓越融合。
    的頭像 發(fā)表于 08-14 14:48 ?847次閱讀

    PGA280噪很大是為什么?

    我用PGA280+AD7765進行信號采集。 發(fā)現(xiàn)只有AD7765輸入端短接,噪很低。但是PGA280+AD7765一起測試,輸入端短接的時候噪很高,請問是為什么啊。 下面是原理圖。
    發(fā)表于 08-09 07:27