chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

何必把DeepSeek推上神壇?

腦極體 ? 來(lái)源:腦極體 ? 作者:腦極體 ? 2025-02-10 19:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

wKgZPGep6NWASWffAAmo07fSF90130.jpg

過(guò)年期間沉迷休息,心懷愧疚地?zé)o視了讀者催我們寫(xiě)DeepSeek的要求。后來(lái)我發(fā)現(xiàn),這催更不僅適用于科技博主,比如在一個(gè)跟AI毫無(wú)關(guān)系的搞笑博主評(píng)論區(qū)里,我看見(jiàn)有網(wǎng)友說(shuō),“你怎么還不講DeepSeek?他血洗美國(guó)股市,干碎了美國(guó)人的幻想。那些歐美科技公司全都坐不住了”。

接下來(lái)這種“熱情”愈演愈烈。什么“科技巨頭全報(bào)廢了”“AGI馬上實(shí)現(xiàn)”“普通人再不學(xué)DeepSeek就晚了”,種種言論層出不窮。甚至還有DeepSeek受到境外大規(guī)模網(wǎng)絡(luò)攻擊,各大科技公司頂尖高手聯(lián)手隱跡江湖的中國(guó)紅客出手相救的爽文劇情。

wKgZO2ep6NaAApeuAABFKed6NRE207.jpg

輿論場(chǎng)到這里愈發(fā)離譜了起來(lái)。談到DeepSeek,我們好像會(huì)自動(dòng)陷入某種彌散性的狂熱情緒。其中當(dāng)然有DeepSeek足夠出色的原因,有近幾年AI大熱的加持,但很難否認(rèn)的是,其中也有地緣因素的推動(dòng)。很多人迫切需要一個(gè)“歪果仁怕了、服了”的故事,在科技領(lǐng)域尤其如此。

為了迎合這種情緒,媒體與公眾人物傾向于推波助瀾。比如將對(duì)DeepSeek的討論,推到哲學(xué)、國(guó)運(yùn)、歷史走向的高度。而這些討論又會(huì)在流量的折射與層層斷章取義之下被無(wú)盡放大,很快讓一款A(yù)I模型承受了它本不該承受的地位、責(zé)任與期待。這就是所謂的“推上神壇”。

但神壇之上風(fēng)景并不好。因?yàn)橐酝?jīng)驗(yàn)提醒我們,往往下一步就是“傷仲永”“泡沫破裂”等輿論反噬。對(duì)于初露鋒芒的DeepSeek與研發(fā)團(tuán)隊(duì)來(lái)說(shuō),這種走向應(yīng)該是弊大于利的。

因此我們想要討論一下,目前階段可以基于哪些共識(shí)來(lái)客觀(guān)討論DeepSeek?;蛘哒f(shuō),不妨試著拆掉輿論神壇,還原一個(gè)更真實(shí)也更樸素的DeepSeek。

wKgZPGep6NaAYrqkAAIsj228rh8111.jpg

不妨先釋放一個(gè)“爆論”。那就是跟社交媒體發(fā)散的觀(guān)點(diǎn)截然不同,DeepSeek其實(shí)并沒(méi)有完成從0到1的核心技術(shù)突破。

DeepSeek大火之后,其研發(fā)團(tuán)隊(duì)與科技產(chǎn)業(yè)相關(guān)人士都在討論中國(guó)AI不能只是跟隨,必須完成從0到1。這個(gè)觀(guān)點(diǎn)絕對(duì)正確,但目前的DeepSeek可能還不能成為這個(gè)觀(guān)點(diǎn)的作證。

所謂核心技術(shù)突破,應(yīng)該是主要技術(shù)路徑的變化,或者達(dá)成效果的巨大升級(jí)。而DeepSeek目前最讓人經(jīng)驗(yàn)的技術(shù)能力,一個(gè)是R1模型帶火的思維鏈推理過(guò)程,另一個(gè)是其聯(lián)網(wǎng)檢索的RAG效果表現(xiàn)出色。

wKgZO2ep6NaAaZTcAABroKnRXeg674.jpg

但這兩條技術(shù)路徑都不是DeepSeek開(kāi)創(chuàng)的。思維鏈的興起一般認(rèn)為是OpenAI發(fā)布的o1模型。去年9月o1模型公布后,全球主流大模型紛紛跟進(jìn)了思維鏈、推理大模型等能力。各家名稱(chēng)不同,但整體技術(shù)路線(xiàn)是非常一致的。DeepSeek確實(shí)把思維鏈的過(guò)程更完整、詳細(xì)展示了出來(lái),但其實(shí)也很容易看到其中大模型幻覺(jué)還很?chē)?yán)重。

而在聯(lián)網(wǎng)檢索方面,其他廠(chǎng)商也早有布局,也就是所謂的RAG檢索-增強(qiáng)-生成機(jī)制。這項(xiàng)技術(shù)最開(kāi)始是為了解決大模型不具備實(shí)時(shí)信息的問(wèn)題,并且?guī)椭C正大模型幻覺(jué)。早在2023年,百度發(fā)布文心一言時(shí),RAG就已經(jīng)是其核心能力的組成部分。

但要注意的是,沒(méi)有從0到1的創(chuàng)新,不等于沒(méi)有創(chuàng)新。DeepSeek在模型能力的優(yōu)化上做了大量開(kāi)拓性工作,比如通過(guò)GRPO算法讓模型更加高效?;蛟S可以說(shuō),DeepSeek集成了業(yè)界主流的,被驗(yàn)證過(guò)的技術(shù)路線(xiàn)。在其基礎(chǔ)上完成了模型優(yōu)化、能力加強(qiáng)與用戶(hù)體驗(yàn)升級(jí)。

我們總是渴望從0到1,總是期待石破天驚。但客觀(guān)來(lái)看,第一步和第一萬(wàn)步,邁出的距離是一樣的。

wKgZPGep6NaACac5AAHyAff_JTM092.jpg

那么,DeepSeek真正引發(fā)全球關(guān)注的價(jià)值在哪里?在短短一個(gè)春節(jié)的發(fā)酵之后,可能很多人都忘記了它最早出圈的原因是通過(guò)軟件和架構(gòu)創(chuàng)新,用非常低的算力成本完成了DeepSeek-V3模型的訓(xùn)練。

DeepSeek-V3是我們今天用到的R1模型的基礎(chǔ)模型。在研發(fā)團(tuán)隊(duì)發(fā)表的論文中,可以看到其僅僅使用了550萬(wàn)美元的算力訓(xùn)練成本就完成了6710億參數(shù)大模型的訓(xùn)練。即使這項(xiàng)統(tǒng)計(jì)僅僅局限于基礎(chǔ)模型訓(xùn)練的算力成本這一項(xiàng),沒(méi)有包含后續(xù)應(yīng)用模型的強(qiáng)化學(xué)習(xí)、模型推理,以及人才成本、綜合成本等項(xiàng)目,但也是毫無(wú)疑問(wèn)顛覆了大模型訓(xùn)練的主流成本模型。

而最終DeepSeek實(shí)現(xiàn)的效果,也基本達(dá)到了o1為代表的主流大模型水平。雖然在模型效果上很難說(shuō)有全面的超越,但其確實(shí)以軟件算法的革新實(shí)現(xiàn)了硬件成本的下降。讓低成本模型的效果不差于高成本,讓開(kāi)源模型的效果追趕閉源模型。

而DeepSeek“降低AI算力成本”的突破,又恰好發(fā)生在全球主流AI玩家囤積高端GPU,以此筑造產(chǎn)業(yè)護(hù)城河,以及美國(guó)對(duì)中國(guó)禁售高端AI芯片,希望以此打壓中國(guó)AI的關(guān)鍵節(jié)點(diǎn)上。于是也就有了DeepSeek實(shí)現(xiàn)AI民主化,甚至助力打破地緣科技?jí)艛嗟囊馕叮瑥亩a(chǎn)生了一款中國(guó)AI大模型讓整個(gè)美國(guó)股市遭遇震蕩的戲劇性一幕。

DeepSeek實(shí)現(xiàn)的訓(xùn)練效率提升與訓(xùn)練成本下降,在特殊的產(chǎn)業(yè)環(huán)境與國(guó)際環(huán)境下造成了連鎖反應(yīng)。但問(wèn)題是很多平時(shí)不關(guān)注AI的朋友,可能并不知道AI大模型算力越大效果越好的Scaling Laws,也不知道算力壟斷和禁售的背景信息,只知道短視頻上說(shuō)DeepSeek橫空出世,歪果仁都慌了、怕了。這種缺乏前因后果的聯(lián)想,給DeepSeek憑空造出了一座不應(yīng)屬于它的神壇。

推而廣之,我們很多人都喜歡那些天才式的、戲劇化的創(chuàng)新。但在現(xiàn)實(shí)中,往往只有通過(guò)工程化能力,不斷調(diào)優(yōu),降本,提效,技術(shù)創(chuàng)新才有應(yīng)用和普及的可能。

比如我們都知道愛(ài)迪生發(fā)明了電燈,但容易忽略大規(guī)模電網(wǎng)實(shí)現(xiàn)了電力成本的極大下降。如果每家都要自己發(fā)電,那世界將一片漆黑。

“我們把成本打下來(lái)了?!?/p>

這句有點(diǎn)荒誕、俗套,略帶反諷意味的話(huà),其實(shí)才是中國(guó)產(chǎn)業(yè)化能力的縮影。

我們也不妨大大方方承認(rèn),包括DeepSeek在內(nèi)的中國(guó)AI,在未來(lái)很長(zhǎng)一段時(shí)間里最擅長(zhǎng)的就是把成本給狠狠打下來(lái)。

wKgZO2ep6NeASpfQAAJVZY9KZJ4664.jpg

DeepSeek爆火之后,很多人都說(shuō)這是技術(shù)的巨大勝利。預(yù)言AI的崛起會(huì)讓人文學(xué)科和人文工作喪失價(jià)值。甚至“DeepSeek來(lái)了,學(xué)文科還有意義嗎?”登上了熱搜。

但如果我們多使用DeepSeek,仔細(xì)分析它與其他模型的區(qū)別,會(huì)發(fā)現(xiàn)一個(gè)相反的觀(guān)點(diǎn):DeepSeek恰好證明了文科與人文能力,在A(yíng)I時(shí)代有多么的重要。

我們隨機(jī)問(wèn)一些人,對(duì)DeepSeek的使用體驗(yàn)是怎樣的。他們應(yīng)該會(huì)說(shuō)跟DeepSeek對(duì)話(huà)感覺(jué)更有人味。

但這種人味,在很大程度上并不是理解、推理等AI技術(shù)層面的“人味”,而是模型在對(duì)話(huà)過(guò)程中展露出來(lái)了大量的幽默感、網(wǎng)感,以及更加符合年輕群體的對(duì)話(huà)習(xí)慣。還有就是DeepSeek具有相對(duì)更精妙的修辭能力,優(yōu)美的文筆,還有不錯(cuò)的綜合人文素養(yǎng)。

wKgZPGep6NeAL7h3AAKEqmPnPlo806.jpg

這些能力,讓DeepSeek更貼近年輕用戶(hù)的對(duì)話(huà)習(xí)慣和審美需求,并且能夠給出更有話(huà)題度和傳播度的回答。但問(wèn)題是,這些能力其實(shí)都與技術(shù)的關(guān)系不大,而是很大程度上與訓(xùn)練語(yǔ)料的選取等人文能力緊密相關(guān)。

比如說(shuō),你讓DeepSeek寫(xiě)首詩(shī),它能夠?qū)懗鑫乃嚽嗄隉釔?ài)的語(yǔ)調(diào)與修辭。但其他主流國(guó)內(nèi)大模型,也能寫(xiě)得平仄工整、辭藻華麗,但一眼看去就是酷似打油詩(shī)的“老干體”。

再比如,讓DeepSeek預(yù)測(cè)一些未來(lái)趨勢(shì)之類(lèi)的問(wèn)題,它的回答會(huì)特別類(lèi)似網(wǎng)絡(luò)科幻小說(shuō)。雖然經(jīng)不起推敲,但就是能讓年輕人有種非常厲害,特別燃的感覺(jué)。

這些優(yōu)點(diǎn)的來(lái)源不是技術(shù),而是在于研發(fā)團(tuán)隊(duì)的年輕化、高審美,并且重視模型訓(xùn)練過(guò)程中的人文要素。反觀(guān)很多主流大模型,由于最終聽(tīng)取匯報(bào)的領(lǐng)導(dǎo)層普遍是大于45歲,缺乏人文學(xué)科背景的中年男士,最終導(dǎo)致大模型對(duì)話(huà)也是班味十足,打起官腔來(lái)一套又一套。與其說(shuō)年輕人在支持DeepSeek,不如說(shuō)年輕人在支持自己的話(huà)語(yǔ)權(quán)和審美權(quán)。

順便一提,DeepSeek的另一個(gè)人文優(yōu)勢(shì),是它目前還有些“百無(wú)禁忌”。然而監(jiān)管的鐵拳雖遲但到,大家不必對(duì)AI的犀利和大膽有任何幻想。

DeepSeek以一種很巧妙的方式,實(shí)現(xiàn)了用戶(hù)對(duì)話(huà)體驗(yàn)更好,傳播效果更優(yōu)秀。這些在技術(shù)層面之外,或許能夠引起AI公司對(duì)產(chǎn)品體驗(yàn)的反思,以及對(duì)人文能力的重視。

如果我們狂吹DeepSeek的技術(shù),導(dǎo)致對(duì)其人文體驗(yàn)的忽略,那其實(shí)也挺可惜的。

wKgZO2ep6NiAX1tWAAG-h4aLzjk183.jpg

綜合以上這些側(cè)面,我們可以拼湊出一個(gè)比較完整,且不帶神圣光暈效果的DeepSeek:

它是一次綜合的突破。這種突破由技術(shù)創(chuàng)新,人文素養(yǎng)、開(kāi)源和低成本策略等要素所構(gòu)成,并且在特殊的產(chǎn)業(yè)周期與國(guó)際環(huán)境背景下被發(fā)酵。

DeepSeek不是石破天驚的技術(shù)革命,但它足夠成熟,足夠有新意。這也在某種程度上解釋了,為什么歐美的AI大佬與專(zhuān)家,對(duì)其比較一致的觀(guān)點(diǎn)是“令人印象深刻”。

DeepSeek沒(méi)有一步登天,我們也不必幻想一步登天。

它就是前進(jìn)了一大步,而我們也足可為邁出了這一步而自信和驕傲。

我也十分反對(duì)中國(guó)只有DeepSeek的言論。事實(shí)上,中國(guó)有清晰的AI產(chǎn)業(yè)格局,有堅(jiān)實(shí)的自主化AI軟硬件體系,有數(shù)十萬(wàn)AI開(kāi)發(fā)者,有非常積極的AI政策導(dǎo)向。這些都是更多DeepSeek的土壤。有這些因素在,我十分篤定地認(rèn)為會(huì)有更多DeepSeek出現(xiàn)在這里。直到AI工業(yè)革命的開(kāi)啟,直到AGI的曙光。

何不把DeepSeek帶下神壇?理性從容地看待它,用好它,用好中國(guó)AI事業(yè)的一切造物,才是AI在中國(guó)真正成熟的表現(xiàn)。

王陽(yáng)明說(shuō),山高萬(wàn)仞,只登一步。DeepSeek這一步有它的意義,邁出這一步后,也不妨停下來(lái)聽(tīng)聽(tīng)山風(fēng),淺斟低唱一番。但也要清醒地知道,我們還在山間。

休息好了,高興夠了,也只有一件事要做。那就是邁出下一步。

wKgZO2ep6NiAOeAPAAHwPOoTG_w023.jpg
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40280

    瀏覽量

    301877
  • Agi
    Agi
    +關(guān)注

    關(guān)注

    0

    文章

    101

    瀏覽量

    10834
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3689

    瀏覽量

    5213
  • DeepSeek
    +關(guān)注

    關(guān)注

    2

    文章

    837

    瀏覽量

    3320
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    DeepSeek模型如何在云服務(wù)器上部署?

    隨著大型語(yǔ)言模型(LLM)的應(yīng)用日益普及,許多開(kāi)發(fā)者和企業(yè)希望將像DeepSeek這樣的優(yōu)秀模型部署到自己的云服務(wù)器上,以實(shí)現(xiàn)私有化、定制化服務(wù)并保障數(shù)據(jù)安全。本文將詳細(xì)闡述部署DeepSeek模型
    的頭像 發(fā)表于 10-13 16:52 ?1007次閱讀

    【「DeepSeek 核心技術(shù)揭秘」閱讀體驗(yàn)】+混合專(zhuān)家

    感謝電子發(fā)燒友提供學(xué)習(xí)Deepseek核心技術(shù)這本書(shū)的機(jī)會(huì)。 讀完《Deepseek核心技術(shù)揭秘》,我深受觸動(dòng),對(duì)人工智能領(lǐng)域有了全新的認(rèn)識(shí)。了解Deepseek-R1 、Deepseek
    發(fā)表于 07-22 22:14

    【「DeepSeek 核心技術(shù)揭秘」閱讀體驗(yàn)】--全書(shū)概覽

    感謝平臺(tái)提供的書(shū)籍,實(shí)物如下 這本書(shū)主講從年前開(kāi)始火熱的DeepSeek 。書(shū)籍看起來(lái)輕薄,但言簡(jiǎn)意賅,通俗易懂,總覽全局,比較精煉。 第一章 介紹DeepSeek的一系列技術(shù)突破與創(chuàng)新。 第二章
    發(fā)表于 07-21 00:04

    【「DeepSeek 核心技術(shù)揭秘」閱讀體驗(yàn)】第三章:探索 DeepSeek - V3 技術(shù)架構(gòu)的奧秘

    一、模型架構(gòu) 在閱讀第三章關(guān)于 DeepSeek 的模型架構(gòu)部分時(shí),我仿佛打開(kāi)了一扇通往人工智能核心構(gòu)造的大門(mén)。從架構(gòu)圖中,能清晰看到 Transformer 塊、前饋神經(jīng)網(wǎng)絡(luò)、注意力機(jī)制等模塊
    發(fā)表于 07-20 15:07

    【「DeepSeek 核心技術(shù)揭秘」閱讀體驗(yàn)】書(shū)籍介紹+第一章讀后心得

    前言 非常感謝發(fā)燒友論壇提供的《DeepSeek 核心技術(shù)揭秘》書(shū)籍試讀活動(dòng)!Deepseek-V3從去年年底出來(lái)之后,我就在密切關(guān)注著。今年春節(jié)前,Deepseek-R1的出現(xiàn)徹底點(diǎn)燃了中國(guó)的語(yǔ)言
    發(fā)表于 07-17 11:59

    信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代

    DeepSeek-R1:強(qiáng)大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司開(kāi)發(fā)的新一代AI大模型。其核心優(yōu)勢(shì)在于強(qiáng)大的推理引擎能力,融合了自然語(yǔ)言處理(NLP)、深度
    發(fā)表于 07-16 15:29

    【書(shū)籍評(píng)測(cè)活動(dòng)NO.62】一本書(shū)讀懂 DeepSeek 全家桶核心技術(shù):DeepSeek 核心技術(shù)揭秘

    2025年年初,DeepSeek 成為全球人工智能(AI)領(lǐng)域的焦點(diǎn),其DeepSeek-V3 和DeepSeek-R1 版本在行業(yè)內(nèi)引發(fā)了結(jié)構(gòu)性震動(dòng)。 DeepSeek-V3 是一個(gè)
    發(fā)表于 06-09 14:38

    DeepSeeK學(xué)習(xí)資料

    104頁(yè)DeepSeeK學(xué)習(xí)資料(清華)
    發(fā)表于 06-08 09:57 ?2次下載

    DeepSeek:從入門(mén)到精通

    電子發(fā)燒友網(wǎng)站提供《DeepSeek:從入門(mén)到精通.pdf》資料免費(fèi)下載
    發(fā)表于 05-28 14:12 ?5次下載

    DeepSeek + MCP打造高效研報(bào)生成神器

    DeepSeek
    jf_23871869
    發(fā)布于 :2025年04月07日 17:09:41

    如何基于A(yíng)ndroid 14在i.MX95 EVK上運(yùn)行Deepseek-R1-1.5B和性能

    本文檔總結(jié)了如何基于 Android 14 在 i.MX95 EVK 上運(yùn)行 Deepseek-R1-1.5B 和性能。 1. Install Android 14 on i.MX95 您可以按照
    發(fā)表于 04-04 06:59

    接入DeepSeek后智慧場(chǎng)館的能力提升

    隨著人工智能技術(shù)的快速發(fā)展,以DeepSeek為代表的大模型技術(shù)正在為智慧場(chǎng)館建設(shè)帶來(lái)革命性的變革。通過(guò)接入DeepSeek的先進(jìn)AI能力, 智慧場(chǎng)館 在運(yùn)營(yíng)管理、用戶(hù)體驗(yàn)、安全保障等方面都實(shí)現(xiàn)了質(zhì)
    的頭像 發(fā)表于 04-02 11:57 ?620次閱讀

    必學(xué)!使用DeepSeek-V3-0324版快速生成概念演示動(dòng)畫(huà)

    DeepSeek
    jf_23871869
    發(fā)布于 :2025年03月31日 11:03:25

    DeepSeek全新API上線(xiàn)訊飛星辰MaaS平臺(tái)

    近日,DeepSeek最新推出DeepSeek-V3-0324版本,在以下方面實(shí)現(xiàn)明顯提升。
    的頭像 發(fā)表于 03-28 17:29 ?1317次閱讀

    Deepseek移植到i.MX 8MP|93 EVK的步驟

    此共享介紹了如何將 deepseek 移植到i.MX93EVK使用 llama.cpp 的 Yocto BSP 本文檔使用的主要測(cè)試模型是在 deepseek 模型的基礎(chǔ)上進(jìn)行提煉和量化的 Qwen
    發(fā)表于 03-26 06:08