chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

DeepSeek-R1:別被它的光環(huán)迷了眼,這些能力局限你得知道!

jf_23871869 ? 來源:劉力 ? 作者:劉力 ? 2025-03-11 17:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力

最近,DeepSeek-R1 可是火遍了全網(wǎng),號(hào)稱“超越人類專家”,數(shù)學(xué)競賽奪冠、代碼能力碾壓人類開發(fā)者……聽起來是不是很厲害?但別急著被這些光環(huán)迷了眼,這款被吹上天的 AI,其實(shí)也有不少能力局限呢。今天,咱們就拋開那些營銷濾鏡,根據(jù)官方論文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》以及我多年的產(chǎn)品設(shè)計(jì)經(jīng)驗(yàn),來好好聊聊 DeepSeek-R1 的那些“小秘密”!

wKgZPGfP_-OAaRY4AABkUQX_07s545.png

一,“低情商偏科王”:只會(huì)做題,不會(huì)“溝通”


DeepSeek-R1 在數(shù)學(xué)、編程這些“考試型任務(wù)”上確實(shí)表現(xiàn)驚艷,可一旦到了跟人溝通的場景,那可就翻車翻得一塌糊涂了。DeepSeek 團(tuán)隊(duì)自曝:它的訓(xùn)練數(shù)據(jù)主要集中在學(xué)術(shù)領(lǐng)域,這就導(dǎo)致它像個(gè)“書呆子”,只知道悶頭解決問題,卻不懂得怎么跟人打交道。

大家都知道,溝通可是一門溫暖的藝術(shù),可不是一堆冰冷的技術(shù)。就像在咱們?nèi)粘5墓芾砉ぷ髦校际窍忍幚砬榫w再處理問題。DeepSeek-R1 這樣的“書呆子”,要是用在需要提供情緒價(jià)值的產(chǎn)品上,那可就慘了。試想一下,當(dāng)客戶氣沖沖地打來投訴電話,你的“智能客服”卻跟客戶有條不紊地分析問題的根因和解決方法,客戶能不氣得更厲害嗎?

現(xiàn)在很多自媒體都在嘲笑 OpenAI 發(fā)布的最新模型 GPT-4.5,說它卷不動(dòng)數(shù)學(xué),開始走高情商路線了。但我反倒覺得,從產(chǎn)品的角度來看,OpenAI 選擇的大模型能力發(fā)展方向才是正確且極有價(jià)值的呢。著名產(chǎn)品人梁寧在《給溫度以技術(shù),給商業(yè)以文明》的演講里也提到:下一個(gè)時(shí)代,比拼的就是情緒價(jià)值。DeepSeek-R1 這種“低情商偏科王”,在情緒價(jià)值方面可就差得遠(yuǎn)了。

wKgZO2fP_-iAUKKGABYpWa6f9Ns518.png

二,小語種能力不足:除了中文和英文,它可能“胡言亂語”


雖說 DeepSeek-R1 支持多語言,但 DeepSeek 團(tuán)隊(duì)也坦白了,它的訓(xùn)練語料里小語種語料少得可憐。小語種,就是除了聯(lián)合國六大通用語種(漢語、英語、法語、西班牙語、俄語、阿拉伯語)之外的其他語言。要是用小語種讓 DeepSeek-R1 去思考數(shù)學(xué)或者解決推理問題,那可就真要鬧笑話了,搞不好就會(huì)“胡言亂語”。

那些做小語種國家產(chǎn)品的人可得注意了,可不是像很多自媒體說的那樣,把產(chǎn)品接入 DeepSeek-R1 就萬事大吉了。比如馬來西亞人日常說的馬來西亞式英語,那可是一種獨(dú)特的英語變體,它把馬來語、漢語(包括普通話和方言)等語言的語法和詞匯都混在了一起,一句話里可能夾雜著普通話、馬來語和粵語。要是你直接把接入了 DeepSeek-R1 的產(chǎn)品出口到馬來西亞,那面對(duì)這種“夾雜英語、普通話、馬來語和粵語”的問題,DeepSeek-R1 恐怕就得傻眼了。

wKgZPGfP_-qAI4s2AABjDgqlFDU167.png

三,“玻璃心”:面對(duì)有示例的提示詞,智商暴跌50%


DeepSeek-R1 對(duì)提示詞可是很挑剔的!官方明確指出,要是提示詞里帶有示例,也就是少樣本提示詞(few-shot prompt),它會(huì)先從示例里學(xué)習(xí),然后再回答,這樣一來,答案的準(zhǔn)確率可能就會(huì)從 90% 直接掉到 40%。

官方建議:直接用零樣本提示詞(Zero-shot Prompt),不要加入任何示例。這樣一來,DeepSeek-R1 就能發(fā)揮出它應(yīng)有的水平了。

wKgZO2fP_-6AJNqhAAtTULCNEyY545.png

四,職場“菜鳥”:代碼寫得好,但做工程就是個(gè)“實(shí)習(xí)生”


DeepSeek-R1 在 Codeforces 競賽里擊敗了 96% 的人類,這代碼能力看起來確實(shí)很厲害??梢坏秸鎸?shí)的軟件工程里,它就露餡了:

復(fù)雜項(xiàng)目管理:它壓根兒就不懂“模塊化開發(fā)”“版本控制”這些概念,面對(duì)復(fù)雜項(xiàng)目,估計(jì)得一頭霧水。

跨團(tuán)隊(duì)協(xié)作:DeepSeek-R1 只能獨(dú)自編程,完全不會(huì)團(tuán)隊(duì)協(xié)作,要是放到一個(gè)需要多人協(xié)作的項(xiàng)目里,那可就麻煩了。

玄學(xué) debug:遇到 bug 時(shí),它可能還會(huì)給出“重啟試試”這種無厘頭的解決方案,這可真是讓人哭笑不得。

為啥會(huì)出現(xiàn)這種情況呢?原因就在于 DeepSeek-R1 在 RL 訓(xùn)練中缺乏真實(shí)工程數(shù)據(jù),所以它雖然能解題,但真到了工程項(xiàng)目里,可就不是那么回事兒了,說白了,它就是一個(gè)“解題高手”,但不是工程項(xiàng)目高手。

五,結(jié)語:AI 的未來,在清醒認(rèn)知中前行


DeepSeek-R1 的突破確實(shí)值得喝彩,但它絕對(duì)不是完美的“通用人工智能”。這些能力局限的存在,正好說明了 AI 的“智能”依然是“窄化”的,還遠(yuǎn)遠(yuǎn)無法替代人類的綜合能力。不過好消息是,DeepSeek 團(tuán)隊(duì)已經(jīng)知道這些局限的存在了,他們已經(jīng)在著手解決這些問題了。

在這里,我要友情提示大家一句:當(dāng)你看到“AI 秒殺人類”這種驚悚新聞的時(shí)候,可千萬別被嚇到了,這可能只是特定場景下的“販賣焦慮”。真正的 AGI 革命,還在路上呢。那么,你有沒有發(fā)現(xiàn) DeepSeek-R1 的其他短板呢?歡迎在評(píng)論區(qū)一起聊聊呀!

如果你有更好的文章,歡迎投稿!

稿件接收郵箱:nami.liu@pasuntech.com

更多精彩內(nèi)容請(qǐng)關(guān)注“算力魔方?”!

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • DeepSeek
    +關(guān)注

    關(guān)注

    2

    文章

    837

    瀏覽量

    3395
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    百度騰訊搶灘布局!DeepSeek-R1升級(jí)和開源背后,國產(chǎn)AI的逆襲之路

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)日前,DeepSeek官方宣布DeepSeek-R1模型已完成小版本試升級(jí),當(dāng)前版本為DeepSeek-R1-0528。次日,DeepSeek-R1-05
    的頭像 發(fā)表于 06-03 06:34 ?6367次閱讀

    DeepSeek R1 MTP在TensorRT-LLM中的實(shí)現(xiàn)與優(yōu)化

    TensorRT-LLM 在 NVIDIA Blackwell GPU 上創(chuàng)下了 DeepSeek-R1 推理性能的世界紀(jì)錄,Multi-Token Prediction (MTP) 實(shí)現(xiàn)了大幅提速
    的頭像 發(fā)表于 08-30 15:47 ?4667次閱讀
    <b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b> MTP在TensorRT-LLM中的實(shí)現(xiàn)與優(yōu)化

    速看!EASY-EAI教你離線部署Deepseek R1大模型

    1.Deepseek簡介DeepSeek-R1,是幻方量化旗下AI公司深度求索(DeepSeek)研發(fā)的推理模型。DeepSeek-R1采用強(qiáng)化學(xué)習(xí)進(jìn)行后訓(xùn)練,旨在提升推理
    的頭像 發(fā)表于 07-25 15:22 ?1570次閱讀
    速看!EASY-EAI教你離線部署<b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b>大模型

    【「DeepSeek 核心技術(shù)揭秘」閱讀體驗(yàn)】+混合專家

    感謝電子發(fā)燒友提供學(xué)習(xí)Deepseek核心技術(shù)這本書的機(jī)會(huì)。 讀完《Deepseek核心技術(shù)揭秘》,我深受觸動(dòng),對(duì)人工智能領(lǐng)域有了全新的認(rèn)識(shí)。了解Deepseek-R1 、Deepseek
    發(fā)表于 07-22 22:14

    【「DeepSeek 核心技術(shù)揭秘」閱讀體驗(yàn)】--全書概覽

    講解Deepseek的使用方法 第三章 深入剖析Deepseek-V3的模型架構(gòu)、訓(xùn)練框架、推理階段優(yōu)化、后訓(xùn)練優(yōu)化等關(guān)鍵技術(shù) 第四章關(guān)于DeepSeek-R1的技術(shù)剖析 第五章 從宏觀角度分析
    發(fā)表于 07-21 00:04

    【「DeepSeek 核心技術(shù)揭秘」閱讀體驗(yàn)】書籍介紹+第一章讀后心得

    相對(duì)策略優(yōu)化**(GRPO)算法、獎(jiǎng)勵(lì)模型**等關(guān)鍵技術(shù)的深入剖析,可以幫助讀者了解 DeepSeek 在強(qiáng)化學(xué)習(xí)領(lǐng)域的創(chuàng)新性探索。對(duì)DeepSeek-R1 的訓(xùn)練過程和推理能力的蒸餾等內(nèi)容的詳細(xì)闡述
    發(fā)表于 07-17 11:59

    信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代

    DeepSeek-R1:強(qiáng)大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司開發(fā)的新一代AI大模型。其核心優(yōu)勢在于強(qiáng)大的推理引擎能力,融合了自然語言處理(NLP)、深度
    發(fā)表于 07-16 15:29

    Arm Neoverse N2平臺(tái)實(shí)現(xiàn)DeepSeek-R1滿血版部署

    頗具優(yōu)勢。Arm 攜手合作伙伴,在 Arm Neoverse N2 平臺(tái)上使用開源推理框架 llama.cpp 實(shí)現(xiàn) DeepSeek-R1 滿血版的部署,目前已可提供線上服務(wù)。
    的頭像 發(fā)表于 07-03 14:37 ?1420次閱讀
    Arm Neoverse N2平臺(tái)實(shí)現(xiàn)<b class='flag-5'>DeepSeek-R1</b>滿血版部署

    NVIDIA Blackwell GPU優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場景中的性能紀(jì)錄

    本文將探討 NVIDIA TensorRT-LLM 如何基于 8 個(gè) NVIDIA Blackwell GPU 的配置,打破 DeepSeek-R1 在最小延遲場景中的性能紀(jì)錄:在 GTC 2025
    的頭像 發(fā)表于 07-02 19:31 ?3554次閱讀
    NVIDIA Blackwell GPU優(yōu)化<b class='flag-5'>DeepSeek-R1</b>性能 打破<b class='flag-5'>DeepSeek-R1</b>在最小延遲場景中的性能紀(jì)錄

    【書籍評(píng)測活動(dòng)NO.62】一本書讀懂 DeepSeek 全家桶核心技術(shù):DeepSeek 核心技術(shù)揭秘

    ,或者偏離人們習(xí)慣的表達(dá)方式。 因此,在訓(xùn)練 DeepSeek-R1 時(shí),DeepSeek 研究團(tuán)隊(duì)對(duì)模型進(jìn)行了兩次額外的調(diào)整: 第一次是喂給它一些冷啟動(dòng)的例子 ,相當(dāng)于給模型打好基礎(chǔ),讓
    發(fā)表于 06-09 14:38

    DeepSeek開源新版R1 媲美OpenAI o3

    DeepSeek“悄悄”地又放了一個(gè)大招,DeepSeek開源了R1最新0528版本。盡管DeepSeek目前還沒有對(duì)該版本進(jìn)行任何說明,但是根據(jù)著名代碼測試平臺(tái)Live CodeBe
    的頭像 發(fā)表于 05-29 11:23 ?1479次閱讀

    使用瑞薩MPU芯片RZ/V2H部署DeepSeek-R1模型

    DeepSeek大語言模型(LLM)可用于理解人類語言的交互方式,思考,并給出合適的回應(yīng)。
    的頭像 發(fā)表于 05-15 14:40 ?1139次閱讀
    使用瑞薩MPU芯片RZ/V2H部署<b class='flag-5'>DeepSeek-R1</b>模型

    瑞薩RZ/V2H平臺(tái)支持部署離線版DeepSeek -R1大語言模型

    瑞薩RZ/V2H平臺(tái)支持部署離線版DeepSeek -R1大語言模型
    的頭像 發(fā)表于 05-13 17:07 ?1857次閱讀
    瑞薩RZ/V2H平臺(tái)支持部署離線版<b class='flag-5'>DeepSeek</b> -<b class='flag-5'>R1</b>大語言模型

    DeepSeek 引領(lǐng)邊緣 AI 芯片向更高性能、更低功耗、更強(qiáng)泛化能力的方向演進(jìn)

    DeepSeek 系列模型概覽 DeepSeek 系列包括大型語言模型(如 DeepSeek LLM、R1)及多模態(tài)模型(DeepSeek-
    的頭像 發(fā)表于 05-09 10:27 ?2413次閱讀

    SAP實(shí)施專家解答:如何用DeepSeek-R1實(shí)現(xiàn)需求溝通效率倍增

    工博科技分享AI工具鏈在IT項(xiàng)目中的深度應(yīng)用:通過DeepSeek-R1實(shí)現(xiàn)智能會(huì)議記錄結(jié)構(gòu)化(2小時(shí)會(huì)議5分鐘生成決策表)和精準(zhǔn)多語言文檔翻譯(錯(cuò)誤率降低14%),幫助IT團(tuán)隊(duì)將重復(fù)性工作耗時(shí)減少
    的頭像 發(fā)表于 04-28 09:13 ?813次閱讀