chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

DeepSeek-R1:別被它的光環(huán)迷了眼,這些能力局限你得知道!

jf_23871869 ? 來(lái)源:劉力 ? 作者:劉力 ? 2025-03-11 17:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力

最近,DeepSeek-R1 可是火遍了全網(wǎng),號(hào)稱“超越人類專家”,數(shù)學(xué)競(jìng)賽奪冠、代碼能力碾壓人類開(kāi)發(fā)者……聽(tīng)起來(lái)是不是很厲害?但別急著被這些光環(huán)迷了眼,這款被吹上天的 AI,其實(shí)也有不少能力局限呢。今天,咱們就拋開(kāi)那些營(yíng)銷濾鏡,根據(jù)官方論文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》以及我多年的產(chǎn)品設(shè)計(jì)經(jīng)驗(yàn),來(lái)好好聊聊 DeepSeek-R1 的那些“小秘密”!

wKgZPGfP_-OAaRY4AABkUQX_07s545.png

一,“低情商偏科王”:只會(huì)做題,不會(huì)“溝通”


DeepSeek-R1 在數(shù)學(xué)、編程這些“考試型任務(wù)”上確實(shí)表現(xiàn)驚艷,可一旦到了跟人溝通的場(chǎng)景,那可就翻車翻得一塌糊涂了。DeepSeek 團(tuán)隊(duì)自曝:它的訓(xùn)練數(shù)據(jù)主要集中在學(xué)術(shù)領(lǐng)域,這就導(dǎo)致它像個(gè)“書呆子”,只知道悶頭解決問(wèn)題,卻不懂得怎么跟人打交道。

大家都知道,溝通可是一門溫暖的藝術(shù),可不是一堆冰冷的技術(shù)。就像在咱們?nèi)粘5墓芾砉ぷ髦校际窍忍幚砬榫w再處理問(wèn)題。DeepSeek-R1 這樣的“書呆子”,要是用在需要提供情緒價(jià)值的產(chǎn)品上,那可就慘了。試想一下,當(dāng)客戶氣沖沖地打來(lái)投訴電話,你的“智能客服”卻跟客戶有條不紊地分析問(wèn)題的根因和解決方法,客戶能不氣得更厲害嗎?

現(xiàn)在很多自媒體都在嘲笑 OpenAI 發(fā)布的最新模型 GPT-4.5,說(shuō)它卷不動(dòng)數(shù)學(xué),開(kāi)始走高情商路線了。但我反倒覺(jué)得,從產(chǎn)品的角度來(lái)看,OpenAI 選擇的大模型能力發(fā)展方向才是正確且極有價(jià)值的呢。著名產(chǎn)品人梁寧在《給溫度以技術(shù),給商業(yè)以文明》的演講里也提到:下一個(gè)時(shí)代,比拼的就是情緒價(jià)值。DeepSeek-R1 這種“低情商偏科王”,在情緒價(jià)值方面可就差得遠(yuǎn)了。

wKgZO2fP_-iAUKKGABYpWa6f9Ns518.png

二,小語(yǔ)種能力不足:除了中文和英文,它可能“胡言亂語(yǔ)”


雖說(shuō) DeepSeek-R1 支持多語(yǔ)言,但 DeepSeek 團(tuán)隊(duì)也坦白了,它的訓(xùn)練語(yǔ)料里小語(yǔ)種語(yǔ)料少得可憐。小語(yǔ)種,就是除了聯(lián)合國(guó)六大通用語(yǔ)種(漢語(yǔ)、英語(yǔ)、法語(yǔ)、西班牙語(yǔ)、俄語(yǔ)、阿拉伯語(yǔ))之外的其他語(yǔ)言。要是用小語(yǔ)種讓 DeepSeek-R1 去思考數(shù)學(xué)或者解決推理問(wèn)題,那可就真要鬧笑話了,搞不好就會(huì)“胡言亂語(yǔ)”。

那些做小語(yǔ)種國(guó)家產(chǎn)品的人可得注意了,可不是像很多自媒體說(shuō)的那樣,把產(chǎn)品接入 DeepSeek-R1 就萬(wàn)事大吉了。比如馬來(lái)西亞人日常說(shuō)的馬來(lái)西亞式英語(yǔ),那可是一種獨(dú)特的英語(yǔ)變體,它把馬來(lái)語(yǔ)、漢語(yǔ)(包括普通話和方言)等語(yǔ)言的語(yǔ)法和詞匯都混在了一起,一句話里可能夾雜著普通話、馬來(lái)語(yǔ)和粵語(yǔ)。要是你直接把接入了 DeepSeek-R1 的產(chǎn)品出口到馬來(lái)西亞,那面對(duì)這種“夾雜英語(yǔ)、普通話、馬來(lái)語(yǔ)和粵語(yǔ)”的問(wèn)題,DeepSeek-R1 恐怕就得傻眼了。

wKgZPGfP_-qAI4s2AABjDgqlFDU167.png

三,“玻璃心”:面對(duì)有示例的提示詞,智商暴跌50%


DeepSeek-R1 對(duì)提示詞可是很挑剔的!官方明確指出,要是提示詞里帶有示例,也就是少樣本提示詞(few-shot prompt),它會(huì)先從示例里學(xué)習(xí),然后再回答,這樣一來(lái),答案的準(zhǔn)確率可能就會(huì)從 90% 直接掉到 40%。

官方建議:直接用零樣本提示詞(Zero-shot Prompt),不要加入任何示例。這樣一來(lái),DeepSeek-R1 就能發(fā)揮出它應(yīng)有的水平了。

wKgZO2fP_-6AJNqhAAtTULCNEyY545.png

四,職場(chǎng)“菜鳥(niǎo)”:代碼寫得好,但做工程就是個(gè)“實(shí)習(xí)生”


DeepSeek-R1 在 Codeforces 競(jìng)賽里擊敗了 96% 的人類,這代碼能力看起來(lái)確實(shí)很厲害。可一到真實(shí)的軟件工程里,它就露餡了:

復(fù)雜項(xiàng)目管理:它壓根兒就不懂“模塊化開(kāi)發(fā)”“版本控制”這些概念,面對(duì)復(fù)雜項(xiàng)目,估計(jì)得一頭霧水。

跨團(tuán)隊(duì)協(xié)作:DeepSeek-R1 只能獨(dú)自編程,完全不會(huì)團(tuán)隊(duì)協(xié)作,要是放到一個(gè)需要多人協(xié)作的項(xiàng)目里,那可就麻煩了。

玄學(xué) debug:遇到 bug 時(shí),它可能還會(huì)給出“重啟試試”這種無(wú)厘頭的解決方案,這可真是讓人哭笑不得。

為啥會(huì)出現(xiàn)這種情況呢?原因就在于 DeepSeek-R1 在 RL 訓(xùn)練中缺乏真實(shí)工程數(shù)據(jù),所以它雖然能解題,但真到了工程項(xiàng)目里,可就不是那么回事兒了,說(shuō)白了,它就是一個(gè)“解題高手”,但不是工程項(xiàng)目高手。

五,結(jié)語(yǔ):AI 的未來(lái),在清醒認(rèn)知中前行


DeepSeek-R1 的突破確實(shí)值得喝彩,但它絕對(duì)不是完美的“通用人工智能”。這些能力局限的存在,正好說(shuō)明了 AI 的“智能”依然是“窄化”的,還遠(yuǎn)遠(yuǎn)無(wú)法替代人類的綜合能力。不過(guò)好消息是,DeepSeek 團(tuán)隊(duì)已經(jīng)知道這些局限的存在了,他們已經(jīng)在著手解決這些問(wèn)題了。

在這里,我要友情提示大家一句:當(dāng)你看到“AI 秒殺人類”這種驚悚新聞的時(shí)候,可千萬(wàn)別被嚇到了,這可能只是特定場(chǎng)景下的“販賣焦慮”。真正的 AGI 革命,還在路上呢。那么,你有沒(méi)有發(fā)現(xiàn) DeepSeek-R1 的其他短板呢?歡迎在評(píng)論區(qū)一起聊聊呀!

如果你有更好的文章,歡迎投稿!

稿件接收郵箱:nami.liu@pasuntech.com

更多精彩內(nèi)容請(qǐng)關(guān)注“算力魔方?”!

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • DeepSeek
    +關(guān)注

    關(guān)注

    2

    文章

    822

    瀏覽量

    2788
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    如何使用OpenVINO運(yùn)行DeepSeek-R1蒸餾模型

    DeepSeek-R1在春節(jié)期間引發(fā)了全球科技界的熱度,DeepSeek-R1 是由 DeepSeek 開(kāi)發(fā)的開(kāi)源推理模型,用于解決需要邏輯推理、數(shù)學(xué)問(wèn)題解決和實(shí)時(shí)決策的任務(wù)。
    的頭像 發(fā)表于 03-12 13:45 ?2013次閱讀
    如何使用OpenVINO運(yùn)行<b class='flag-5'>DeepSeek-R1</b>蒸餾模型

    RK3588開(kāi)發(fā)板上部署DeepSeek-R1大模型的完整指南

    DeepSeek作為國(guó)產(chǎn)AI大數(shù)據(jù)模型的代表,憑借其卓越的推理能力和高效的文本生成技術(shù),在全球人工智能領(lǐng)域引發(fā)廣泛關(guān)注。DeepSeek-R1作為該系列最新迭代版本,實(shí)現(xiàn)了長(zhǎng)文本處理效能躍遷、多模態(tài)
    發(fā)表于 02-27 16:45

    Infinix AI接入DeepSeek-R1滿血版

    傳音控股旗下Infinix品牌正式宣布接入DeepSeek-R1滿血版,2月26日起支持XOS 14.5及以上版本的Infinix機(jī)型可通過(guò)升級(jí)使用,3月份將發(fā)布的全新NOTE系列也將接入DeepSeek-R1,開(kāi)啟“Infinix AI∞ 時(shí)代”新篇章。
    的頭像 發(fā)表于 02-21 16:08 ?1170次閱讀

    了解DeepSeek-V3 和 DeepSeek-R1兩個(gè)大模型的不同定位和應(yīng)用選擇

    DeepSeek-V3 和 DeepSeek-R1 是深度求索公司(DeepSeek)推出的兩個(gè)不同定位的大模型,其核心差異主要體現(xiàn)在目標(biāo)場(chǎng)景、能力側(cè)重和技術(shù)優(yōu)化方向上。以下是二者的實(shí)
    發(fā)表于 02-14 02:08

    超星未來(lái)驚蟄R1芯片適配DeepSeek-R1模型

    。 DeepSeek-R1模型采用了創(chuàng)新的MoE(Mixture of Experts)架構(gòu),顯著降低了推理成本。同時(shí),該模型還通過(guò)GRPO(一種強(qiáng)化學(xué)習(xí)策略)進(jìn)行了優(yōu)化,進(jìn)一步提升了模型的推理能力。這使
    的頭像 發(fā)表于 02-13 14:05 ?1072次閱讀

    OPPO Find N5將接入DeepSeek-R1,可直接語(yǔ)音使用

    DeepSeek-R1 帶來(lái)聯(lián)網(wǎng)搜索的能力,幫助用戶實(shí)時(shí)獲取熱點(diǎn)新聞及解讀;Find N5 還支持將DeepSeek-R1生成的結(jié)果導(dǎo)出為本地文件,方便用戶
    發(fā)表于 02-08 17:39 ?781次閱讀

    AIBOX 全系產(chǎn)品已適配 DeepSeek-R1

    DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力,目前基于開(kāi)源的R1模型具有1.5B-70B可選,這些蒸餾模
    的頭像 發(fā)表于 02-08 17:30 ?936次閱讀
    AIBOX 全系產(chǎn)品已適配 <b class='flag-5'>DeepSeek-R1</b>

    DeepSeek-R1本地部署指南,開(kāi)啟的AI探索之旅

    的進(jìn)一步使用。 論文鏈接:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf 1|0一、什么是
    的頭像 發(fā)表于 02-08 10:30 ?8268次閱讀
    <b class='flag-5'>DeepSeek-R1</b>本地部署指南,開(kāi)啟<b class='flag-5'>你</b>的AI探索之旅

    deepin UOS AI接入DeepSeek-R1模型

    DeepSeek-R1 模型自發(fā)布以來(lái)吸引了眾多用戶關(guān)注,為了讓 deepin 用戶更好地體驗(yàn)這一前沿技術(shù),UOS AI 現(xiàn)已適配接入 DeepSeek-R1 端側(cè)模型!無(wú)需忍受服務(wù)器崩潰,兩步即可在本地獨(dú)享 DeepSeek-R1
    的頭像 發(fā)表于 02-08 09:52 ?2188次閱讀

    芯動(dòng)力神速適配DeepSeek-R1大模型,AI芯片設(shè)計(jì)邁入“快車道”!

    DeepSeek研發(fā)的系列推理模型,自誕生起就備受矚目。采用強(qiáng)化學(xué)習(xí)訓(xùn)練,推理時(shí)包含大量反思和驗(yàn)證,思維鏈長(zhǎng)度可達(dá)數(shù)萬(wàn)字。在數(shù)學(xué)、代碼以及復(fù)雜邏輯推理任務(wù)上,DeepSeek-R1有著出色的表現(xiàn),能取得媲美
    的頭像 發(fā)表于 02-07 16:55 ?883次閱讀
    芯動(dòng)力神速適配<b class='flag-5'>DeepSeek-R1</b>大模型,AI芯片設(shè)計(jì)邁入“快車道”!

    網(wǎng)易有道全面接入DeepSeek-R1大模型

    DeepSeek-R1大模型為基礎(chǔ),進(jìn)一步優(yōu)化其AI學(xué)習(xí)助手“有道小P”的個(gè)性化答疑功能。借助DeepSeek-R1的超長(zhǎng)思維鏈能力,“有道小P”將能夠?yàn)橛脩籼峁└由钊?、?zhǔn)確的解題思路,幫助用戶更好地理解和掌握知識(shí)點(diǎn)。 此次升
    的頭像 發(fā)表于 02-07 14:42 ?1337次閱讀

    原生鴻蒙版小藝App上架DeepSeek-R1, AI智慧體驗(yàn)更豐富

    2月5日,HarmonyOS NEXT的小藝 App正式上架DeepSeek-R1 Beta版,幫助消費(fèi)者在代碼編寫、數(shù)學(xué)計(jì)算、邏輯推理等方面提供智能問(wèn)詢服務(wù)。華為小藝上架的DeepSeek-R1
    的頭像 發(fā)表于 02-07 13:24 ?1926次閱讀

    DeepSeek-R1實(shí)現(xiàn)自動(dòng)生成Manim動(dòng)畫

    ? 作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 前面我們分享了在本地運(yùn)行能與OpenAI-o1 能力相媲美的DeepSeek-R1 模型。本文將介紹如何使用DeepSeek-R1實(shí)現(xiàn)自動(dòng)
    的頭像 發(fā)表于 02-07 12:31 ?4601次閱讀
    用<b class='flag-5'>DeepSeek-R1</b>實(shí)現(xiàn)自動(dòng)生成Manim動(dòng)畫

    行業(yè)首家!數(shù)勢(shì)科技SwiftAgent全面接入DeepSeek-R1

    」。數(shù)勢(shì)科技此次接入DeepSeek-R1,將DeepSeek領(lǐng)先的MOE專家架構(gòu),以及長(zhǎng)思維鏈推理能力,注入SwiftAgent內(nèi)核,打造出行業(yè)首個(gè)具備「認(rèn)知進(jìn)化能力」的智能分析產(chǎn)品
    的頭像 發(fā)表于 02-06 14:27 ?766次閱讀
    行業(yè)首家!數(shù)勢(shì)科技SwiftAgent全面接入<b class='flag-5'>DeepSeek-R1</b>

    對(duì)標(biāo)OpenAI o1,DeepSeek-R1發(fā)布

    DeepSeek-R1 在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力。在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上,性能比肩 OpenAI o1 正式版
    的頭像 發(fā)表于 01-22 13:46 ?3047次閱讀
    對(duì)標(biāo)OpenAI o<b class='flag-5'>1</b>,<b class='flag-5'>DeepSeek-R1</b>發(fā)布