chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用python分析了李子柒的辣醬真的好吃嗎?

lviY_AI_shequ ? 來源:數(shù)據(jù)不吹牛 ? 2020-05-12 09:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

最近收到不少留言,除了夸小Z腦洞奇清的,問最多的竟然是:

“我是偏運營/業(yè)務(wù)分析的,復(fù)雜的分析算法我不會,還有什么方法能夠?qū)υu價類數(shù)據(jù)做更深入分析嗎?”

剛開始我會昧著良心回復(fù)“詞云??!”

然鵝總是會被DISS“詞云太簡單了吧,有點low!”

我猙獰一笑,雖然這個問題有點像“我長的不帥也沒錢,有沒有什么辦法能夠追到白富美”。但從數(shù)據(jù)分析的角度來看,仍不失為一個好問題。

好在哪里呢?在回答之前,先瞧一個數(shù)據(jù)分析常見思維誤區(qū):

一些同學(xué)總是認(rèn)為,分析不出來有價值的結(jié)果,是因為有兩只攔路虎,一是數(shù)據(jù)量和維度不夠,二是因為自己不會復(fù)雜的分析模型和算法。然后,也沒有再去思考,如何基于現(xiàn)狀更進(jìn)一步地分析問題。

數(shù)據(jù)維度和算法的價值當(dāng)然不言而喻,但總是把分析不出結(jié)果和價值的鍋甩出去,這種歸錯于外的思維非常危險,它營造了一種“分析不出結(jié)果,我也沒辦法”的心安理得。

而“我不會高階分析工具和方法,但基于現(xiàn)狀,去思考或者詢問有沒有更好的分析方式”,雖然這種思維也有槽點,但本身算是一種在現(xiàn)階段嘗試去解決問題的思路。

So,我們循著后一種思路,以李子柒在天貓上賣的一款辣椒醬評價為例:

看看基于現(xiàn)有的“單薄”數(shù)據(jù)維度,怎樣讓分析再向前邁進(jìn)一步。

01 明確目標(biāo)

魯迅曾經(jīng)沒說過:“明確分析目標(biāo),你的分析已經(jīng)成功了一大半”。

做深入分析之前,面對這一堆評價數(shù)據(jù),我們要明確,究竟想通過分析來解決什么問題?只有明確分析目標(biāo),才能把發(fā)散的思維聚焦起來。

為了給大家一個明確的分析錨點,假設(shè)我們是這款辣椒醬的產(chǎn)品負(fù)責(zé)人,要基于評價,更好的獲悉消費者對產(chǎn)品的看法,從而為后續(xù)產(chǎn)品優(yōu)化提供思路。

所以,我們的分析目標(biāo)是“基于評價反饋,量化消費者感知,指導(dǎo)優(yōu)化產(chǎn)品”。

注:這里給到的一個假設(shè)目標(biāo)并不完美,主要是拋磚引玉,大家可以從不同的維度來提出目標(biāo)假設(shè),嘗試不同分析方向。

是不是有那么一丟丟分析思路了?別急,目標(biāo)還需要繼續(xù)拆解。

02 拆解目標(biāo)

這些年來,最有價值的一個字,便是“拆”了:

在數(shù)據(jù)分析中也是同理。

我們在上一步已經(jīng)確定了“基于評價優(yōu)化產(chǎn)品”的目標(biāo),但這只是一個籠統(tǒng)模糊的目標(biāo)。要讓目標(biāo)真正可落地,“拆”是必不可少的一步。

“拆”的藝術(shù)大體可以分為兩步,第一步是換位思考。

評價來源于客戶,客戶對產(chǎn)品有哪些方面的感知呢?我們可以閉上眼睛,幻想自己購買了這款辣椒醬。

接著進(jìn)入第二步,基于換位的邏輯拆解,這里可以按照模擬購物流程的邏輯來拆解:

首先,李子柒本身有非常強的IP光環(huán),大家在選購時或多或少是慕名而來。所以,在購買決策時,到底有多大比例是沖著李子柒來的?

Next,在沒收到貨前,影響體驗的肯定是物流,付款到收貨用了幾天?派送員態(tài)度怎么樣,送貨上門了嗎?

收到貨后,使用之前,體感最強的則是包裝。外包裝有沒有破損?有沒有變形?產(chǎn)品包裝是精致還是粗糙?

接下來是產(chǎn)品體驗,拿辣椒醬來說,日期是否新鮮?牛肉用戶是否喜歡?到底好不好吃?

吃完之后,我們建立起了對產(chǎn)品的立體感知——性價比。我花錢買這個產(chǎn)品到底值不值?這個價位是貴了還是便宜?實惠不實惠?

品牌、物流、包裝、產(chǎn)品(日期、口味)和性價比五大天王鋒芒初現(xiàn),我們下一步需要量化消費者對于每個方面的感知。

03 Python實現(xiàn)

對于評價的拆解和量化,這里介紹一種簡單粗暴的方式,按標(biāo)點把整條評論拆分成零散的模塊,再設(shè)置一系列預(yù)置詞來遍歷。

注:再次強調(diào)我們這篇內(nèi)容的主題是“如何基于最基礎(chǔ)的技術(shù),做進(jìn)一步的分析,這里假設(shè)我們只會最基礎(chǔ)的python語法和pandas。

有同學(xué)會問“為什么不用分詞”!此問可謂正中我懷。不過,我把這個問題當(dāng)作開放式思考題留給大家——如果用分詞,如何實現(xiàn)同樣的效果,以及有什么優(yōu)缺點?

言歸正傳,我們先看看實戰(zhàn)爬取的評論數(shù)據(jù),一共1794條:

把每條評論按照標(biāo)點拆分成短句,為了省事,用了簡單的正則拆分:

我們發(fā)現(xiàn),就算是比較長段的評論,也只是涉及到品牌、物流、包裝、產(chǎn)品和性價比的部分方面,所以,我們依次去遍歷匹配,看短句中有沒有相關(guān)的內(nèi)容,沒有就跳過,有的話再判斷具體情緒。

以物流為例,當(dāng)短句中出現(xiàn)“物流”、“快遞”、“配送”、“取貨”等關(guān)鍵詞,大體可以判定這個短句和物流相關(guān)。

接著,再在短句中尋找代表情緒的詞匯,正面的像“快”、“不錯”、“棒”、“滿意”、“迅速”;負(fù)面的“慢”、“龜速”、“暴力”、“差”等。

在我們預(yù)設(shè)詞的基礎(chǔ)上進(jìn)行兩次遍歷匹配,大體可以判斷這句話是不是和物流相關(guān),以及客戶對物流的看法是正面還是負(fù)面:

為方便理解,用了灰常丑陋的語法來一對一實現(xiàn)判斷。包裝、產(chǎn)品和性價比等其他模塊的判斷,也是沿用上述邏輯,只是在預(yù)設(shè)詞上有所差異,部分代碼如下:

defjudge_comment(df,result): judges=pd.DataFrame(np.zeros(13*len(df)).reshape(len(df),13), columns=['品牌','物流正面','物流負(fù)面','包裝正面','包裝負(fù)面','原料正面', '原料負(fù)面','口感正面','口感負(fù)面','日期正面','日期負(fù)面', '性價比正面','性價比負(fù)面']) foriinrange(len(result)): words=result[i] forwordinwords: #李子柒的產(chǎn)品具有強IP屬性,基本都是正面評價,這里不統(tǒng)計情緒,只統(tǒng)計提及次數(shù) if'李子柒'inwordor'子柒'inwordor'小柒'inwordor'李子七'inword or'小七'inword: judges.iloc[i]['品牌']=1 #先判斷是不是物流相關(guān)的 if'物流'inwordor'快遞'inwordor'配送'inwordor'取貨'inword: #再判斷是正面還是負(fù)面情感 if'好'inwordor'不錯'inwordor'棒'inwordor'滿意'inwordor'迅速'inword: judges.iloc[i]['物流正面']=1 elif'慢'inwordor'龜速'inwordor'暴力'inwordor'差'inword: judges.iloc[i]['物流負(fù)面']=1 #判斷是否包裝相關(guān) if'包裝'inwordor'盒子'inwordor'袋子'inwordor'外觀'inword: if'高端'inwordor'大氣'inwordor'還行'inwordor'完整'inwordor'好'inwordor '嚴(yán)實'inwordor'緊'inword: judges.iloc[i]['包裝正面']=1 elif'破'inwordor'破損'inwordor'癟'inwordor'簡陋'inword: judges.iloc[i]['包裝負(fù)面']=1 #產(chǎn)品 #產(chǎn)品原料是牛肉為主,且評價大多會提到牛肉,因此我們把這個單獨拎出來分析 if'肉'inword: if'大'inwordor'多'inwordor'足'inwordor'香'inwordor'才'inword: judges.iloc[i]['原料正面']=1 elif'小'inwordor'少'inwordor'沒'inword: judges.iloc[i]['原料負(fù)面']=1 #口感的情緒 if'口味'inwordor'味道'inwordor'口感'inwordor'吃起來'inword: if'不錯'inwordor'好'inwordor'棒'inwordor'鮮'inwordor '可以'inwordor'喜歡'inwordor'符合'inword: judges.iloc[i]['口感正面']=1 elif'不好'inwordor'不行'inwordor'不鮮'inwordor '太爛'inword: judges.iloc[i]['口感負(fù)面']=1 #口感方面,有些是不需要出現(xiàn)前置詞,消費者直接評價好吃難吃的,例如: if'難吃'inwordor'不好吃'inword: judges.iloc[i]['口感負(fù)面']=1 elif'好吃'inwordor'香'inword: judges.iloc[i]['口感正面']=1 #日期是不是新鮮 if'日期'inwordor'時間'inwordor'保質(zhì)期'inword: if'新鮮'inword: judges.iloc[i]['日期正面']=1 elif'久'inwordor'長'inword: judges.iloc[i]['日期負(fù)面']=1 elif'過期'inword: judges.iloc[i]['日期負(fù)面']=1 #性價比 if'劃算'inwordor'便宜'inwordor'賺了'inwordor'囤貨'inwordor'超值'inwordor '太值'inwordor'物美價廉'inwordor'實惠'inwordor'性價比高'inwordor'不貴'inword: judges.iloc[i]['性價比正面']=1 elif'貴'inwordor'不值'inwordor'虧了'inwordor'不劃算'inwordor'不便宜'inword: judges.iloc[i]['性價比負(fù)面']=1 final_result=pd.concat([df,judges],axis=1) returnfinal_result

運行一下,結(jié)果畢現(xiàn):

第一條評價,很明顯的說快遞暴力,對應(yīng)“物流負(fù)面”計了一分。

第二條評價,全面夸贊,提到了品牌,和正面的物流、口感信息。

第三條評價,粉絲表白,先說品牌,再夸口感。

看起來還不賴,下面我們對結(jié)果數(shù)據(jù)展開分析。

04 結(jié)果分析

我們先對結(jié)果做個匯總:

一共爬了1794條評論,評論中有提及到我們關(guān)注點的有1937次(之所以用次,是因為一條評論中可能涉及到多個方面)。粗略一瞥,口感和原料占比較高,畫個圖更細(xì)致的看看。

看來,辣椒醬的口感(好不好吃)是客戶最最最關(guān)注的點,沒有之一,占比高達(dá)57.98%,領(lǐng)先其他類別N個身位。

慢隨其后的,是原料、品牌、性價比和包裝,而物流和日期則鮮有提及,消費者貌似不太關(guān)注,或者說目前基本滿足要求。

那不同類別正負(fù)面評價占比是怎么樣的呢?

整體來看,主流評論以好評為主,其中口感、品牌(這個地方其實沒有細(xì)分)、包裝以正面評價占絕對主導(dǎo)。

原料和性價比,負(fù)面評價占比分別是14%和38%,而物流和日期由于本身占比太少,參考性不強。

作為一個分析師,我們從原料、性價比負(fù)面評價占比中看到了深挖的機會。

原料負(fù)面評價是單純的在吐槽原材料嗎?

初步篩選之后,發(fā)現(xiàn)事情并沒有那么簡單。

原料負(fù)面評價共出現(xiàn)了53次,但里面有24次給了口感正面的評價,甚至還有8次原料正面評價!羅生門嗎?

這8次即正面又負(fù)面的原料評價,其實是揭了我們在預(yù)置詞方面的不嚴(yán)謹(jǐn),前面判斷牛肉相關(guān)的短句,“小”就是負(fù)面,“大”就是正面,有些絕對。

而判斷準(zhǔn)確的原料差評中,雖然有一半說味道不錯,但還是不留情面的吐槽了牛肉粒之小,之少,甚至還有因此覺得被騙。

如何讓牛肉粒在體感上獲取更多的好評,是應(yīng)該在產(chǎn)品傳播層做期望控制的宣導(dǎo)?還是在產(chǎn)品層增加牛肉的“肉感”?需要結(jié)合具體業(yè)務(wù)進(jìn)一步探究。

性價比呢?

性價比相關(guān)負(fù)面評價共58次,負(fù)面情緒占性價比相關(guān)的38%。這些負(fù)面評價消費者大多數(shù)認(rèn)為價格偏貴,不劃算,還有一部分提到了通過直播渠道購買價格相對便宜,但日常價格難以接受。

坦白講,這款辣醬的價格在線上確實屬于高端價位,而價格體系是一個比較復(fù)雜的場景,這里暫不展開分析。

但是對于這部分認(rèn)為性價比不符預(yù)期的客戶,是應(yīng)該因此反推產(chǎn)品價格,還是把他們打上“價格敏感的標(biāo)簽”,等大促活動喚醒收割,這是兩條可以考慮并推進(jìn)的道路。

物流和日期提及太少,不具備參考性,但為了不那么虎頭蛇尾,我們還是順手看一眼物流負(fù)面評價:

果然,物流是一項必備需求,基本滿足預(yù)期的話消費者并不會主動提及,沒達(dá)預(yù)期則大概率會雷霆震怒。而物流暴力、速度太慢是兩個永恒的槽點。

至此,我們基于看起來簡單的評價數(shù)據(jù),用簡單淺白的方式,做了細(xì)致的拆分,并通過拆分更進(jìn)一步的量化和分析,向深淵,哦不,向深入邁進(jìn)了那么一丟丟。

總結(jié)

文中涉及到的代碼,主要是拋磚引玉,大家還可以結(jié)合實際,做更精細(xì)的梳理和判斷。在整個分析過程中,去思考如何更深入的分析,如何明確分析方向,如何通過換位思考和流程拆解,把大目標(biāo)拆成可以分析的小目標(biāo),并最終落地,則需要在實踐中反復(fù)磨練,與君共勉!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模塊
    +關(guān)注

    關(guān)注

    7

    文章

    2838

    瀏覽量

    53313
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4784

    瀏覽量

    98095
  • python
    +關(guān)注

    關(guān)注

    57

    文章

    4877

    瀏覽量

    90082

原文標(biāo)題:我用python分析了李子柒的辣醬真的好吃嗎?

文章出處:【微信號:AI_shequ,微信公眾號:人工智能愛好者社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    沒有專利的opencv-python 版本

    專利風(fēng)險,僅需避開 opencv-contrib-python 的 nonfree 模塊(或直接無頭版)。 如果你的場景需要特定功能(如特征提取、目標(biāo)跟蹤),可以告訴我具體需求,我?guī)湍阃扑]對應(yīng)的無專利 API 和代碼示例~
    發(fā)表于 12-13 12:37

    Python中借助NVIDIA CUDA Tile簡化GPU編程

    NVIDIA CUDA 13.1 版本新增基于 Tile 的GPU 編程模式。它是自 CUDA 發(fā)明以來 GPU 編程最核心的更新之一。借助 GPU tile kernels,可以比 SIMT
    的頭像 發(fā)表于 12-13 10:12 ?1209次閱讀
    在<b class='flag-5'>Python</b>中借助NVIDIA CUDA Tile簡化GPU編程

    Termux中調(diào)試圣誕樹Python代碼

    python --version 如果輸出Python 3.x.x(比如3.11.4),說明安裝成功。 二、代碼編寫(兩種方式可選) 方式1:Termux自帶編輯器(nano)(新手推薦) 創(chuàng)建并編輯
    發(fā)表于 12-09 09:02

    LABVIEW 2023 Q1調(diào)用python后一直報錯1671

    LABVIEW 2023Q1調(diào)用python后一直報錯1671報錯信息:PythonNode_AddTwoDoubles.vi中的打開Python會話Python returned
    發(fā)表于 11-12 09:51

    Python調(diào)用API教程

    兩個不同系統(tǒng)之間的信息交互。在這篇文章中,我們將詳細(xì)介紹Python調(diào)用API的方法和技巧。 一、Requests庫發(fā)送HTTP請求 使用Python調(diào)用API的第一步是發(fā)送HTTP請求,通常
    的頭像 發(fā)表于 11-03 09:15 ?911次閱讀

    Python 給 Amazon 做“全身 CT”——可量產(chǎn)、可擴展的商品詳情爬蟲實戰(zhàn)

    一、技術(shù)選型:為什么選 Python 而不是 Java? 結(jié)論: “調(diào)研階段 Python,上線后如果 QPS 爆表再考慮 Java 重構(gòu)?!?二、整體架構(gòu)速覽(3 分鐘看懂) 三、開發(fā)前準(zhǔn)備(5
    的頭像 發(fā)表于 10-21 16:59 ?527次閱讀
    <b class='flag-5'>用</b> <b class='flag-5'>Python</b> 給 Amazon 做“全身 CT”——可量產(chǎn)、可擴展的商品詳情爬蟲實戰(zhàn)

    Pico Technology發(fā)布Python軟件包pyPicoSDK

    近日,全球領(lǐng)先的基于 PC 的儀器供應(yīng)商Pico Technology 官方發(fā)布 pyPicoSDK,這是一款旨在簡化 PicoScopes 應(yīng)用的 Python 軟件包。pyPicoSDK 在
    的頭像 發(fā)表于 09-29 15:03 ?959次閱讀

    termux調(diào)試python猜數(shù)字游戲

    termux做一個猜數(shù)字游戲 下面是在Termux中創(chuàng)建猜數(shù)字游戲的步驟及完整實現(xiàn)方案,結(jié)合Python實現(xiàn)(最適配Termux環(huán)境): ? 一、環(huán)境準(zhǔn)備(Termux基礎(chǔ)配置) 1.
    發(fā)表于 08-29 17:15

    termux如何搭建python游戲

    VS Code編輯 - 版本控制:`git`管理代碼,同步至GitHub/Gitee - 任務(wù)調(diào)度:通過`crontab`設(shè)置定時測試(如每分鐘運行游戲腳本:`*/1 * * * * python
    發(fā)表于 08-29 07:06

    快手電商 API 實現(xiàn)快手小店商品評論情感分析

    ? 在電商運營中,商品評論是用戶反饋的核心來源,它能直接影響購買決策和產(chǎn)品優(yōu)化。通過情感分析,商家可以自動識別評論中的正面、負(fù)面或中性情緒,從而快速響應(yīng)問題、提升服務(wù)質(zhì)量??焓蛛娚唐脚_提供開放
    的頭像 發(fā)表于 08-26 15:08 ?589次閱讀
    <b class='flag-5'>用</b>快手電商 API 實現(xiàn)快手小店商品評論情感<b class='flag-5'>分析</b>

    python app不能運行怎么解決?

    我使用helloword的模板,上傳IG502,但不能運行,請大神幫忙。系統(tǒng)日志如下:sntpc[1226]: ntp request error: 113, No route to host
    發(fā)表于 08-06 06:27

    跟老齊學(xué)Python:從入門到精通

    礎(chǔ)的學(xué)習(xí)者介紹一門時下比較流行、并且用途比較廣泛的編程語言,所以,本書讀起來不晦澀,并且在其中穿插很多貌似與Python 編程無關(guān),但與學(xué)習(xí)者未來程序員職業(yè)生涯有關(guān)的內(nèi)容。 獲取完整文檔資料可下載附件哦?。。?! 如果內(nèi)容有幫助可以關(guān)注、點贊、評論支持一下哦~
    發(fā)表于 06-03 16:10

    python入門圣經(jīng)-高清電子書(建議下載)

    此資料內(nèi)容是一本針對所有層次的Python 讀者而作的Python 入門電子書。 全書分兩部分:第一部分介紹Python 編程所必須了解的基本概念,包括matplotlib、NumP
    發(fā)表于 04-10 16:53

    ?如何在虛擬環(huán)境中使用 Python,提升你的開發(fā)體驗~

    RaspberryPiOS預(yù)裝了Python,你需要使用其虛擬環(huán)境來安裝包。今天出版的最新一期《TheMagPi》雜志刊登了我們文檔負(fù)責(zé)人NateContino撰寫的一篇實用教程,幫助你入門
    的頭像 發(fā)表于 03-25 09:34 ?821次閱讀
    ?如何在虛擬環(huán)境中使用 <b class='flag-5'>Python</b>,提升你的開發(fā)體驗~

    零基礎(chǔ)入門:如何在樹莓派上編寫和運行Python程序?

    在這篇文章中,我將為你簡要介紹Python程序是什么、Python程序可以用來做什么,以及如何在RaspberryPi上編寫和運行一個簡單的Python程序。什么是Python程序?
    的頭像 發(fā)表于 03-25 09:27 ?2065次閱讀
    零基礎(chǔ)入門:如何在樹莓派上編寫和運行<b class='flag-5'>Python</b>程序?