chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何構(gòu)建數(shù)據(jù)科學(xué)項(xiàng)目才能更高效?

物聯(lián)網(wǎng)之聲 ? 來(lái)源:未知 ? 作者:胡薇 ? 2018-09-06 09:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數(shù)據(jù)科學(xué)是什么?數(shù)據(jù)分析?機(jī)器學(xué)習(xí)?還是數(shù)據(jù)工程?答案可能有很多,但也許只有直接與某個(gè)公司的數(shù)據(jù)科學(xué)家交流,才能了解該公司是如何看待數(shù)據(jù)科學(xué)的。由Netflix舉辦的第三屆聚焦數(shù)據(jù)科學(xué)的WiBD研討會(huì),為我們所有人了解Netflix的數(shù)據(jù)科學(xué)故事提供了絕佳機(jī)會(huì),一起來(lái)看看吧!

數(shù)據(jù)科學(xué)是一個(gè)非常抽象的概念。有些人認(rèn)為它是數(shù)據(jù)分析,也有一些人認(rèn)為它是機(jī)器學(xué)習(xí),還有些認(rèn)為它帶有一些數(shù)據(jù)工程的味道。

業(yè)界對(duì)數(shù)據(jù)科學(xué)這一概念難以達(dá)成一致有很多原因,其中一點(diǎn)就是,現(xiàn)在大范圍內(nèi)的崗位都可能涉及數(shù)據(jù)科學(xué),并且這些崗位的職責(zé)都不盡相同。

此外,不同公司之間的細(xì)微差別,甚至是同一公司內(nèi)部的不同團(tuán)隊(duì)之間的細(xì)微差別都會(huì)導(dǎo)致對(duì)數(shù)據(jù)科學(xué)的理解不同。因此,只有直接與某個(gè)公司的數(shù)據(jù)科學(xué)家交流才能了解該公司是如何看待數(shù)據(jù)科學(xué)的。

信息不對(duì)稱(chēng)是一個(gè)令人遺憾的事實(shí),它阻礙了許多人追尋數(shù)據(jù)科學(xué)以及數(shù)據(jù)工程這一職業(yè)的道路。

如果我們投入越多的工作時(shí)間來(lái)解決這一棘手的問(wèn)題,那么這一阻礙也就能越早被突破。關(guān)于這一點(diǎn),推薦一個(gè)社會(huì)教育企業(yè)——HasBrain,該企業(yè)致力于填補(bǔ)信息缺口并且為想要學(xué)習(xí)并找到通往數(shù)據(jù)科學(xué)和數(shù)據(jù)工程道路的人提供幫助。

構(gòu)建數(shù)據(jù)科學(xué)項(xiàng)目

頭腦風(fēng)暴活動(dòng)

現(xiàn)實(shí)世界的數(shù)據(jù)科學(xué)項(xiàng)目與理論上的有何不同,如何構(gòu)建數(shù)據(jù)科學(xué)項(xiàng)目才能更高效?Becky在研討會(huì)上展示的數(shù)據(jù)科學(xué)項(xiàng)目體系對(duì)該問(wèn)題總結(jié)得非常好。

以下是Becky的總結(jié)

步驟一:從了解業(yè)務(wù)問(wèn)題開(kāi)始

下面的幻燈片,是Becky就如何定義成功而列出的一系列業(yè)務(wù)問(wèn)題。如果你想要很好地證明你的概念,你需要一開(kāi)始要以一個(gè)簡(jiǎn)單模型作為基準(zhǔn),然后從增量改善(incremental improvement)的角度來(lái)評(píng)估模型的價(jià)值。

否則,你會(huì)一直困擾于75%的準(zhǔn)確度是否足夠好這樣的問(wèn)題。擁有物理學(xué)博士學(xué)位的Becky也提到,專(zhuān)業(yè)學(xué)者總是會(huì)仔細(xì)檢查到最后那20%,以確保結(jié)果是無(wú)懈可擊的。所以,如果博士生們想要成為數(shù)據(jù)科學(xué)家,這一點(diǎn)是需要特別注意的。

步驟二:制定技術(shù)計(jì)劃

除了下面的幻燈片中列出的細(xì)節(jié),Becky還強(qiáng)調(diào)了溝通的重要性,同時(shí)還提出要站在利益相關(guān)者的角度思考。因?yàn)槔嫦嚓P(guān)者最關(guān)心的未必是機(jī)器學(xué)習(xí)的誤差測(cè)度,所以要學(xué)會(huì)如何將業(yè)務(wù)目標(biāo)轉(zhuǎn)化為價(jià)值優(yōu)化問(wèn)題,這一點(diǎn)極為關(guān)鍵。

相較于“重新發(fā)明輪子”,弄明白和學(xué)會(huì)使用現(xiàn)有的技術(shù)可以為我們節(jié)省很多時(shí)間?,F(xiàn)有的用于監(jiān)督學(xué)習(xí)的技術(shù),如預(yù)測(cè)建模或分類(lèi),都有很好的文檔記錄。

然而,在相對(duì)更先進(jìn)以及更專(zhuān)業(yè)的機(jī)器學(xué)習(xí)領(lǐng)域(例如NLP和圖像分類(lèi)),新文章不斷地發(fā)表,技術(shù)不斷地更新。因此,即時(shí)了解最新和最好的研究論文是數(shù)據(jù)科學(xué)家們需要牢記的黃金準(zhǔn)則。

步驟三:對(duì)概念進(jìn)行初步驗(yàn)證 -> 不斷迭代/驗(yàn)證直到成功或是無(wú)法再繼續(xù) -> 向利益相關(guān)者傳達(dá)結(jié)果

如果你對(duì)工作流程甚至是數(shù)據(jù)科學(xué)家使用的工具或庫(kù)還有任何的疑問(wèn),都可以參考Becky在項(xiàng)目構(gòu)建中對(duì)“doing the project”這部分的詳細(xì)描述。

步驟四:模型產(chǎn)品化

如果一些數(shù)據(jù)科學(xué)家告訴你必須要學(xué)會(huì)編寫(xiě)產(chǎn)品級(jí)代碼,那么,他們可能需要獨(dú)立處理模型產(chǎn)品化,而不是交給機(jī)器學(xué)習(xí)工程師或是軟件工程師。

模型產(chǎn)品化本質(zhì)上就是指不要在現(xiàn)有的模型輸出上停滯不前。你的結(jié)果輸出是產(chǎn)品的一部分,并且會(huì)改變用戶(hù)的實(shí)際體驗(yàn)。

你的代碼也會(huì)成為更大的產(chǎn)品代碼庫(kù)的一部分,例如,如果你歸類(lèi)用戶(hù)是否會(huì)在未來(lái)兩周內(nèi)流失,被預(yù)測(cè)為會(huì)流失的用戶(hù)和被預(yù)測(cè)為不會(huì)流失的用戶(hù)可能會(huì)有不同的用戶(hù)界面(UI)。

實(shí)際上,你是為其他團(tuán)隊(duì)創(chuàng)建了一個(gè)API來(lái)調(diào)用你的模型并獲得模型輸出。你可能需要重構(gòu)你的代碼,此時(shí),只要API沒(méi)有中斷并且終端用戶(hù)體驗(yàn)是無(wú)縫的,你就可以不斷地升級(jí)模型。

Becky自學(xué)了工作中要用到的軟件工程方面的知識(shí),學(xué)會(huì)使代碼模塊化,以實(shí)現(xiàn)可重復(fù)性并提高算法效率。甚至有時(shí),可能會(huì)參與到軟件工程師或是數(shù)據(jù)工程師的團(tuán)隊(duì)中。這不僅取決于工作的復(fù)雜性,還取決于服務(wù)等級(jí)協(xié)議(Service Level Agreement, SLA)。例如,如果你的API需要一直處于運(yùn)行狀態(tài),則可能需要更廣泛的代碼審查或軟件工程團(tuán)隊(duì)的直接參與。

溝通與問(wèn)題解決

在講述了數(shù)據(jù)科學(xué)項(xiàng)目的構(gòu)建之后,Becky更多地談到了有效溝通和解決問(wèn)題的技巧的重要性。如何向非技術(shù)人員的利益相關(guān)者們解釋復(fù)雜的數(shù)據(jù)科學(xué)概念,是獲得他們買(mǎi)進(jìn)支持的重要環(huán)節(jié)。

Becky將她在攻讀物理學(xué)博士學(xué)位期間學(xué)會(huì)的一項(xiàng)技能運(yùn)用于此——將復(fù)雜問(wèn)題分解成小塊并逐一解決。類(lèi)似地,她就將利益相關(guān)者的高階問(wèn)題(high level question)進(jìn)行分解,并找出數(shù)據(jù)科學(xué)項(xiàng)目可以提供價(jià)值的地方。

如果沒(méi)有數(shù)據(jù)科學(xué)家的工作經(jīng)驗(yàn),想要?jiǎng)偃芜@部分工作是不容易的,因?yàn)榘↘aggle項(xiàng)目在內(nèi)的大多數(shù)實(shí)踐項(xiàng)目都是從已經(jīng)定義明確的數(shù)據(jù)科學(xué)問(wèn)題開(kāi)始的。Becky談到,這些軟技能其實(shí)是從經(jīng)驗(yàn)中獲得的,當(dāng)然也可以從有效的反饋中學(xué)習(xí)。

與此同時(shí),她也會(huì)閱讀一些基礎(chǔ)書(shū)籍來(lái)熟悉商業(yè)中的通用概念和術(shù)語(yǔ)。另外,許多其他資深的數(shù)據(jù)科學(xué)家們都建議,如果想要進(jìn)一步發(fā)展自己的商業(yè)頭腦,則需要閱讀一些產(chǎn)品管理的書(shū)籍和文章。

實(shí)踐練習(xí)

這個(gè)項(xiàng)目使用WDI數(shù)據(jù)來(lái)預(yù)測(cè)業(yè)務(wù)啟動(dòng)成本,非常適合初學(xué)者。如果你是機(jī)器學(xué)習(xí)新人,或是剛剛完成一些監(jiān)督學(xué)習(xí)的網(wǎng)絡(luò)基礎(chǔ)課程,這將會(huì)是一個(gè)很好的額外練習(xí)機(jī)會(huì)。

現(xiàn)在,讓我們回到之前談?wù)摰膯?wèn)題解決和溝通方面,Becky就此提出了一個(gè)業(yè)務(wù)問(wèn)題:“在不同的國(guó)家開(kāi)展業(yè)務(wù)都有多難?”她還確立了一個(gè)項(xiàng)目目標(biāo),即預(yù)測(cè)在不同國(guó)家開(kāi)展業(yè)務(wù)的成本。

如果這是一個(gè)實(shí)際的工作項(xiàng)目,對(duì)于開(kāi)展業(yè)務(wù)的便利性來(lái)說(shuō),這些預(yù)測(cè)成本要如何成為整體評(píng)估決策中的一部分,我想,她可能需要與利益相關(guān)者就此問(wèn)題達(dá)成一致。

最后,希望這個(gè)總結(jié)對(duì)你有幫助。祝所有數(shù)據(jù)科學(xué)愛(ài)好者們好運(yùn)!并再次感謝Netflix團(tuán)隊(duì)的慷慨分享!另有演示的幻燈片和錄像可供使用。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:如何成為一名數(shù)據(jù)科學(xué)家?聽(tīng)聽(tīng)來(lái)自Netfix的老司機(jī)怎么說(shuō)

文章出處:【微信號(hào):szwlw26059696,微信公眾號(hào):物聯(lián)網(wǎng)之聲】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    物聯(lián)網(wǎng)網(wǎng)關(guān)實(shí)現(xiàn)與上位機(jī)雙向數(shù)據(jù)通信的配置指南

    一、項(xiàng)目背景 隨著工業(yè)數(shù)字化轉(zhuǎn)型的不斷深入,企業(yè)對(duì)現(xiàn)場(chǎng)設(shè)備數(shù)據(jù)的實(shí)時(shí)采集、遠(yuǎn)程傳輸與集中管理提出了更高要求。特別是在分布式控制系統(tǒng)中,如何實(shí)現(xiàn)本地與遠(yuǎn)程系統(tǒng)之間的數(shù)據(jù)互通,成為
    的頭像 發(fā)表于 09-22 11:06 ?197次閱讀
    物聯(lián)網(wǎng)網(wǎng)關(guān)實(shí)現(xiàn)與上位機(jī)雙向<b class='flag-5'>數(shù)據(jù)</b>通信的配置指南

    線(xiàn)上研討會(huì) | @9/23 Tinyswitch5不Tiny,擁有更高效、更高瓦更精簡(jiǎn)的變頻反馳式架構(gòu)

    9月23日,大聯(lián)大詮鼎集團(tuán)攜手PI將做客大大通直播間帶來(lái)“Tinyswitch5不Tiny,擁有更高效、更高瓦、更精簡(jiǎn)的變頻反馳式架構(gòu)”主題研討會(huì),邀您了解TinySwitch-5:更高效、更強(qiáng)
    的頭像 發(fā)表于 09-18 08:18 ?303次閱讀
    線(xiàn)上研討會(huì) | @9/23 Tinyswitch5不Tiny,擁有<b class='flag-5'>更高效</b>、<b class='flag-5'>更高</b>瓦更精簡(jiǎn)的變頻反馳式架構(gòu)

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

    科學(xué)發(fā)現(xiàn)的重要組成部分。 實(shí)驗(yàn)科學(xué):通過(guò)觀(guān)察和實(shí)驗(yàn)來(lái)驗(yàn)證假說(shuō) 理論科學(xué):通過(guò)構(gòu)建邏輯框架來(lái)解釋觀(guān)察到的現(xiàn)象 模型科學(xué):通過(guò)數(shù)學(xué)模型來(lái)描述和
    發(fā)表于 09-17 11:45

    【「Yocto項(xiàng)目實(shí)戰(zhàn)教程:高效定制嵌入式Linux系統(tǒng)」閱讀體驗(yàn)】+基礎(chǔ)概念學(xué)習(xí)理解

    是 Yocto 項(xiàng)目的核心部分之一,書(shū)中對(duì)元數(shù)據(jù)的概念、文件、語(yǔ)法以及菜譜和層的相關(guān)內(nèi)容進(jìn)行了詳細(xì)闡述。通過(guò)學(xué)習(xí)這部分內(nèi)容,我了解到元數(shù)據(jù)在 Yocto 項(xiàng)目中的重要性,它定義了
    發(fā)表于 08-04 22:29

    【「Yocto項(xiàng)目實(shí)戰(zhàn)教程:高效定制嵌入式Linux系統(tǒng)」閱讀體驗(yàn)】01總結(jié)與實(shí)踐記錄

    還是比較合理的,分為了基礎(chǔ)普及和項(xiàng)目實(shí)戰(zhàn)環(huán)節(jié),基礎(chǔ)普及里也有跟linux嵌入式構(gòu)建相關(guān)的基礎(chǔ),也有Yocto的基礎(chǔ)內(nèi)容,對(duì)這塊感興趣的也可以了解了解。 個(gè)人比較感興趣的是從樹(shù)莓派那里的實(shí)戰(zhàn)內(nèi)容,對(duì)于
    發(fā)表于 06-30 11:38

    【書(shū)籍評(píng)測(cè)活動(dòng)NO.61】Yocto項(xiàng)目實(shí)戰(zhàn)教程:高效定制嵌入式Linux系統(tǒng)

    構(gòu)建環(huán)境和性能要求。根據(jù) Yocto 項(xiàng)目的官方說(shuō)明,主要挑戰(zhàn)可歸納為三大類(lèi): 學(xué)習(xí)曲線(xiàn)與理解成本 工作流與構(gòu)建環(huán)境的復(fù)雜性 初始構(gòu)建時(shí)間與性能問(wèn)題 為了幫助大家
    發(fā)表于 05-21 10:00

    工業(yè)數(shù)據(jù)采集網(wǎng)關(guān)選型全攻略:構(gòu)建智能工廠(chǎng)的數(shù)字橋梁

    在智能制造與工業(yè)互聯(lián)網(wǎng)深度融合的今天,工業(yè)數(shù)據(jù)采集網(wǎng)關(guān)作為連接物理設(shè)備與數(shù)字世界的核心樞紐,其選型直接影響企業(yè)數(shù)字化轉(zhuǎn)型的成效。本文將從六大核心維度解析如何科學(xué)選擇適配的工業(yè)網(wǎng)關(guān),助您構(gòu)建穩(wěn)定、
    的頭像 發(fā)表于 04-12 11:13 ?526次閱讀

    光伏電站運(yùn)維系統(tǒng)讓太陽(yáng)能發(fā)電更高效

    ?????? 光伏電站運(yùn)維系統(tǒng)讓太陽(yáng)能發(fā)電更高效 ?????? 光伏電站運(yùn)維系統(tǒng)是一套幫助管理太陽(yáng)能發(fā)電站的技術(shù)工具,它的作用是讓電站運(yùn)行更穩(wěn)定、發(fā)電更高效,同時(shí)減少人工維護(hù)的成本和麻煩。以下是它
    的頭像 發(fā)表于 03-28 16:22 ?613次閱讀
    光伏電站運(yùn)維系統(tǒng)讓太陽(yáng)能發(fā)電<b class='flag-5'>更高效</b>

    高效流量復(fù)制匯聚,構(gòu)建自主可控的網(wǎng)絡(luò)安全環(huán)境

    隨著大數(shù)據(jù)監(jiān)測(cè)、流量分析以及網(wǎng)絡(luò)安全監(jiān)管等核心業(yè)務(wù)需求的日益增長(zhǎng),網(wǎng)絡(luò)環(huán)境對(duì)高性能、高可靠性的流量監(jiān)控和分析提出了更高的要求。流量復(fù)制匯聚平臺(tái)憑借其卓越的技術(shù)特性和靈活的應(yīng)用方案,不僅幫助用戶(hù)實(shí)現(xiàn)了對(duì)網(wǎng)絡(luò)流量的精準(zhǔn)控制和高效處理
    的頭像 發(fā)表于 03-10 14:29 ?675次閱讀
    <b class='flag-5'>高效</b>流量復(fù)制匯聚,<b class='flag-5'>構(gòu)建</b>自主可控的網(wǎng)絡(luò)安全環(huán)境

    JBD助力日本科學(xué)技術(shù)振興機(jī)構(gòu)資助的醫(yī)用AR 眼鏡開(kāi)發(fā)項(xiàng)目

    ? 近日,JBD宣布為日本科學(xué)技術(shù)振興機(jī)構(gòu)(JST)資助的戰(zhàn)略創(chuàng)意研究推進(jìn)項(xiàng)目CREST中的醫(yī)用AR眼鏡開(kāi)發(fā)項(xiàng)目提供微顯示模組產(chǎn)品。該項(xiàng)目由東京科學(xué)
    發(fā)表于 02-05 17:48 ?576次閱讀
    JBD助力日本<b class='flag-5'>科學(xué)</b>技術(shù)振興機(jī)構(gòu)資助的醫(yī)用AR 眼鏡開(kāi)發(fā)<b class='flag-5'>項(xiàng)目</b>

    NVIDIA RAPIDS cuDF如何賦能AI加速數(shù)據(jù)科學(xué)

    隨著 AI 正幫助各行各業(yè)推動(dòng)創(chuàng)新和提高效率,基于海量的高質(zhì)量數(shù)據(jù)來(lái)訓(xùn)練各種模型是充分發(fā)揮 AI 應(yīng)用潛力的必經(jīng)之路,正因如此,數(shù)據(jù)科學(xué)家們面臨著日益增長(zhǎng)的工作負(fù)載需求,迫切需求尋找
    的頭像 發(fā)表于 01-24 09:26 ?860次閱讀

    解碼TW6501:ONFI 5.0協(xié)議如何令存儲(chǔ)通訊更高效

    解碼TW6501:ONFI 5.0協(xié)議如何令存儲(chǔ)通訊更高效
    的頭像 發(fā)表于 01-21 14:51 ?695次閱讀
    解碼TW6501:ONFI 5.0協(xié)議如何令存儲(chǔ)通訊<b class='flag-5'>更高效</b>

    AI干貨補(bǔ)給站04 | 工業(yè)AI視覺(jué)檢測(cè)項(xiàng)目實(shí)施第三步:模型構(gòu)建

    AI視覺(jué)檢測(cè)項(xiàng)目入門(mén)指南》系列文章。該系列文章將AI視覺(jué)檢測(cè)項(xiàng)目的實(shí)施過(guò)程細(xì)分為制定計(jì)劃、數(shù)據(jù)收集、模型構(gòu)建以及工廠(chǎng)驗(yàn)收四個(gè)階段,旨在通過(guò)分享各階段的實(shí)施經(jīng)驗(yàn)與注意
    的頭像 發(fā)表于 11-29 01:04 ?897次閱讀
    AI干貨補(bǔ)給站04 | 工業(yè)AI視覺(jué)檢測(cè)<b class='flag-5'>項(xiàng)目</b>實(shí)施第三步:模型<b class='flag-5'>構(gòu)建</b>

    數(shù)據(jù)要素時(shí)代下構(gòu)建高效數(shù)據(jù)治理能力的策略

    數(shù)據(jù)驅(qū)動(dòng)的商業(yè)時(shí)代,高效數(shù)據(jù)治理平臺(tái)已成為企業(yè)成功的核心要素。盡管市場(chǎng)上已有眾多成熟的數(shù)據(jù)治理產(chǎn)品,但許多客戶(hù)仍反映未能充分實(shí)現(xiàn)數(shù)據(jù)治理
    的頭像 發(fā)表于 11-01 11:19 ?952次閱讀

    使用Python構(gòu)建高效的HTTP代理服務(wù)器

    構(gòu)建一個(gè)高效的HTTP代理服務(wù)器在Python中涉及多個(gè)方面,包括性能優(yōu)化、并發(fā)處理、協(xié)議支持(HTTP/HTTPS)、錯(cuò)誤處理以及日志記錄等。
    的頭像 發(fā)表于 10-23 07:41 ?762次閱讀