chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

數(shù)據(jù)科學家和數(shù)據(jù)工程師能合二為一嗎?

倩倩 ? 來源:IT168 ? 2020-07-25 10:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

越來越多的企業(yè)關(guān)注AI,企業(yè)組織也意識到擁有相關(guān)人才和技能非常重要。特別是最近對AI、機器學習(ML)、非ML預(yù)測分析和“大數(shù)據(jù)”的應(yīng)用,使得數(shù)據(jù)科學家的需求有了顯著的增長,未來還將繼續(xù)。事實上,對數(shù)據(jù)科學家的巨大需求導(dǎo)致許多企業(yè)和組織出現(xiàn)了人才短缺,然而,80%的AI項目與數(shù)據(jù)準備和數(shù)據(jù)工程有關(guān),也許企業(yè)組織應(yīng)該尋找更多的數(shù)據(jù)工程師而不是數(shù)據(jù)科學家?

許多企業(yè)、供應(yīng)商和初創(chuàng)企業(yè)常常混淆數(shù)據(jù)科學家和數(shù)據(jù)工程師,雖然二者有相似之處,但是其工作內(nèi)容有很大不同,其中包含兩個迥異的技能,魚與熊掌不易兼得。

數(shù)據(jù)科學家vs數(shù)據(jù)工程師

在2000年代中期,數(shù)據(jù)科學家職位開始出現(xiàn),O’Reilly在文章中提到:“對數(shù)據(jù)科學家需求的增長是由大型互聯(lián)網(wǎng)公司驅(qū)動的。谷歌、Facebook、LinkedIn和亞馬遜都以創(chuàng)造性地使用數(shù)據(jù)而聞名:不僅僅是儲存數(shù)據(jù),還將其轉(zhuǎn)化為價值。毫無疑問,任何希望從數(shù)據(jù)中獲得價值的企業(yè)組織都在關(guān)注數(shù)據(jù)科學和數(shù)據(jù)科學家。

數(shù)據(jù)科學家起源于統(tǒng)計建模和數(shù)據(jù)分析的發(fā)展,具有高級數(shù)學和統(tǒng)計、高級分析以及越來越多的機器學習/人工智能的背景。毫無疑問,數(shù)據(jù)科學家的重點是數(shù)據(jù)科學,也就是說,如何從海量數(shù)據(jù)中提取有用的信息,以及如何將業(yè)務(wù)和科學信息需求轉(zhuǎn)化為信息和數(shù)學語言。為了能從海量信息中獲得見解,數(shù)據(jù)科學家需要掌握統(tǒng)計學、概率、數(shù)學和算法知識。這些數(shù)據(jù)科學家通常只是為了運行程序、對數(shù)據(jù)進行高級分析這類特定需要而學習編程,因此,數(shù)據(jù)科學家通常只寫最少最簡易的代碼,能完成數(shù)據(jù)科學任務(wù)以及提供干凈的數(shù)據(jù)進行分析即可。數(shù)據(jù)科學家創(chuàng)建假設(shè),對數(shù)據(jù)進行測試和分析,然后將其結(jié)果以便于查看和理解的形式呈現(xiàn)給組織中的其他人。

但是如果沒有大量的干凈數(shù)據(jù),數(shù)據(jù)科學家就無法完成自身工作。提取、清理和移動數(shù)據(jù)實際上并不是數(shù)據(jù)科學家的職責,而是數(shù)據(jù)工程師的職責。數(shù)據(jù)工程師擁有編程、技術(shù)方面的專業(yè)知識,以前曾參與過數(shù)據(jù)集成、中間件、分析、業(yè)務(wù)數(shù)據(jù)門戶和ETL操作。數(shù)據(jù)工程師的重心和技能集中在大數(shù)據(jù)和分布式系統(tǒng)上,可以使用Java、Python、Scala等編程語言腳本工具,擁有技術(shù)經(jīng)驗。數(shù)據(jù)工程師面臨的挑戰(zhàn)是如何從各種各樣的系統(tǒng)中獲取結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù),解決不“干凈”的數(shù)據(jù)例如字段缺失、數(shù)據(jù)類型不匹配等與數(shù)據(jù)相關(guān)的問題。數(shù)據(jù)工程師要使用編程、集成、體系結(jié)構(gòu)和系統(tǒng)技能來清理所有數(shù)據(jù),并將其放入一種格式和系統(tǒng)中,然后數(shù)據(jù)科學家就可以使用該格式和系統(tǒng)來分析、建立數(shù)據(jù)模型并為組織提供價值。數(shù)據(jù)工程師的角色就是設(shè)計、構(gòu)建和安排數(shù)據(jù)的工程師。

數(shù)據(jù)科學家和數(shù)據(jù)工程師能合二為一嗎?

雖然數(shù)據(jù)科學家和數(shù)據(jù)工程師的角色似乎截然不同,但數(shù)據(jù)科學家和數(shù)據(jù)工程師有許多共同的特點和共技能。這些重疊的技能包括處理和操作大數(shù)據(jù)集、應(yīng)用數(shù)據(jù)的編程技能、數(shù)據(jù)分析技能以及對系統(tǒng)操作的總體熟練程度。

盡管有很多共性重疊的部分,但是數(shù)據(jù)科學家和數(shù)據(jù)工程師的工作重點仍有差異,因此不太可能兩個角色合二為一。更重要的是,在招聘數(shù)據(jù)科學家和數(shù)據(jù)工程師時,要確保問對了問題,從候選人身上找到正確的技能。

更重要的是,隨著數(shù)據(jù)科學興起的代碼學院、研討會和培訓(xùn)班引出了新問題:這些培訓(xùn)和代碼學院的重點是數(shù)據(jù)科學背后的科學,還是數(shù)據(jù)工程背后的工程、編程,更糟的是,這些活動是否只是泛泛研究了一點囫圇吞棗地教學而混淆了細分的需求,比如應(yīng)該關(guān)注大數(shù)據(jù)和ML分析的哪些領(lǐng)域?

雖然看起來您可以在科學角色中做一點工程工作,或者在工程角色中做一點科學工作,但是混合角色可能會不利于企業(yè)組織在ML或數(shù)據(jù)科學的成功。那些被迫從事數(shù)據(jù)工程工作而沒有相關(guān)背景、技能或資質(zhì)的數(shù)據(jù)科學家很容易錯誤配置、誤用技術(shù),或者編寫效率低、成本高、浪費時間的程序。同樣地,要求從根本上具有工程背景的人學習復(fù)雜的數(shù)據(jù)科學數(shù)學,可能會導(dǎo)致組織對其信息得出錯誤的結(jié)論,產(chǎn)生災(zāi)難性結(jié)果。專業(yè)化是很重要的,好比醫(yī)生要做檢查,抽血師負責抽血。醫(yī)生可以為你抽血,抽血師可以了解化驗結(jié)果,但你為什么要拿自己的舒適和健康去冒險呢?

數(shù)據(jù)科學家在企業(yè)組織中處于什么位置?

為了從數(shù)據(jù)中獲得價值,大多數(shù)企業(yè)組織都需要數(shù)據(jù)科學和數(shù)據(jù)工程,由于相關(guān)技能有很大差異,二者合體也不太現(xiàn)實。企業(yè)組織可能需要多個數(shù)據(jù)科學家和數(shù)據(jù)工程師,但兩者之間的比例很少是1:1。對于大多數(shù)企業(yè)組織來說,擁有更多的數(shù)據(jù)工程師比數(shù)據(jù)科學家更有意義。因為數(shù)據(jù)科學家已經(jīng)學會處理大量的干凈數(shù)據(jù),但是從許多不同系統(tǒng)獲得大量的干凈數(shù)據(jù)更難也更具挑戰(zhàn)。與抽象數(shù)據(jù)模型和對數(shù)據(jù)集運行分析相比,移動和清理數(shù)據(jù)的工作量更大。

此外,數(shù)據(jù)科學家在企業(yè)組織應(yīng)該向誰報告可能是錯的,有的數(shù)據(jù)科學家向技術(shù)團隊報告,這是沒有意義的。數(shù)據(jù)科學家通常不會詢問特定技術(shù)的實施和數(shù)據(jù)分析,其所面臨的挑戰(zhàn)特定的業(yè)務(wù)線。因此,數(shù)據(jù)科學家應(yīng)該向業(yè)務(wù)戰(zhàn)略決策相關(guān)人員報告。

有以業(yè)務(wù)為中心的工具嗎?

如果數(shù)據(jù)科學和數(shù)據(jù)工程確實是組織中獨立的角色,那么將它們所需的工具應(yīng)該是分開的。許多進入數(shù)據(jù)科學/機器學習領(lǐng)域的供應(yīng)商正在混淆視聽,使事情變得更加混亂。他們聲稱工具是為數(shù)據(jù)科學家準備的,但是其一切主要功能和特性都是為數(shù)據(jù)工程師準備的,在上面點綴一些數(shù)據(jù)科學的特性是沒有意義的。對于數(shù)據(jù)科學家來說,需要一個分析的、面向數(shù)據(jù)的、以模型為中心的工具,而不是在數(shù)據(jù)清理、移動數(shù)據(jù)和將數(shù)據(jù)從私有環(huán)境遷移到云環(huán)境等方面的工具。這就像給一個駕駛教練一輛車的零件,然后說:“自己造這輛車,然后教別人如何駕駛它?!?/p>

數(shù)據(jù)科學家需要的是以數(shù)據(jù)科學為中心的工具,而不是以工程和編程為中心的工具。現(xiàn)在,這些工具越來越多,讓數(shù)據(jù)科學家可以進行數(shù)據(jù)挖掘或預(yù)測分析。然而,隨著數(shù)據(jù)科學家越來越深入業(yè)務(wù)領(lǐng)域,以業(yè)務(wù)為中心的工具是更合適的,例如,幾十年前,如果您希望以類似電子表格的格式操作大量數(shù)據(jù),這就涉及到編程,但是像Excel這樣的工具引入了數(shù)據(jù)透視表這樣的東西,現(xiàn)在業(yè)務(wù)經(jīng)理能夠執(zhí)行各種分析。Excel等工具將數(shù)據(jù)科學功能或以業(yè)務(wù)為中心的數(shù)據(jù)挖掘和分析工具嵌入到產(chǎn)品中只是時間問題。

隨著數(shù)據(jù)科學家的人才缺口繼續(xù)擴大,新的工具將會出現(xiàn),這些工具是為了允許非技術(shù)人員(即業(yè)務(wù)人員)運行、測試和分析數(shù)據(jù)而創(chuàng)建的,戰(zhàn)略業(yè)務(wù)經(jīng)理將開始學習數(shù)據(jù)科學,數(shù)據(jù)科學家仍然需要運行非常復(fù)雜的數(shù)據(jù)分析工具。然而,隨著越來越多易用工具的出現(xiàn),大多數(shù)情況下基本分析將更多地轉(zhuǎn)移到業(yè)務(wù)方。企業(yè)中ML和數(shù)據(jù)科學相關(guān)工具和技術(shù)也越來越大有可為。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 工程師
    +關(guān)注

    關(guān)注

    59

    文章

    1596

    瀏覽量

    70357
  • 數(shù)據(jù)科學
    +關(guān)注

    關(guān)注

    0

    文章

    168

    瀏覽量

    10664
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    國際類腦計算科學家Yulia Sandamirskaya教授加盟時識科技

    近日,國際類腦計算與神經(jīng)形態(tài)機器人領(lǐng)域知名科學家Yulia Sandamirskaya 教授,作為科學家顧問正式加入時識科技(SynSense)。
    的頭像 發(fā)表于 10-13 13:50 ?171次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學應(yīng)用

    AI被賦予了人的智能,科學家們希望在沒有人類的引導(dǎo)下,AI自主的提出科學假設(shè),諾貝爾獎級別的假設(shè)哦。 AI驅(qū)動科學被認為是科學發(fā)現(xiàn)的第五個范式了,與實驗
    發(fā)表于 09-17 11:45

    半導(dǎo)體工程師升級指南:從 “懂工藝” 到 “玩數(shù)據(jù)”,你只差這步!

    分析,懂行的工程師卻供不應(yīng)求。PDF如何破解這困境?關(guān)鍵在于賦制造業(yè)領(lǐng)域?qū)<肄D(zhuǎn)型“公民數(shù)據(jù)科學家
    的頭像 發(fā)表于 08-20 09:32 ?686次閱讀
    半導(dǎo)體<b class='flag-5'>工程師</b>升級指南:從 “懂工藝” 到 “玩<b class='flag-5'>數(shù)據(jù)</b>”,你只差這<b class='flag-5'>一</b>步!

    數(shù)字信號處理,科學家工程師指南(664頁)

    數(shù)字信號處理入門書籍,非常全面,清晰易懂 獲取完整文檔資料可下載附件哦?。。?! 如果內(nèi)容有幫助可以關(guān)注、點贊、評論支持下哦~
    發(fā)表于 07-11 14:59

    工程師的“新神器”:用CCLinkie轉(zhuǎn)Devicenet連接水質(zhì)分析儀,輕松搞定數(shù)據(jù)難題

    在化工行業(yè)摸爬滾打的工程師們,是不是經(jīng)常水質(zhì)監(jiān)測數(shù)據(jù)的獲取和整合頭疼?邊是復(fù)雜的化工生產(chǎn)流程,邊是水質(zhì)分析儀的
    發(fā)表于 06-09 15:36

    問,成為硬件工程師需要幾只手?#硬件工程師 #YXC晶振 #揚興科技 #搞笑

    硬件工程師
    揚興科技
    發(fā)布于 :2025年04月25日 17:15:37

    招拿捏電子工程師#被AI拿捏了 #電子工程師 #電子電工

    電子工程師
    安泰小課堂
    發(fā)布于 :2025年03月25日 17:30:51

    如何成為嵌入式開發(fā)工程師?

    如何成為嵌入式開發(fā)工程師? 成為嵌入式開發(fā)工程師通常需要掌握系列技能和知識,并且在實踐中不斷積累經(jīng)驗。以下是些基本步驟和建議: 1. 基礎(chǔ)教育:- 獲取電子
    發(fā)表于 02-19 10:39

    NVIDIA RAPIDS cuDF如何賦AI加速數(shù)據(jù)科學

    隨著 AI 正幫助各行各業(yè)推動創(chuàng)新和提高效率,基于海量的高質(zhì)量數(shù)據(jù)來訓(xùn)練各種模型是充分發(fā)揮 AI 應(yīng)用潛力的必經(jīng)之路,正因如此,數(shù)據(jù)科學家們面臨著日益增長的工作負載需求,迫切需求尋找高效趁手的工具以應(yīng)對挑戰(zhàn)。
    的頭像 發(fā)表于 01-24 09:26 ?852次閱讀

    多用示波器的原理和應(yīng)用場景

    系統(tǒng)控制電子束的方向,使其隨外加信號的變化描繪出被測信號的波形。熒光屏則用來顯示電子束撞擊后產(chǎn)生的亮點,形成信號波形。、應(yīng)用場景 電子工程:在電子工程領(lǐng)域,示波器常被用于信號的調(diào)試與分析。
    發(fā)表于 01-09 15:42

    硬件工程師入門基礎(chǔ)元器件與電路原理

    概述了IGBT在電力轉(zhuǎn)換中的重要角色及其發(fā)展。 硬件工程師入門基礎(chǔ)知識 ()基礎(chǔ)元器件認識() tips:學習資料和數(shù)據(jù)來自《硬件工程師
    的頭像 發(fā)表于 01-07 11:11 ?2.5w次閱讀
    硬件<b class='flag-5'>工程師</b>入門基礎(chǔ)元器件與電路原理

    西湖大學:科學家+AI,科研新范式的樣本

    研究,創(chuàng)新科研新范式。這點在西湖大學的科研項目中已得到體現(xiàn)。 成立于2018年的西湖大學是由施公院士領(lǐng)銜創(chuàng)辦的、聚焦前沿科學研究的研究型大學,該校鼓勵科學家們探索AI與各學科交叉融
    的頭像 發(fā)表于 12-12 15:59 ?770次閱讀
    西湖大學:<b class='flag-5'>科學家</b>+AI,科研新范式的樣本

    使用MATLAB培養(yǎng)醫(yī)療人工智能領(lǐng)導(dǎo)者和增強工程課程

    全球各地的高校都在使用 MATLAB 和 Simulink 開展教學與科研,幫助未來的工程師科學家掌握未來世界工程項目與科學研究所要求的重要能力。讓我們
    的頭像 發(fā)表于 10-31 16:37 ?876次閱讀