開發(fā)者自述沒有被聘為數(shù)據(jù)科學家,所以鉆研出當前數(shù)據(jù)科學整個行業(yè)的真實現(xiàn)狀。他發(fā)現(xiàn)實際上高學歷非常重要,而計算機、工程學、數(shù)學和統(tǒng)計都是非常主流的學科。他認為與其專注于數(shù)據(jù)科學家所需要的技能,不如專注于實際上能做什么。Kaggle大師有用,但沒那么有用。
你知道數(shù)據(jù)科學家這個行業(yè),最熱的話題是什么嗎?如何快速的賺到熱錢。
你可能剛剛聽說數(shù)據(jù)科學家這個職業(yè),或者已經從事該行業(yè)多年。每當提及“數(shù)據(jù)科學”這個詞的時候,可能總會有一份榮耀在心里面。畢竟這是一個聽起來就很高科技的職業(yè),自我介紹的時候會有人投來羨慕的目光。
但數(shù)據(jù)科學家的競爭正在變得越來越激烈,而數(shù)據(jù)科學家心中的那份情懷似乎也在逐漸的淡化。取而代之的是焦慮在不斷的滋長,而我們卻無能為力。
一方面,越來越多的人想入行數(shù)據(jù)科學家,希望獲取名聲和利益;另一方面,企業(yè)在數(shù)據(jù)科學家這個崗位上開始有些搖擺,很多公司甚至錯誤的將數(shù)據(jù)標注等工作當做是數(shù)據(jù)科學家。
上述情況,并沒有隨著人工智能的發(fā)展而有所改善。最近。一位名叫Hanif Samad的新加坡的統(tǒng)計學家、軟件工程師、數(shù)據(jù)科學家在找工作的時候有些碰壁,讓他開始對數(shù)據(jù)科學整個行業(yè)的現(xiàn)狀進行反思。
他發(fā)現(xiàn),在數(shù)據(jù)科學家最集中的平臺Towards Data Science上,有關數(shù)據(jù)科學最熱的文章是《數(shù)據(jù)科學家如何跟股東相處》,其他的像《如何成為一名數(shù)據(jù)工程師》、《批量梯度下降與隨機梯度下降》、《多類文本分類》、《加速R-CNN》這類特別細分的技巧類文章非常熱門。
因為Samad只有一段短暫的數(shù)據(jù)科學經歷,在實際面試的過程中他才意識到,平時看到那些教導你如何成為數(shù)據(jù)科學家的成功學文章,以及那些技巧類文章,毫無用武之地。空有一身屠龍技,卻面臨無龍可屠的局面,典型的Daniel Kahneman口中“可用性啟發(fā)式的受害者”。
所以Samad開始鉆研一個問題:那些真正在從事數(shù)據(jù)科學的人,到底在做什么?到底數(shù)據(jù)科學這個行業(yè),真正的現(xiàn)狀是什么?
作為一名統(tǒng)計學家和數(shù)據(jù)科學家,Samad通過爬取LinkedIn上的數(shù)據(jù),對目前的數(shù)據(jù)科學行業(yè)進行了一次摸底。在分析了近1000個數(shù)據(jù)科學家檔案后,結果還真讓他發(fā)現(xiàn)了一些很少有人提及的內幕。
發(fā)現(xiàn)1:研究生學位是標配
73%目前就業(yè)的數(shù)據(jù)科學家擁有研究生學位。其中碩士學位較多占44%;剩下博士學位29%,學士學位占到了21%。除了全日制大學畢業(yè)外,也有部分數(shù)據(jù)科學家擁有的是MOOC學位或培訓班的函授學位,共占總數(shù)的6%。
計算機科學與工程、以及業(yè)務分析是主流
計算機科學,數(shù)學和統(tǒng)計學以及工程學科三位一體的共同概念構成了數(shù)據(jù)科學事業(yè)的基石,這在一定程度上得到了數(shù)據(jù)的證實。
目前看來,就學科而論,計算機科學勝過所有其他學科,擁有絕對的主導地位,占所有研究學科的14%。
但如果把工程學統(tǒng)一看做是一個類別的話,因為其包括了化學,電氣和電子學,以及所謂的知識工程等不同學科,這些學科加起來,累計占學科總數(shù)的22%。
平時我們都以為,數(shù)據(jù)科學需要很強的數(shù)學和統(tǒng)計學的功底。但實際上,把數(shù)學和統(tǒng)計學所有學科包括應用數(shù)學,數(shù)學物理學,統(tǒng)計學和應用概率都算上,也只占研究學科的12%左右。
但最讓人驚訝的其實是業(yè)務分析和其他分析學科,總體占了15%,比數(shù)學和統(tǒng)計學都高!
其他排名靠前的領域包括物理學(3.5%)和信息技術(2.2%)。
招聘數(shù)據(jù)科學家傾向于有一定經驗
雖然很多應屆畢業(yè)生確實也在競爭數(shù)據(jù)科學家的崗位,然而樣本中數(shù)據(jù)科學家填寫的工作經驗大多是4-6年。
大多數(shù)數(shù)據(jù)科學家的崗位都是新設置的
76%的數(shù)據(jù)科學家入行不足兩年,而其中42%工作經驗不足一年。這表明雖然大多數(shù)數(shù)據(jù)科學的職位空缺都是相對較新的,但是填補空缺的人已經在就業(yè)市場上待了一段時間。
一半的數(shù)據(jù)科學家角色來自非技術公司
雖然資金充足,成熟的技術公司(如谷歌或亞馬遜)傾向于成為數(shù)據(jù)科學家聘用的理想場所,但值得注意的是,該樣本中近一半(49%)的數(shù)據(jù)科學家來自非技術公司:金融和保險(11%),咨詢(9%),政府(5%),制造業(yè)(5%)和學術界(2.4%)的公司和機構。
在技術類別中,具有良好代表性的行業(yè)包括運輸(8%),企業(yè)(8%,包括IBM,SAP和Microsoft),電子商務(5%) 和財務(5%)。
有一大類技術公司作者將其標記為AI&ML(6.5%),包括DataRobot等公司,以及Amaris.AI等新產品。
結論
以上,有沒有打破你之前對數(shù)據(jù)科學家這個行業(yè)的印象呢?我們可以看到,數(shù)據(jù)科學家對學位的要求較高,學科方面則是計算機科學,工程,數(shù)學或分析專業(yè)更吃香。最好是已經有4-6年工作經驗的雇員。
值得注意的是,雖然我們看到有6%的人來自MOOC和培訓機構等非傳統(tǒng)認證的機構,但顯然擁有研究生學位才是最保險的。
數(shù)據(jù)科學正在快速發(fā)展,許多最重要的算法和技術將不被傳統(tǒng)的學術課程所涵蓋。所以除了學位,你還需要一些職業(yè)技能之外的能力。
最后,不要被焦慮蒙蔽了雙眼。你可能并不需要學習那么多的數(shù)據(jù)科學技巧,但你應該好好想想,你做這件事情的目的是什么?想要得到的是什么?
-
人工智能
+關注
關注
1812文章
49513瀏覽量
258772 -
亞馬遜
+關注
關注
8文章
2710瀏覽量
85316 -
數(shù)據(jù)科學
+關注
關注
0文章
168瀏覽量
10684
原文標題:面試碰壁卻讓我看清數(shù)據(jù)科學行業(yè)現(xiàn)狀
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學應用
2025嵌入式行業(yè)現(xiàn)狀如何?
通過 BOD 或 nReset 重置時,GPIO 是否處于高實現(xiàn)狀態(tài)?
磁性元件行業(yè)專利現(xiàn)狀探討
防雷工程與防雷檢測:多行業(yè)實踐與科學執(zhí)行指南

AI在醫(yī)療健康和生命科學中的發(fā)展現(xiàn)狀
工業(yè)電機行業(yè)現(xiàn)狀及未來發(fā)展趨勢分析
數(shù)模混合電路仿真實現(xiàn)

ADS1299如何保證數(shù)據(jù)真實性?
數(shù)據(jù)科學工作流原理
電氣行業(yè)工廠數(shù)據(jù)采集現(xiàn)狀及 “不需要點表的網(wǎng)關” 的作用

評論