在线视频无码免费,在线观看无码1

眾所周知，大數(shù)據(jù)開發(fā)和分析、機器學(xué)習(xí)、數(shù)據(jù)挖掘中，都離不開各種開源分布式系統(tǒng)。最常見的就是 Hadoop、Hive、Spark這三個框架了。最近不少朋友有問到關(guān)于這些的問題：

大廠里還有在用 Hadoop 嗎？感覺都在用 Spark，有些慌！

SQL boy 大廠面試都問什么？Hadoop、Spark、Flink 都搞過！

聽說百度只用 Hadoop，為什么不用業(yè)界都在用的 Spark !

為什么百度不用SQL支持數(shù)據(jù)處理，還在寫一堆 Hadoop 腳本！

Java 開發(fā)需要對大數(shù)據(jù)了解多少，Hbase、Hive、Spark 這些嗎？

不同的業(yè)務(wù)場景決定了不同的系統(tǒng)架構(gòu)選型。Hadoop 用于分布式存儲和 Map-Reduce 計算，Spark 用于分布式機器學(xué)習(xí)，Hive 則是分布式數(shù)據(jù)庫。Hive 和 Spark 是大數(shù)據(jù)領(lǐng)域內(nèi)為不同目的而構(gòu)建的不同產(chǎn)品。二者都有不可替代的優(yōu)勢。Hive 是一個基于Hadoop 的分布式數(shù)據(jù)庫，Spark 則是一個用于數(shù)據(jù)分析的框架。

這就要求技術(shù)人不得不掌握各種開源的技術(shù)框架。這就會造成顧此失彼，學(xué)完易忘、易混淆的情況。為了解決這個問題，這里推薦給大家一個高效學(xué)習(xí)和開發(fā)的寶藏：一份大數(shù)據(jù)/分布式開發(fā)速查表。內(nèi)容涵蓋：Spark、Hadoop及Hive等日常工作中幾乎所有的技術(shù)知識點。

對比詳細卻冗長的技術(shù)文檔，速查表要顯得更加便捷與直觀?？梢詭痛蠹液茌p松的從上面找到具體某項技術(shù)的快捷命令與語法，相信能大幅提升開發(fā)效率，同時，一些遺忘的知識點也都能通過速查表來快速獲取。

由于篇幅原因，下面只展示了速查表的部分內(nèi)容。無論你是學(xué)習(xí)進階，還是日后溫習(xí)，這套速查表資料都值得好好珍藏。

1.大數(shù)據(jù)內(nèi)存計算框架之Spark 必知必會

學(xué)習(xí) Spark ，從大方向說，算子大致可以分為以下兩類：（1）Transformation 變換 / 轉(zhuǎn)換算子：這種變換并不觸發(fā)提交作業(yè)，這種算子是延遲執(zhí)行的，也就是說從一個 RDD 轉(zhuǎn)換生成另一個 RDD 的轉(zhuǎn)換操作不是馬上執(zhí)行，需要等到有 Action 操作的時候才會真正觸發(fā)。（2）Action 行動算子：這類算子會觸發(fā) SparkContext 提交 job 作業(yè)，并將數(shù)據(jù)輸出到 Spark 系統(tǒng)。

Spark 必知必會：Transformation 算子

Spark 必知必會：Action算子

2.大數(shù)據(jù)分布式文件系統(tǒng)之Hadoop 必知必會

內(nèi)容包括：Hadoop Shell ，HDFS 命令有 hadoop fs 和 hdfs dfs 兩種風(fēng)格，都可使用，效果相同。

Hadoop 必知必會：Hadoop Shell

3.大數(shù)據(jù)分布式數(shù)據(jù)庫之Hive必知必會

Hive 的本質(zhì)是將 SQL 語句轉(zhuǎn)換為 MapReduce 或者 spark 等任務(wù)執(zhí)行，并可以針對數(shù)據(jù)倉庫進行分布式交互查詢。內(nèi)容包括：Hive 內(nèi)置函數(shù)速查表，具體有關(guān)系、數(shù)學(xué)及邏輯運算符、數(shù)值計算、日期函數(shù)、條件函數(shù)、字符串函數(shù)、聚合函數(shù)、高級函數(shù)及窗口函數(shù)等。

Hive 必知必會：關(guān)系運算符

Hive 必知必會：數(shù)值計算

Hive 必知必會：字符串函數(shù)

原文標題：在百度，Spark，Hadoop，Hive ，哪個更香？

文章出處：【微信公眾號：算法與數(shù)據(jù)結(jié)構(gòu)】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴