chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

簡述Hive 數(shù)據(jù)傾斜問題定位排查及解決

數(shù)據(jù)分析與開發(fā) ? 來源:五分鐘學大數(shù)據(jù) ? 作者:園陌 ? 2021-10-08 09:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

多數(shù)介紹數(shù)據(jù)傾斜的文章都是以大篇幅的理論為主,并沒有給出具體的數(shù)據(jù)傾斜案例。當工作中遇到了傾斜問題,這些理論很難直接應用,導致我們面對傾斜時還是不知所措。

今天我們不扯大篇理論,直接以例子來實踐,排查是否出現(xiàn)了數(shù)據(jù)傾斜,具體是哪段代碼導致的傾斜,怎么解決這段代碼的傾斜。

當執(zhí)行過程中任務卡在 99%,大概率是出現(xiàn)了數(shù)據(jù)傾斜,但是通常我們的 SQL 很大,需要判斷出是哪段代碼導致的傾斜,才能利于我們解決傾斜。通過下面這個非常簡單的例子來看下如何定位產(chǎn)生數(shù)據(jù)傾斜的代碼。

表結構描述

先來了解下這些表中我們需要用的字段及數(shù)據(jù)量:

表的字段非常多,此處僅列出我們需要的字段

第一張表:user_info (用戶信息表,用戶粒度)

字段名 字段含義 字段描述
userkey 用戶 key 用戶標識
idno 用戶的身份證號 用戶實名認證時獲取
phone 用戶的手機 用戶注冊時的手機號
name 用戶的姓名 用戶的姓名

user_info 表的數(shù)據(jù)量:1.02 億,大?。?3.9G,所占空間:41.7G(HDFS三副本)

第二張表:user_active (用戶活躍表,用戶粒度)

字段名 字段含義 字段描述
userkey 用戶 key 用戶沒有注冊會分配一個 key
user_active_at 用戶的最后活躍日期 從埋點日志表中獲取用戶的最后活躍日期

user_active 表的數(shù)據(jù)量:1.1 億

第三張表:user_intend(用戶意向表,此處只取近六個月的數(shù)據(jù),用戶粒度)

字段名 字段含義 字段描述
phone 用戶的手機號 有意向的用戶必須是手機號注冊的用戶
intend_commodity 用戶意向次數(shù)最多的商品 客戶對某件商品意向次數(shù)最多
intend_rank 用戶意向等級 用戶的購買意愿等級,級數(shù)越高,意向越大

user_intend 表的數(shù)據(jù)量:800 萬

第四張表:user_order(用戶訂單表,此處只取近六個月的訂單數(shù)據(jù),用戶粒度)

字段名 字段含義 字段描述
idno 用戶的身份證號 下訂單的用戶都是實名認證的
order_num 用戶的訂單次數(shù) 用戶近六個月下單次數(shù)
order_amount 用戶的訂單總金額 用戶近六個月下單總金額

user_order 表的數(shù)據(jù)量:640 萬

1. 需求

需求非常簡單,就是將以上四張表關聯(lián)組成一張大寬表,大寬表中包含用戶的基本信息,活躍情況,購買意向及此用戶下訂單情況。

2. 代碼

根據(jù)以上需求,我們以 user_info 表為基礎表,將其余表關聯(lián)為一個寬表,代碼如下:

select
a.userkey,
a.idno,
a.phone,
a.name,
b.user_active_at,
c.intend_commodity,
c.intend_rank,
d.order_num,
d.order_amount
fromuser_infoa
leftjoinuser_activebona.userkey=b.userkey
leftjoinuser_intendcona.phone=c.phone
leftjoinuser_orderdona.idno=d.idno;

執(zhí)行上述語句,在執(zhí)行到某個 job 時任務卡在 99%:

7e4ad528-26b6-11ec-82a8-dac502259ad0.png

這時我們就應該考慮出現(xiàn)數(shù)據(jù)傾斜了。其實還有一種情況可能是數(shù)據(jù)傾斜,就是任務超時被殺掉,Reduce 處理的數(shù)據(jù)量巨大,在做 full gc 的時候,stop the world。導致響應超時,超出默認的 600 秒,任務被殺掉。報錯信息一般如下:

AttemptID:attempt_1624419433039_1569885_r_000000 Timed outafter 600 secs Container killed by the ApplicationMaster. Container killed onrequest. Exit code is 143 Container exited with a non-zero exit code 143

3. 傾斜問題排查

數(shù)據(jù)傾斜大多數(shù)都是大 key 問題導致的。

如何判斷是大 key 導致的問題,可以通過下面方法:

1. 通過時間判斷

如果某個 reduce 的時間比其他 reduce 時間長的多,如下圖,大部分 task 在 1 分鐘之內完成,只有 r_000000 這個 task 執(zhí)行 20 多分鐘了還沒完成。

7e8f9640-26b6-11ec-82a8-dac502259ad0.png

注意:要排除兩種情況:

  1. 如果每個 reduce 執(zhí)行時間差不多,都特別長,不一定是數(shù)據(jù)傾斜導致的,可能是 reduce 設置過少導致的。

  2. 有時候,某個 task 執(zhí)行的節(jié)點可能有問題,導致任務跑的特別慢。這個時候,mapreduce 的推測執(zhí)行,會重啟一個任務。如果新的任務在很短時間內能完成,通常則是由于 task 執(zhí)行節(jié)點問題導致的個別 task 慢。但是如果推測執(zhí)行后的 task 執(zhí)行任務也特別慢,那更說明該 task 可能會有傾斜問題。

2. 通過任務 Counter 判斷

Counter 會記錄整個 job 以及每個 task 的統(tǒng)計信息。counter 的 url 一般類似:

http://bd001:8088/proxy/application_1624419433039_1569885/mapreduce/singletaskcounter/task_1624419433039_1569885_r_000000/org.apache.hadoop.mapreduce.FileSystemCounter

通過輸入記錄數(shù),普通的 task counter 如下,輸入的記錄數(shù)是 13 億多:

7ed8656e-26b6-11ec-82a8-dac502259ad0.png

7f0e2154-26b6-11ec-82a8-dac502259ad0.png

而 task=000000 的 counter 如下,其輸入記錄數(shù)是 230 多億。是其他任務的 100 多倍:

7f3042f2-26b6-11ec-82a8-dac502259ad0.png

4. 定位 SQL 代碼

1. 確定任務卡住的 stage

  • 通過 jobname 確定 stage:

    一般 Hive 默認的 jobname 名稱會帶上 stage 階段,如下通過 jobname 看到任務卡住的為 Stage-4:

7f5dd6ae-26b6-11ec-82a8-dac502259ad0.png

  • 如果 jobname 是自定義的,那可能沒法通過 jobname 判斷 stage。需要借助于任務日志:

    找到執(zhí)行特別慢的那個 task,然后 Ctrl+F 搜索 “CommonJoinOperator: JOIN struct” 。Hive 在 join 的時候,會把 join 的 key 打印到日志中。如下:

7f9d9dde-26b6-11ec-82a8-dac502259ad0.png

上圖中的關鍵信息是:struct<_col0:string, _col1:string, _col3:string>

這時候,需要參考該 SQL 的執(zhí)行計劃。通過參考執(zhí)行計劃,可以斷定該階段為 Stage-4 階段:

7fb06586-26b6-11ec-82a8-dac502259ad0.png

2. 確定 SQL 執(zhí)行代碼

確定了執(zhí)行階段,即 stage。通過執(zhí)行計劃,則可以判斷出是執(zhí)行哪段代碼時出現(xiàn)了傾斜。還是從此圖,這個 stage 中進行連接操作的表別名是 d:

801276f4-26b6-11ec-82a8-dac502259ad0.png

就可以推測出是在執(zhí)行下面紅框中代碼時出現(xiàn)了數(shù)據(jù)傾斜,因為這行的表的別名是 d:

8063b334-26b6-11ec-82a8-dac502259ad0.png

5. 解決傾斜

我們知道了哪段代碼引起的數(shù)據(jù)傾斜,就針對這段代碼查看傾斜原因,看下這段代碼的表中數(shù)據(jù)是否有異常。

傾斜原因:

本文的示例數(shù)據(jù)中 user_info 和 user_order 通過身份證號關聯(lián),檢查發(fā)現(xiàn) user_info 表中身份證號為空的有 7000 多萬,原因就是這 7000 多萬數(shù)據(jù)都分配到一個 reduce 去執(zhí)行,導致數(shù)據(jù)傾斜。

解決方法

  1. 可以先把身份證號為空的去除之后再關聯(lián),最后按照 userkey 連接,因為 userkey 全部都是有值的:
witht1as(
select
  u.userkey,
  o.*
fromuser_infou
leftjoinuser_ordero
onu.idno=o.idno
whereu.idnoisnotnull
--是可以把where條件寫在后面的,hive會進行謂詞下推,先執(zhí)行where條件在執(zhí)行l(wèi)eftjoin
)

select
a.userkey,
a.idno,
a.phone,
a.name,
b.user_active_at,
c.intend_commodity,
c.intend_rank,
d.order_num,
d.order_amount
fromuser_infoa
leftjoinuser_activebona.userkey=b.userkey
leftjoinuser_intendcona.phone=c.phone
leftjoint1dona.userkey=d.userkey;
  1. 也可以這樣,給身份證為空的數(shù)據(jù)賦個隨機值,但是要注意隨機值不能和表中的身份證號有重復:
select
a.userkey,
a.idno,
a.phone,
a.name,
b.user_active_at,
c.intend_commodity,
c.intend_rank,
d.order_num,
d.order_amount
fromuser_infoa
leftjoinuser_activebona.userkey=b.userkey
leftjoinuser_intendcona.phone=c.phone
leftjoinuser_orderdonnvl(a.idno,concat(rand(),'idnumber'))=d.idno;

其他的解決數(shù)據(jù)傾斜的方法

1. 過濾掉臟數(shù)據(jù)

如果大 key 是無意義的臟數(shù)據(jù),直接過濾掉。本場景中大 key 有實際意義,不能直接過濾掉。

2. 數(shù)據(jù)預處理

數(shù)據(jù)做一下預處理(如上面例子,對 null 值賦一個隨機值),盡量保證 join 的時候,同一個 key 對應的記錄不要有太多。

3. 增加 reduce 個數(shù)

如果數(shù)據(jù)中出現(xiàn)了多個大 key,增加 reduce 個數(shù),可以讓這些大 key 落到同一個 reduce 的概率小很多。

配置 reduce 個數(shù):

setmapred.reduce.tasks=15;

4. 轉換為 mapjoin

如果兩個表 join 的時候,一個表為小表,可以用 mapjoin 做。

配置 mapjoin:

sethive.auto.convert.join=true;是否開啟自動mapjoin,默認是true

sethive.mapjoin.smalltable.filesize=100000000;mapjoin的表size大小

5. 啟用傾斜連接優(yōu)化

hive 中可以設置 hive.optimize.skewjoin 將一個 join sql 分為兩個 job。同時可以設置下 hive.skewjoin.key,此參數(shù)表示 join 連接的 key 的行數(shù)超過指定的行數(shù),就認為該鍵是偏斜連接鍵,就對 join 啟用傾斜連接優(yōu)化。默認 key 的行數(shù)是 100000。

配置傾斜連接優(yōu)化:

sethive.optimize.skewjoin=true;啟用傾斜連接優(yōu)化

sethive.skewjoin.key=200000;超過20萬行就認為該鍵是偏斜連接鍵

6. 調整內存設置

適用于那些由于內存超限任務被 kill 掉的場景。通過加大內存起碼能讓任務跑起來,不至于被殺掉。該參數(shù)不一定會明顯降低任務執(zhí)行時間。

配置內存:

setmapreduce.reduce.memory.mb=5120;設置reduce內存大小

setmapreduce.reduce.java.opts=-Xmx5000m-XX:MaxPermSize=128m;

附:Hive 配置屬性官方鏈接:https://cwiki.apache.org/confluence/display/Hive/Configuration+Properties

編輯:jq
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)

    關注

    8

    文章

    7253

    瀏覽量

    91751
  • SQL
    SQL
    +關注

    關注

    1

    文章

    783

    瀏覽量

    45052
  • 代碼
    +關注

    關注

    30

    文章

    4898

    瀏覽量

    70589
  • hive
    +關注

    關注

    0

    文章

    12

    瀏覽量

    3996

原文標題:實操 : Hive 數(shù)據(jù)傾斜問題定位排查及解決

文章出處:【微信號:DBDevs,微信公眾號:數(shù)據(jù)分析與開發(fā)】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    VirtualLab 應用:傾斜光柵的參數(shù)優(yōu)化及公差分析

    摘要 對于背光系統(tǒng)、光內連器和近眼顯示器等許多應用來說,將光高效地耦合到引導結構中是一個重要的問題。對于這種應用,傾斜光柵以能夠高效地耦合單色光而聞名。在本例中,提出了利用嚴格傅里葉模態(tài)方法(FMM
    發(fā)表于 05-22 08:52

    分布式存儲數(shù)據(jù)恢復—虛擬機上hbase和hive數(shù)據(jù)數(shù)據(jù)恢復案例

    分布式存儲數(shù)據(jù)恢復環(huán)境: 16臺某品牌R730xd服務器節(jié)點,每臺服務器節(jié)點上有數(shù)臺虛擬機。 虛擬機上部署Hbase和Hive數(shù)據(jù)庫。 分布式存儲故障: 數(shù)據(jù)庫底層文件被誤
    的頭像 發(fā)表于 04-17 11:05 ?211次閱讀

    使用福祿克示波表排查電氣故障的案例分析

    當工程師們排查異常的電氣故障時,和偵探探案有著異曲同工之妙。工程師需要從設備的種種表現(xiàn)抽絲剝繭。他們從多個測試點的數(shù)據(jù)逐一排查,甚至需要不斷擴大調查范圍,檢查上游供電的電能質量,偵破各個潛在的影響因素,最終
    的頭像 發(fā)表于 03-27 15:42 ?334次閱讀
    使用福祿克示波表<b class='flag-5'>排查</b>電氣故障的案例分析

    5G網(wǎng)絡優(yōu)化中,信令測試儀如何幫助故障排查?

    的信令流程,并分析系統(tǒng)性能數(shù)據(jù),從而定位問題所在。 用戶設備問題定位:信令測試儀還可以檢測UE相關的信令異常,如固件或操作系統(tǒng)問題、硬件故障以及用戶操作不當?shù)?。通過仔細檢查UE日志和信令跟蹤記錄,可以
    發(fā)表于 03-20 14:18

    CAN總線故障排查:從問題到解決的實戰(zhàn)案例

    視頻推薦在工業(yè)現(xiàn)場的煤安監(jiān)控網(wǎng)絡中,CAN總線通信常因復雜環(huán)境出現(xiàn)數(shù)據(jù)丟失問題。本文以一起煤安監(jiān)控網(wǎng)絡中CAN總線數(shù)據(jù)丟失的故障排查案例,簡述排查
    的頭像 發(fā)表于 02-28 11:37 ?819次閱讀
    CAN總線故障<b class='flag-5'>排查</b>:從問題到解決的實戰(zhàn)案例

    GPS無法定位?一定要排查的情況來啦~

    社群又有新朋友著急來問: ? 我的GPS無法定位啊,怎么破?… 做開發(fā)哪有不踩坑的,你并不孤獨。 本文特別分享無法定位最常見的四種情況,希望能幫到有類似定位應用項目的朋友們,更快地排查
    的頭像 發(fā)表于 02-24 15:25 ?818次閱讀
    GPS無法<b class='flag-5'>定位</b>?一定要<b class='flag-5'>排查</b>的情況來啦~

    桿塔傾斜的原因及監(jiān)測方案

    部署使用一體式桿塔傾斜在線監(jiān)測系統(tǒng),針對影響因素全面分析和研究,采取科學合理防治措施。
    的頭像 發(fā)表于 02-07 17:08 ?403次閱讀
    桿塔<b class='flag-5'>傾斜</b>的原因及監(jiān)測方案

    數(shù)據(jù)采集網(wǎng)關出現(xiàn)斷網(wǎng)可能是什么原因?如何排查?

    數(shù)據(jù)采集網(wǎng)關出現(xiàn)斷網(wǎng)可能是什么原因?如何排查
    的頭像 發(fā)表于 11-30 13:43 ?917次閱讀

    機智云歷史數(shù)據(jù)導出與排查指南

    機智云歷史數(shù)據(jù)導出與排查指南在使用機智云平臺進行設備管理和數(shù)據(jù)監(jiān)控時,歷史數(shù)據(jù)的導出和排查是常見的需求。機智云提供了開放的API接口,方便用
    的頭像 發(fā)表于 11-21 01:01 ?685次閱讀
    機智云歷史<b class='flag-5'>數(shù)據(jù)</b>導出與<b class='flag-5'>排查</b>指南

    輸電線路桿塔傾斜在線監(jiān)測裝置,桿塔傾斜預警大師

    很多人還不知道桿塔傾斜有怎樣的危害以及桿塔傾斜是什么?桿塔傾斜是指輸電線路的桿塔在垂直方向上偏離了正常位置,出現(xiàn)一定角度或位移的現(xiàn)象。 產(chǎn)生原因 1、桿塔基礎是確保桿塔穩(wěn)定的關鍵。水土流失、地基沉降
    的頭像 發(fā)表于 11-20 18:05 ?647次閱讀

    北斗輸電線路桿塔傾斜在線監(jiān)測裝置 高精度差分定位 雙天線

    該裝置結合北斗技術和物聯(lián)網(wǎng)技術,實現(xiàn)對桿塔傾斜狀態(tài)的實時監(jiān)測,包括航向?、順線傾斜度、橫線傾斜度等,并將監(jiān)測數(shù)據(jù)無線發(fā)送至監(jiān)測中心進行處理,一旦監(jiān)測
    的頭像 發(fā)表于 11-08 10:55 ?654次閱讀

    電桿傾斜監(jiān)測裝置 桿塔傾斜監(jiān)測裝置 支持數(shù)據(jù)實時讀取 精確預警

    TLKS-PMG-QX電桿傾斜監(jiān)測裝置的核心組件是雙軸傾角傳感器,該傳感器能夠精確測量桿塔在縱向和橫向兩個方向的傾斜角度。傳感器持續(xù)進行數(shù)據(jù)采集,并將這些數(shù)據(jù)實時傳輸至監(jiān)測主機。監(jiān)測主
    的頭像 發(fā)表于 11-05 11:05 ?702次閱讀
    電桿<b class='flag-5'>傾斜</b>監(jiān)測裝置 桿塔<b class='flag-5'>傾斜</b>監(jiān)測裝置 支持<b class='flag-5'>數(shù)據(jù)</b>實時讀取 精確預警

    傾斜傳感器的種類與選擇技巧

    2024-07-17 傾斜傳感器,又稱傾角傳感器或傾斜計,是一種測量物體相對于重力場的傾斜角度的設備。這些傳感器在各種應用中都有廣泛的使用,包括工業(yè)自動化、航空航天、樓宇、汽車和消費類電子產(chǎn)品等領域
    的頭像 發(fā)表于 10-02 17:10 ?1222次閱讀
    <b class='flag-5'>傾斜</b>傳感器的種類與選擇技巧

    數(shù)據(jù)從業(yè)者必知必會的Hive SQL調優(yōu)技巧

    數(shù)據(jù)從業(yè)者必知必會的Hive SQL調優(yōu)技巧 摘要 :在大數(shù)據(jù)領域中,Hive SQL被廣泛應用于數(shù)據(jù)倉庫的
    的頭像 發(fā)表于 09-24 13:30 ?685次閱讀

    科普小課堂|LCD 問題排查思路解析

    在嵌入式系統(tǒng)開發(fā)中,液晶顯示器(LCD)作為人機交互的重要界面,其穩(wěn)定性和可靠性至關重要。然而在實際應用中,LCD難免會遇到各種問題。今天和各位小伙伴分享一些常見的LCD問題及其排查思路,幫助大家快速定位并解決這些問題。
    的頭像 發(fā)表于 08-05 17:06 ?1661次閱讀
    科普小課堂|LCD 問題<b class='flag-5'>排查</b>思路解析