chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

MySQL中utf8和utf8mb4有什么區(qū)別

汽車玩家 ? 來源:IT生涯 ? 作者:IT生涯 ? 2020-04-12 19:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一、簡介

MySQL在5.5.3之后增加了這個utf8mb4的編碼,mb4就是most bytes 4的意思,專門用來兼容四字節(jié)的unicode。utf8mb4是utf8的超集,除了將編碼改為utf8mb4外不需要做其他轉換。當然,為了節(jié)省空間,一般情況下使用utf8也就夠了。

二、內容描述

那上面說了既然utf8能夠存下大部分中文漢字,那為什么還要使用utf8mb4呢? 原來mysql支持的 utf8 編碼最大字符長度為 3 字節(jié),如果遇到 4 字節(jié)的寬字符就會插入異常了。三個字節(jié)的 UTF-8 最大能編碼的 Unicode 字符是 0xffff,也就是 Unicode 中的基本多文種平面(BMP)。也就是說,任何不在基本多文本平面的 Unicode字符,都無法使用 Mysql 的 utf8 字符集存儲。包括 Emoji 表情(Emoji是一種特殊的 Unicode 編碼,常見于 iosandroid 手機上),和很多不常用的漢字,以及任何新增的 Unicode 字符等等(utf8的缺點)。

通常,計算機在存儲字符時,會根據不同類型的字符以及編碼方式分配存儲空間。例如以下幾種編碼方式;

①ASCII編碼中,一個英文字母(不分大小寫)占用一個字節(jié)的空間,一個中文漢字占用兩個字節(jié)的空間。一個二進制的數字序列,在計算機中作為一個數字單元存儲時,一般為8位二進制數,換算為十進制。最小值0,最大值255。

②UTF-8編碼中,一個英文字符占用一個字節(jié)的存儲空間,一個中文(含繁體)占用三個字節(jié)的存儲空間。

③Unicode編碼中,一個英文占用兩個字節(jié)的存儲空間,一個中文(含繁體)占用兩個字節(jié)的存儲空間。

④UTF-16編碼中,一個英文字母字符或一個漢字字符存儲都需要占用2個字節(jié)的存儲空間(Unicode擴展區(qū)的一些漢字存儲需要4個字節(jié))。

⑤UTF-32編碼中,世界上任何字符的存儲都需要占用4個字節(jié)的存儲空間。

既然utf8能兼容絕大部分的字符,為什么要擴展utf8mb4?

隨著互聯網的發(fā)展,產生了許多新類型的字符,例如emoji這種類型的符號,也就是我們通常在聊天時發(fā)的小黃臉表情,這種字符的出現不在基本多平面的Unicode字符之中,導致無法在MySQL中使用utf8存儲,MySQL于是對utf8字符進行了擴展,增加了utf8mb4這個編碼。

所以,設計數據庫時如果想要允許用戶使用特殊符號,最好使用utf8mb4編碼來存儲,使得數據庫有更好的兼容性,但是這樣設計會導致耗費更多的存儲空間。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • MySQL
    +關注

    關注

    1

    文章

    890

    瀏覽量

    28870
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    labview怎么讀取UTF-16 LE 文本數據

    各位大佬 請問labview怎么讀取UTF-16 LE 文本數據 直接讀數據出來會有空格 但是空格無法刪除,請問怎么獲取UTF-16 LE格式數據
    發(fā)表于 10-10 11:23

    rt-thread程序的漢字字符串,如何提取漢字的gb2312編碼?

    我希望程序的漢字字串“歡迎光臨”取出來的字節(jié)數組是GB2312碼:“BB B6 D3 AD B9 E2 C1 D9 00”, 而實際出來的是UTF-8碼:“E6 AC A2 E8 BF 8
    發(fā)表于 09-29 07:14

    求助各位大佬,關于如何讀寫編碼格式為UTF-16LE的配置文件?

    如題,小白求助各位大佬,要怎么實現對編碼為UTF-16LE的配置文件的讀寫。 使用讀配置文件的vi讀不出內容。 使用讀文本的方式寫入異常,文件的編碼變成UTF-8且內容也不對。
    發(fā)表于 09-14 12:54

    終端GBK編碼顯示錯誤的原因?怎么解決?

    RT-thread studio終端,使用UTF8編碼中文顯示正常,使用GBK編碼時終端顯示亂碼。(以使用其他串口助手等核驗過串口數據,例如GBK下輸出“中文”D6 D0 CE C4,在
    發(fā)表于 09-11 07:50

    如何使用 UTF-8 編碼?

    如何使用 UTF-8 編碼?
    發(fā)表于 09-04 06:21

    【創(chuàng)龍TL3562-MiniEVM開發(fā)板試用體驗】8、FreeType顯示矢量文字

    [utf_8_len] <<4)& 0xf0) ; word[len] = (unicode[0]<<8) | unicode[1
    發(fā)表于 08-05 11:54

    GD32與STM32什么區(qū)別

    電子發(fā)燒友網站提供《GD32與STM32什么區(qū)別.docx》資料免費下載
    發(fā)表于 04-03 17:27 ?0次下載

    DLPvideo模式與pattern模式什么區(qū)別?

    你好,請問,在DLP相關文檔,提到video模式與 pattern模式,請問這兩種模式什么區(qū)別
    發(fā)表于 03-03 08:32

    私有云和公有云什么區(qū)別

    私有云和公有云在多個方面存在顯著的區(qū)別,以下是具體的比較,主機推薦小編為您整理發(fā)布私有云和公有云什么區(qū)別。
    的頭像 發(fā)表于 02-20 10:38 ?1111次閱讀

    AIGC和AI什么區(qū)別

    AIGC是AI在內容生成領域的一個特定應用方向,AI的技術發(fā)展為AIGC提供了基礎和支撐。那么,AIGC和AI什么區(qū)別呢?下面,AI部落小編帶您詳細了解。
    的頭像 發(fā)表于 02-20 10:33 ?1370次閱讀

    windows服務器備份mysql腳本

    一、linux備份 使用python腳本,要求python3和mysqldump #! /usr/bin/python36# -*- coding: utf-8 -*-import
    的頭像 發(fā)表于 01-02 09:14 ?578次閱讀

    ADS1256的SYSGCAL系統(tǒng)增益校準和SELFGCAL增益自動校準什么區(qū)別?

    請問一個問題:ADS1256的SYSGCAL系統(tǒng)增益校準和SELFGCAL 增益自動校準什么區(qū)別?SELFCAL 偏移和增益自動校準又有何區(qū)別?SELFOCAL偏移自動校準又何
    發(fā)表于 12-13 12:22

    FCCSP與FCBGA都是倒裝有什么區(qū)別

    本文簡單介紹了倒裝芯片球柵陣列封裝與倒裝芯片級封裝的概念與區(qū)別。 FCCSP與FCBGA都是倒裝,怎么區(qū)分?什么區(qū)別
    的頭像 發(fā)表于 11-16 11:48 ?5273次閱讀
    FCCSP與FCBGA都是倒裝有<b class='flag-5'>什么區(qū)別</b>

    美國多IP服務器和美國多服務器什么區(qū)別

    美國多IP服務器和美國多服務器什么區(qū)別 美國多IP服務器和美國多服務器在概念、功能以及應用場景上存在明顯的區(qū)別。主機推薦小編為您整理發(fā)布美國多IP服務器和美國多服務器
    的頭像 發(fā)表于 11-11 10:22 ?1035次閱讀

    RTOS與Linux到底什么區(qū)別

    很多做嵌入式開發(fā)的小伙伴都存在這樣的疑惑:RTOS與Linux到底什么區(qū)別?
    的頭像 發(fā)表于 10-29 09:53 ?1732次閱讀