VARCHAR 和 CHAR 是兩種主要的字符串類型,用于存儲字符。不幸的是,由于實現(xiàn)的方式依賴于存儲引擎,因此很難解釋這些字符串在磁盤和內(nèi)存中如何存儲,除了除了常用的 InnoDB 和 MyISAM 外,假設(shè)你使用了其他存儲引擎,應(yīng)當仔細閱讀存儲引擎的文檔。
10年積累的做網(wǎng)站、成都網(wǎng)站制作經(jīng)驗,可以快速應(yīng)對客戶對網(wǎng)站的新想法和需求。提供各種問題對應(yīng)的解決方案。讓選擇我們的客戶得到更好、更有力的網(wǎng)絡(luò)服務(wù)。我雖然不認識你,你也不認識我。但先網(wǎng)站設(shè)計后付款的網(wǎng)站建設(shè)流程,更有綏德免費網(wǎng)站建設(shè)讓你可以放心的選擇與我們合作。
VARCHAR 存儲可變長度的字符串,也是最常用的字符數(shù)據(jù)類型。相比固定長度的類型,VARCHAR 所需的存儲空間更小,它會盡可能少地使用存儲空間(例如,短的字符串占據(jù)的空間)。對于 MyISAM 來說,如果創(chuàng)建表的時候指定了 ROW_FORMAT=FIXED 的話,那么會使用固定的空間存儲字段而導(dǎo)致空間浪費。VARCHAR 使用1-2個額外的字節(jié)存儲字符串的長度:當最大長度低于255字節(jié)的時候使用1個字節(jié),如果更多的話就使用2個字節(jié)。因此,拉丁字符集的 VARCHAR(10)會使用11個字節(jié)的存儲空間,而 VARCHAR(1000)則會使用1002個字節(jié)的存儲空間。
VARCHAR 由于能夠節(jié)省空間,因此可以改善性能。但是,由于長度可變,當更新數(shù)據(jù)表的時候數(shù)據(jù)行的存儲空間會變化,這一定程度上會帶來額外的開銷。如果數(shù)據(jù)行的長度導(dǎo)致原有的存儲位置無法存放,那么不同的存儲引擎會做不同的處理。例如 MyISAM 可能產(chǎn)生數(shù)據(jù)行的碎片,而 InnoDB 需要進行磁盤分頁來存放更新后的數(shù)據(jù)行。
通常,如果最大的列長度遠遠高于平均長度的話(例如可選的備注字段),使用 VARCHAR 是劃算的,同時如果更新的頻次很低,那么碎片化也不會是一個問題。需要注意的是,如果使用的是 UTF-8字符集,則實際存儲的字節(jié)長度是根據(jù)字符定的。對于中文,推薦的存儲字符集是 utf8mb4。
CHAR 類型的長度是固定的,MySQL 會對每個字段分配足夠的存儲空間。 存儲CHAR 類型值的時候,MySQL 會移除后面多出來的空字符 。值是使用空字符進行對齊以便進行比較。對于短的字符串來說,使用 CHAR 更有優(yōu)勢,而如果所有的值的長度幾乎一致的話,就可以使用 CHAR。例如存儲用戶密碼的MD5值時使用 CHAR 就更合適,這是因為 MD5的長度總是固定的。同時,對于字段值經(jīng)常改變的數(shù)據(jù)類型來說,CHAR 相比 VARCHAR 也更有優(yōu)勢,因為 CHAR 不會產(chǎn)生碎片。對于很短的數(shù)據(jù)列,使用 CHAR 比 VARCHAR更高效,例如使用CHAR(1)存儲邏輯值的 Y 和 N,這種情況下只需要1個字節(jié),而 VARCHAR 需要2個字節(jié)。
對于移除空字符這個特性會感覺奇怪,我們舉個例子:
按上面的結(jié)果插入數(shù)據(jù)表后,string2中的前置空格不會移除,但使用 CHAR 類型存儲時,string3尾隨空格會被移除,使用 SQL 查詢結(jié)果來檢驗一下:
得出來的結(jié)果如下,可以看到 CHAR 類型的 string3后面的空格被移除了,而 VARCHAR類型的沒有。這種情況大多數(shù)時候不會有什么問題,實際在應(yīng)用中也經(jīng)常會使用 trim 函數(shù)移除兩端的空字符,但是如果確實需要存儲空格的時候,那就需要注意不要選擇使用 CHAR 類型:
數(shù)據(jù)如何存儲是由存儲引擎決定的,而且存儲引擎處理固定長度和可變長度的數(shù)據(jù)的方式并不相同。Memory 引擎使用固定大小的行,因此它需要分配最大可能的存儲空間——即便數(shù)據(jù)長度是可變的。但是,對于字符串的對齊和空字符截斷是由 MySQL 服務(wù)端完成的,因此所有存儲引擎都是一樣的。
與 CHAR 和 VARCHAR 相似的是 BINARY和 VARBINARY,用于存儲二進制字節(jié)字符,BINARY 的對齊使用字符0的字節(jié)值來對齊,并且再獲取值的時候不會截斷。如果需要使用字符的字節(jié)值而不是字符的話,使用 BINARY 會更高效,這是因為比較時,一方面不需要考慮大小寫,另一方面是MySQL一次只比較一個字節(jié)。
MySQL 數(shù)據(jù)類型細分下來,大概有以下幾類:
數(shù)值,典型代表為 tinyint,int,bigint
浮點/定點,典型代表為 float,double,decimal 以及相關(guān)的同義詞
字符串,典型代表為 char,varchar
時間日期,典型代表為 date,datetime,time,timestamp
二進制,典型代表為 binary,varbinary
位類型
枚舉類型
集合類型
大對象,比如 text,blob
json 文檔類型
一、數(shù)值類型(不是數(shù)據(jù)類型,別看錯了)如果用來存放整數(shù),根據(jù)范圍的不同,選擇不同的類型。
以上是幾個整數(shù)選型的例子。整數(shù)的應(yīng)用范圍最廣泛,可以用來存儲數(shù)字,也可以用來存儲時間戳,還可以用來存儲其他類型轉(zhuǎn)換為數(shù)字后的編碼,如 IPv4 等。示例 1用 int32 來存放 IPv4 地址,比單純用字符串節(jié)省空間。表 x1,字段 ipaddr,利用函數(shù) inet_aton,檢索的話用函數(shù) inet_ntoa。
查看磁盤空間占用,t3 占用最大,t1 占用最小。所以說如果整數(shù)存儲范圍有固定上限,并且未來也沒有必要擴容的話,建議選擇最小的類型,當然了對其他類型也適用。root@ytt-pc:/var/lib/mysql/3305/ytt# ls -sihl總用量 3.0G3541825 861M -rw-r----- 1 mysql mysql 860M 12月 10 11:36 t1.ibd3541820 989M -rw-r----- 1 mysql mysql 988M 12月 10 11:38 t2.ibd3541823 1.2G -rw-r----- 1 mysql mysql 1.2G 12月 10 11:39 t3.ibd
二、浮點數(shù) / 定點數(shù)先說?浮點數(shù),float 和 double 都代表浮點數(shù),區(qū)別簡單記就是 float 默認占 4 Byte。float(p) 中的 p 代表整數(shù)位最小精度。如果 p 24 則直接轉(zhuǎn)換為 double,占 8 Byte。p 最大值為 53,但最大值存在計算不精確的問題。再說?定點數(shù),包括 decimal 以及同義詞 numeric,定點數(shù)的整數(shù)位和小數(shù)位分別存儲,有效精度最大不能超過 65。所以區(qū)別于 float 的在于精確存儲,必須需要精確存儲或者精確計算的最好定義為 decimal 即可。示例 3創(chuàng)建一張表 y1,分別給字段 f1,f2,f3 不同的類型。mysql-(ytt/3305)-create table y1(f1 float,f2 double,f3 decimal(10,2));Query OK, 0 rows affected (0.03 sec)
三、字符類型字符類型和整形一樣,用途也很廣。用來存儲字符、字符串、MySQL 所有未知的類型??梢院唵握f是萬能類型!
char(10) 代表最大支持 10 個字符存儲,varhar(10) 雖然和 char(10) 可存儲的字符數(shù)一樣多,不同的是 varchar 類型存儲的是實際大小,char 存儲的理論固定大小。具體的字節(jié)數(shù)和字符集相關(guān)。示例 4例如下面表 t4 ,兩個字段 c1,c2,分別為 char 和 varchar。mysql-(ytt/3305)-create table t4 (c1 char(20),c2 varchar(20));Query OK, 0 rows affected (0.02 sec)
所以在 char 和 varchar 選型上,要注意看是否合適的取值范圍。比如固定長度的值,肯定要選擇 char;不確定的值,則選擇 varchar。
四、日期類型日期類型包含了 date,time,datetime,timestamp,以及 year。year 占 1 Byte,date 占 3 Byte。
time,timestamp,datetime 在不包含小數(shù)位時分別占用 3 Byte,4 Byte,8 Byte;小數(shù)位部分另外計算磁盤占用,見下面表格。
請點擊輸入圖片描述
請點擊輸入圖片描述
請點擊輸入圖片描述
注意:timestamp 代表的時間戳是一個 int32 存儲的整數(shù),取值范圍為 '1970-01-01 00:00:01.000000' 到 '2038-01-19 03:14:07.999999';datetime 取值范圍為 '1000-01-01 00:00:00.000000' 到 '9999-12-31 23:59:59.999999'。
綜上所述,日期這塊類型的選擇遵循以下原則:
1. 如果時間有可能超過時間戳范圍,優(yōu)先選擇 datetime。2. 如果需要單獨獲取年份值,比如按照年來分區(qū),按照年來檢索等,最好在表中添加一個 year 類型來參與。3. 如果需要單獨獲取日期或者時間,最好是單獨存放,而不是簡單的用 datetime 或者 timestamp。后面檢索時,再加函數(shù)過濾,以免后期增加 SQL 編寫帶來額外消耗。
4. 如果有保存毫秒類似的需求,最好是用時間類型自己的特性,不要直接用字符類型來代替。MySQL 內(nèi)部的類型轉(zhuǎn)換對資源額外的消耗也是需要考慮的。
示例 5
建立表 t5,對這些可能需要的字段全部分離開,這樣以后寫 SQL 語句的時候就很容易了。
當然了,這種情形占用額外的磁盤空間。如果想在易用性與空間占用量大這兩點來折中,可以用 MySQL 的虛擬列來實時計算。比如假設(shè) c5 字段不存在,想要得到 c5 的結(jié)果。mysql-(ytt/3305)-alter table t5 drop c5, add c5 year generated always as (year(c1)) virtual;Query OK, 1 row affected (2.46 sec)Records: 1 ?Duplicates: 0 ?Warnings: 0
五、二進制類型
binary 和 varbinary 對應(yīng)了 char 和 varchar 的二進制存儲,相關(guān)的特性都一樣。不同的有以下幾點:
binary(10)/varbinary(10) 代表的不是字符個數(shù),而是字節(jié)數(shù)。
行結(jié)束符不一樣。char 的行結(jié)束符是 \0,binary 的行結(jié)束符是 0x00。
由于是二進制存儲,所以字符編碼以及排序規(guī)則這類就直接無效了。
示例 6
來看這個 binary 存取的簡單示例,還是之前的變量 @a。
切記!這里要提前計算好 @a 占用的字節(jié)數(shù),以防存儲溢出。
六、位類型
bit 為 MySQL 里存儲比特位的類型,最大支持 64 比特位, 直接以二進制方式存儲,一般用來存儲狀態(tài)類的信息。比如,性別,真假等。具有以下特性:
1. 對于 bit(8) 如果單純存放 1 位,左邊以 0 填充 00000001。2. 查詢時可以直接十進制來過濾數(shù)據(jù)。3. 如果此字段加上索引,MySQL 不會自己做類型轉(zhuǎn)換,只能用二進制來過濾。
示例 7
創(chuàng)建表 c1, 字段性別定義一個比特位。mysql-(ytt/3305)-create table c1(gender bit(1));Query OK, 0 rows affected (0.02 sec)
mysql-(ytt/3305)-select cast(gender as unsigned) ?'f1' from c1;+------+| f1 ? |+------+| ? ?0 || ? ?1 |+------+2 rows in set (0.00 sec)
過濾數(shù)據(jù)也一樣,二進制或者直接十進制都行。mysql-(ytt/3305)-select conv(gender,16,10) as gender \???- from c1 where gender = b'1';?+--------+| gender |+--------+| 1??????|+--------+1 row in set (0.00 sec)????mysql-(ytt/3305)-select conv(gender,16,10) as gender \????- from c1 where gender = '1';+--------+| gender |+--------+| 1??????|+--------+1 row in set (0.00 sec)
其實這樣的場景,也可以定義為 char(0),這也是類似于 bit 非常優(yōu)化的一種用法。
mysql-(ytt/3305)-create table c2(gender char(0));Query OK, 0 rows affected (0.03 sec)
那現(xiàn)在我給表 c1 簡單的造點測試數(shù)據(jù)。
mysql-(ytt/3305)-select count(*) from c1;+----------+| count(*) |+----------+| 33554432 |+----------+1 row in set (1.37 sec)
把 c1 的數(shù)據(jù)全部插入 c2。
mysql-(ytt/3305)-insert into c2 select if(gender = 0,'',null) from c1;Query OK, 33554432 rows affected (2 min 18.80 sec)Records: 33554432 ?Duplicates: 0 ?Warnings: 0
兩張表的磁盤占用差不多。root@ytt-pc:/var/lib/mysql/3305/ytt# ls -sihl總用量 1.9G4085684 933M -rw-r----- 1 mysql mysql 932M 12月 11 10:16 c1.ibd4082686 917M -rw-r----- 1 mysql mysql 916M 12月 11 10:22 c2.ibd
檢索方式稍微有些不同,不過效率也差不多。所以說,字符類型不愧為萬能類型。
七、枚舉類型
枚舉類型,也即 enum。適合提前規(guī)劃好了所有已經(jīng)知道的值,且未來最好不要加新值的情形。枚舉類型有以下特性:
1. 最大占用 2 Byte。2. 最大支持 65535 個不同元素。3. MySQL 后臺存儲以下標的方式,也就是 tinyint 或者 smallint 的方式,下標從 1 開始。4. 排序時按照下標排序,而不是按照里面元素的數(shù)據(jù)類型。所以這點要格外注意。
示例 8
創(chuàng)建表 t7。mysql-(ytt/3305)-create table t7(c1 enum('mysql','oracle','dble','postgresql','mongodb','redis','db2','sql server'));Query OK, 0 rows affected (0.03 sec)
八、集合類型
集合類型 SET 和枚舉類似,也是得提前知道有多少個元素。SET 有以下特點:
1. 最大占用 8 Byte,int64。2. 內(nèi)部以二進制位的方式存儲,對應(yīng)的下標如果以十進制來看,就分別為 1,2,4,8,...,pow(2,63)。3. 最大支持 64 個不同的元素,重復(fù)元素的插入,取出來直接去重。4. 元素之間可以組合插入,比如下標為 1 和 2 的可以一起插入,直接插入 3 即可。
示例 9
定義表 c7 字段 c1 為 set 類型,包含了 8 個值,也就是下表最大為 pow(2,7)。
mysql-(ytt/3305)-create table c7(c1 set('mysql','oracle','dble','postgresql','mongodb','redis','db2','sql server'));Query OK, 0 rows affected (0.02 sec)
插入 1 到 128 的所有組合。
mysql-(ytt/3305)-INSERT INTO c7WITH RECURSIVE ytt_number (cnt) AS ( ? ? ? ?SELECT 1 AS cnt ? ? ? ?UNION ALL ? ? ? ?SELECT cnt + 1 ? ? ? ?FROM ytt_number ? ? ? ?WHERE cnt pow(2, 7) ? ?)SELECT *FROM ytt_number;Query OK, 128 rows affected (0.01 sec)Records: 128 ?Duplicates: 0 ?Warnings: 0
九、數(shù)據(jù)類型在存儲函數(shù)中的用法
函數(shù)里除了顯式聲明的變量外,默認 session 變量的數(shù)據(jù)類型很弱,隨著給定值的不同隨意轉(zhuǎn)換。
示例 10
定義一個函數(shù),返回兩個給定參數(shù)的乘積。定義里有兩個變量,一個是 v_tmp 顯式定義為 int64,另外一個 @vresult 隨著給定值的類型隨意變換類型。
簡單調(diào)用下。
mysql-(ytt/3305)-select ytt_sample_data_type(1111,222) 'result';+--------------------------+| result ? ? ? ? ? ? ? ? ? |+--------------------------+| The result is: '246642'. |+--------------------------+1 row in set (0.00 sec)
總結(jié)
本篇把 MySQL 基本的數(shù)據(jù)類型做了簡單的介紹,并且用了一些容易理解的示例來梳理這些類型。我們在實際場景中,建議選擇適合最合適的類型,不建議所有數(shù)據(jù)類型簡單的最大化原則。比如能用 varchar(100),不用 varchar(1000)。
一:MySQL數(shù)據(jù)類型
MySQL中定義數(shù)據(jù)字段的類型對你數(shù)據(jù)庫的優(yōu)化是非常重要的
MySQL支持多種數(shù)據(jù)類型,大致可以分為三類:數(shù)值 日期/時間和字符串
二、數(shù)值類型
1.整數(shù)類型
2.浮點數(shù)
如果希望保證值比較準確,推薦使用定點數(shù)數(shù)據(jù)類型。MySql中的浮點類型有float,double和real。他們定義方式為:FLOAT(M,D) 、 REAL(M,D) 、 DOUBLE PRECISION(M,D)。
FLOAT和DOUBLE中的M和D的取值默認都為0,即除了最大最小值,不限制位數(shù)。允許的值理論上是-1.7976931348623157E+308~-2.2250738585072014E-308、0和2.2250738585072014E-308~1.7976931348623157E+308。M、D范圍如下:
(MySql5.7實測,與IEEE標準計算的實際是不同的,下面介紹):M取值范圍為0~255。FLOAT只保證6位有效數(shù)字的準確性,所以FLOAT(M,D)中,M=6時,數(shù)字通常是準確的。如果M和D都有明確定義,其超出范圍后的處理同decimal。
D取值范圍為0~30,同時必須=M。double只保證16位有效數(shù)字的準確性,所以DOUBLE(M,D)中,M=16時,數(shù)字通常是準確的。如果M和D都有明確定義,其超出范圍后的處理同decimal。
CHAR值時,在它們的右邊填充空格以達到指定的長度。當檢索到CHAR值時,尾部的空格被刪除掉,所以,我們在存儲時字符串右邊不能有空格,即使有,查詢出來后也會被刪除。在存儲或檢索過程中不進行大小寫轉(zhuǎn)換。
三、時間日期類型(5)
該“0”值如下:
請點擊輸入圖片描述
四、各種類型占用的存儲
1.數(shù)值類型
請點擊輸入圖片描述
定點數(shù)的比較特殊,而且與具體版本也有關(guān)系,此處單獨解釋:
使用二進制格式將9個十進制(基于10)數(shù)壓縮為4個字節(jié)來表示DECIMAL列值。每個值的整數(shù)和分數(shù)部分的存儲分別確定。每個9位數(shù)的倍數(shù)需要4個字節(jié),并且“剩余的”位需要4個字節(jié)的一部分。下表給出了超出位數(shù)的存儲需求:
請點擊輸入圖片描述
2.時間日期
請點擊輸入圖片描述
從版本5.6.4開始,存儲需求就有所改變,根據(jù)精度而定。不確定部分需要的存儲如下:
請點擊輸入圖片描述
比如,TIME(0), TIME(2), TIME(4), 和TIME(6) 分別使用3, 4, 5, 6 bytes?!?/p>
3.字符串
請點擊輸入圖片描述
4.類型的選擇
為了優(yōu)化存儲,在任何情況下均應(yīng)使用最精確的類型。
例如,如果列的值的范圍為從1到99999,若使用整數(shù),則MEDIUMINT UNSIGNED是好的類型。在所有可以表示該列值的類型中,該類型使用的存儲最少。
用精度為65位十進制數(shù)(基于10)對DECIMAL 列進行所有基本計算(+、-、*、/)。
使用雙精度操作對DECIMAL值進行計算。如果準確度不是太重要或如果速度為最高優(yōu)先級,DOUBLE類型即足夠了。為了達到高精度,可以轉(zhuǎn)換到保存在BIGINT中的定點類型。這樣可以用64位整數(shù)進行所有計算,根據(jù)需要將結(jié)果轉(zhuǎn)換回浮點值。
5.使用其他數(shù)據(jù)庫的SQL語句
為了使用為其它數(shù)據(jù)庫編寫的SQL執(zhí)行代碼,MySQL按照下表所示對列類型進行映射。通過這些映射,可以很容易地從其它數(shù)據(jù)庫引擎將表定義導(dǎo)入到MySQL中:
請點擊輸入圖片描述
一、修改表
二、復(fù)制表
三、表字段的數(shù)據(jù)類型
存儲引擎決定了表的類型,而表內(nèi)存放的數(shù)據(jù)也要有不同的類型,每種數(shù)據(jù)類型都有自己的寬度,但寬度是可選的。
mysql常用數(shù)據(jù)類型有:
數(shù)值類型
1、整數(shù)類型
TINYINT SMALLINT MEDIUMINT INT BIGINT
作用:存儲年齡,等級,id,各種號碼等
注意:為該類型指定寬度時,僅僅只是指定查詢結(jié)果的顯示寬度,與存儲范圍無關(guān),存儲范圍如下
其實我們完全沒必要為整數(shù)類型指定顯示寬度,使用默認的就可以了
默認的顯示寬度,都是在最大值的基礎(chǔ)上加1
2、浮點型
定點數(shù)類型 DEC等同于DECIMAL
浮點類型:FLOAT DOUBLE
作用:存儲薪資、身高、體重、體質(zhì)參數(shù)等
3、日期類型
DATE TIME DATETIME TIMESTAMP YEAR
作用:存儲用戶注冊時間,文章發(fā)布時間,員工入職時間,出生時間,過期時間等
datatime與timestamp的區(qū)別
4、字符串類型
總結(jié):
單從數(shù)據(jù)類型的實現(xiàn)機制去考慮,char數(shù)據(jù)類型的處理速度更快,有時甚至可以超出varchar處理速度的50%。
但對于InnoDB數(shù)據(jù)表,內(nèi)部的行存儲格式?jīng)]有區(qū)分固定長度和可變長度列(所有數(shù)據(jù)行都使用指向數(shù)據(jù)列值的頭指針),因此在本質(zhì)上,使用固定長度的CHAR列不一定比使用可變長度VARCHAR列性能要好。因而,主要的性能因素是數(shù)據(jù)行使用的存儲總量。由于CHAR平均占用的空間多于VARCHAR,因此使用VARCHAR來最小化需要處理的數(shù)據(jù)行的存儲總量和磁盤I/O是比較好的。
5、枚舉類型和集合類型
字段的值只能在給定范圍中選擇,如單選框,多選框
enum 單選 只能在給定的范圍內(nèi)選一個值,如性別 sex 男male/女female
set 多選 在給定的范圍內(nèi)可以選擇一個或一個以上的值(愛好1,愛好2,愛好3...)
網(wǎng)站題目:mysql怎么選數(shù)據(jù)類型,mysql怎么選擇數(shù)據(jù)庫
網(wǎng)站URL:http://sd-ha.com/article20/dsecsjo.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供外貿(mào)建站、服務(wù)器托管、定制網(wǎng)站、靜態(tài)網(wǎng)站、企業(yè)網(wǎng)站制作、移動網(wǎng)站建設(shè)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)