58到家MySQL軍規升級版

2018040907:01

一、基礎規範

  • 表存儲引擎必須使用 InnoDB

 

  • 表字符集默認使用 utf8 ,必要時候使用 utf8mb4

解讀:

1 )通用,無亂碼風險,漢字 3 字節,英文 1 字節

2 utf8mb4 utf8 的超集,有存儲 4 字節例如表情符號時,使用它

 

  • 禁止使用存儲過程,視圖,觸發器, Event

解讀:

1 )對數據庫性能影響較大,互聯網業務,能讓站點層和服務層幹的事情,不要交到數據庫層

2 )調試,排錯,遷移都比較困難,擴展性較差

 

  • 禁止在數據庫中存儲大文件,例如照片,可以將大文件存儲在對象存儲系統,數據庫中存儲路徑

  • 禁止在線上環境做數據庫壓力測試

  • 測試,開發,線上數據庫環境必須隔離

 

二、命名規範

  • 庫名,表名,列名必須用小寫,採用下劃線分隔

解讀: abc Abc ABC 都是給自己埋坑

 

  • 庫名,表名,列名必須見名知義,長度不要超過 32 字符

解讀: tmp wushan 誰TM知道這些庫是乾嘛的

 

  • 庫備份必須以 bak 為前綴,以日期為後綴

  • 從庫必須以 -s 為後綴

  • 備庫必須以 -ss 為後綴

 

三、表設計規範

  • 單實例表個數必須控制在 2000 個以內

  • 單表分錶個數必須控制在 1024 個以內

  • 表必須有主鍵,推薦使用 UNSIGNED 整數為主鍵

潛在坑:刪除無主鍵的表,如果是 row 模式的主從架構,從庫會掛住

 

  • 禁止使用外鍵,如果要保證完整性,應由應用程式實現

解讀:外鍵使得表之間相互耦合,影響 update/delete SQL 性能,有可能造成死鎖,高並發情況下容易成為數據庫瓶頸

 

  • 建議將大字段,訪問頻度低的字段拆分到單獨的表中存儲,分離冷熱數據

解讀:具體參加《 如何實施數據庫垂直拆分

 

四、列設計規範

  • 根據業務區分使用 tinyint/int/bigint ,分別會佔用 1/4/8 字節

  • 根據業務區分使用 char/varchar

解讀:

1 )字段長度固定,或者長度近似的業務場景,適合使用 char ,能夠減少碎片,查詢性能高

2 )字段長度相差較大,或者更新較少的業務場景,適合使用 varchar ,能夠減少空間

 

  • 根據業務區分使用 datetime/timestamp

解讀:前者佔用 5 個字節,後者佔用 4 個字節,存儲年使用 YEAR ,存儲日期使用 DATE ,存儲時間使用 datetime

 

  • 必須把字段定義為 NOT NULL 並設默認值

解讀:

1 NULL 的列使用索引,索引統計,值都更加複雜, MySQL 更難優化

2 NULL 需要更多的存儲空間

3 NULL 只能採用 IS NULL 或者 IS NOT NULL ,而在 =/!=/in/not in 時有大坑

 

  • 使用 INT UNSIGNED 存儲 IPv4 ,不要用 char(15)

 

  • 使用 varchar(20) 存儲手機號,不要使用整數

解讀:

1 )牽扯到國家代號,可能出現 +/-/() 等字符,例如 +86

2 )手機號不會用來做數學運算

3 varchar 可以模糊查詢,例如 like '138%'

 

  • 使用 TINYINT 來代替 ENUM

解讀: ENUM 增加新值要進行 DDL 操作

 

五、索引規範

  • 唯一索引使用 uniq_[ 字段名 ] 來命名

  • 非唯一索引使用 idx_[ 字段名 ] 來命名

  • 單張表索引數量建議控制在 5 個以內

解讀:

1 )互聯網高並發業務,太多索引會影響寫性能

2 )生成執行計劃時,如果索引太多,會降低性能,並可能導致 MySQL 選擇不到最優索引

3 )異常複雜的查詢需求,可以選擇 ES 等更為適合的方式存儲

 

  • 組合索引字段數不建議超過 5

解讀:如果 5 個字段還不能極大縮小 row 範圍,八成是設計有問題

 

  • 不建議在頻繁更新的字段上建立索引

  • 非必要不要進行 JOIN 查詢,如果要進行 JOIN 查詢,被 JOIN 的字段必須類型相同,並建立索引

解讀:踩過因為JOIN字段類型不一致,而導致全表掃描的坑麼?

 

  • 理解組合索引最左前綴原則,避免重複建設索引,如果建立了 (a,b,c) ,相當於建立了 (a), (a,b), (a,b,c)

 

六、 SQL 規範

  • 禁止使用 select * ,只獲取必要字段

解讀:

1 select * 會增加 cpu/io/ 內存 / 帶寬的消耗

2 )指定字段能有效利用索引覆蓋

3 )指定字段查詢,在表結構變更時,能保證對應用程序無影響

 

  • insert 必須指定字段,禁止使用 insert into T values()

解讀:指定字段插入,在表結構變更時,能保證對應用程序無影響

 

  • 隱式類型轉換會使索引失效,導致全表掃描

 

  • 禁止在 where 條件列使用函數或者表達式

解讀:導致不能命中索引,全表掃描

 

  • 禁止負向查詢以及 % 開頭的模糊查詢

解讀:導致不能命中索引,全表掃描

 

  • 禁止大表 JOIN 和子查詢

  • 同一個字段上的 OR 必須改寫問 IN IN 的值必須少於 50

  • 應用程序必須捕獲 SQL 異常

解讀:方便定位線上問題

 

說明 :本軍規適用於 並發量大,數據量大 的典型 互聯網業務 ,可直接帶走參考,不謝。

https://mp.weixin.qq.com/s/YfCORbcCX1hymXBCrZbAZg