本部分内容参考自《MySQL 5.5从零开始学》。
MySQL 提供了大量的数据类型,为了优化存储,提高数据库性能,在任何情况下均应使用最精确的类型。即在所有可以表示该列值的类型中,该类型使用的存储最少。
整数型 & 浮点型
如果不需要小数部分,则使用整数来保存数据;如果需要表示小数部分,则使用浮点数类型。对于浮点数据列,存入的数值会对该列定义的小数位进行四舍五入。例如,如果列的值的范围为 1~99999
若使用整数,则 MEDIUMINT
、UNSIGNED
是最好的类型;若需要存储小数,则使用 FLOAT
类型。
浮点类型包括 FLOAT
和 DOUBLE
类型。DOUBLE
类型精度比 FLOAT
类型高,因此,如要求存储精度较高时,应选择 DOUBLE
类型。
浮点数 & 定点数
浮点数 FLOAT
、DOUBLE
相对于定点数 DECIMAL
的优势是:在长度一定的情况下,浮点数能表示更大的数据范围。但是由于浮点数容易产生误差,因此对精确度要求比较高时,建议使用 DECIMAL
来存储。DECIMAL
在 MySQL 中是以字符串存储的,用于定义货币等对精确度要求较高的数据。在数据迁移中,loat(M,D)
非标准 SQL
定义,数据库迁移可能会出现问题,最好不要这样使用。另外两个浮点数进行减法和比较运算时也容易出问题,因此在进行计算的时候,一定要小心。如果进行数值比较,最好使用 DECIMAL
类型。
日期 & 时间类型
MySQL 对于不同种类的日期和时间有很多的数据类型,比如 YEAR
和 TIME
。如果只需要记录年份,则使用 YEAR
类型即可;如果只记录时间,只须使用 TIME
类型。
如果同时需要记录日期和时间,则可以使用 TIMESTAMP
或者 DATETIME
类型。由于 TIMESTAMP
列的取值范围小于 DATETIME
的取值范围,因此存储范围较大的日期最好使用 DATETIME
。
TIMESTAMP
也有一个 DATETIME
不具备的属性。默认的情况下,当插入一条记录但并没有指定 TIMESTAMP
这个列值时,MySQL 会把 TIMESTAMP
列设为当前的时间。因此当需要插入记录同时插入当前时间时,使用 TIMESTAMP
是方便的,另外 TIMESTAMP
在空间上比 DATETIME
更有效。
CHAR & VARCAHR之间的特点与选择
CHAR & VARCHAR的区别
CHAR
是固定长度字符,VARCHAR
是可变长度字符;CHAR
会自动删除插入数据的尾部空格,VARCHAR
不会删除尾部空格。
CHAR
是固定长度,所以它的处理速度比 VARCHAR
的速度要快,但是它的缺点就是浪费存储空间。所以对存储不大,但在速度上有要求的可以使用 CHAR
类型,反之可以使用 VARCHAR
类型来实现。
存储引擎对于选择CHAR & VARCHAR的影响
对于 MyISAM 存储引擎:最好使用固定长度的数据列代替可变长度的数据列。这样可以使整个表静态化,从而使数据检索更快,用空间换时间。
对于 InnoDB 存储引擎:使用可变长度的数据列,因为 InnoDB 数据表的存储格式不分固定长度和可变长度,因此使用 CHAR
不一定比使用 VARCHAR
更好,但由于 VARCHAR
是按照实际的长度存储,比较节省空间,所以对磁盘 I/O 和数据存储总量比较好。
ENUM & SET
ENUM
只能取单值,它的数据列表是一个枚举集合。 它的合法取值列表最多允许有 65535 个成员。因此,在需要从多个值中选取一个时,可以使用 ENUM
。比如:性别字段适合定义为 ENUM
类型,每次只能从‘男’或‘女’中取一个值。
SET
可取多值。它的合法取值列表最多允许有 64 个成员。空字符串也是一个合法的 SET
值。在需要取多个值的时候,适合使用 SET
类型,比如:要存储一个人兴趣爱好,最好使用 SET
类型。
ENUM
和 SET
的值是以字符串形式出现的,但在内部,MySQL 以数值的形式存储它们。
BLOG & TEXT
BLOB
是二进制字符串,TEXT
是非二进制字符串,两者均可存放大容量的信息。BLOB
主要存储图片、音频信息等,而 TEXT
只能存储纯文本文件。应分清两者的用途。
评论区