苦水润喉 阅读(57) 评论(0)

一、数据类型概述

 MySQL的数据类型有大概可以分为5种,分别是 整数类型、浮点数类型和定点数类型、日期和时间类型、字符串类型、二进制类型。现在可以来看看你对这5种类型的熟悉程度,哪个看起来懵逼了,那就说明自己哪个不熟悉,不理解。  

 注意:整数类型和浮点数类型可以统称为数值数据类型,这不难理解。

        1)数值数据类型

          整数类型:TINYINT、SMALLINT、MEDIUMINT、INT、BIGINT

          浮点数类型:FLOAT、DOUBLE

          定点小数:DECIMAL

        2)日期/时间类型

          YEAR、TIME、DATE、DATETIME、TIMESTAMP

        3)字符串类型

          CHAR、VARCHAR、TEXT、ENUM、SET等   

        4)二进制类型

          BIT、BINARY、VARBINARY、BLOB

 

二、整数类型

                

    不管你学什么语言,在基础方面,都应该知道  1个字节= 8位二进制数。 每个类型的取值范围也就能够知道,比如 TINYINT占用1个字节,也就是8位,2的8次方减1等于255,也就是说如果代表没符号的整数,该取值范围为0~255,

    如果是有符号的,最高位为符号号位,也就是2的7次方减1,也就是127,取值范围为-128~127, 为什么需要减1,这个问题就需要考虑临界值的问题了。

    而考虑临界值问题又有需要讨论原码补码反码的知识,这些度不是我们讨论的重点,所以在这就自行百度。给出一张范围表,给大家做参考。

 

                不同整数类型的取值范围

          

      根据自己所需去选取不同的类型名称,

      例如:

         CREATE TABLE aaa(

            id INT(10) PRIMARY KEY,

            age INT(6)

         );

      这个例子中INT(10)、INT(6) 括号中的数字表示的是该数据类型指定的显示宽度,指定能够显示的数值中数字的个数。这里要注意:显示宽度和数据类型的取值范围是无关的,显示宽度只是指明MySQL最大可能显示的数字个数,注意是可能。通俗点讲就是,比如这个age字段,显示宽度为6,但是如果你插入的数据大于6,达到了8,6666 6666,那也没关系,只要插入的数值的位数不超过该类型整数的取值范围,就行,如果插入的数值长度是4,或者3,数值的位数小于指定的宽度,后面的位数就会由空格填空,5555插入age字段,存的就是"5555  "后面用空格补齐。还有一点,这个显示宽度没限制,你写100度没问题,但是插入数据时,实际起控制作用的还是数据类型的取值范围。如果不写显示宽度,就会用系统默认的,比如,INT的默认显示宽度是11,看上面表,最高也就能表示10位大小的数值,但是要注意,有符号的,也就是负数时,符号位也占一位。

 

三、浮点数类型和定点数类型

            

  3.1、解释M,D的意思

              M:数值的总位数。 通俗点讲,就是看有多少个数字,比如,5.6789,M就是5

              D:小数点后面能保留几位。 比如上面的5.6789 ,D就是4。 这只是举一个例子,来说明M,D是什么,实际是先有M,D的,然后在来控制数值,而不是更具数值来确定M,D。

          不单单就MECIMAL有M,D这两个参数,FLOAT 和 DOUBLE 度有,看下面例子

         比如:

           CREATE TABLE tmp(

              x FLOAT(3,1),

              y DOUBLE(5,3),

              z DECIMAL(5,4)

           );

           假设x插入的值为:5.69,56.78,5.438,349.2 (注意:实验给x这个字段插入的值,可能实验了三次,不要错看成x的值为5.69,y为56.78等等了)

           实际上在数据库中存的值为:5.7,56.9,5.3,349.2这个报错

           分析:x的M为3,D为1,那么小数点上必须是占了一位数字,就算没有值,也会用0来填充,所以说,整数位上最多就只能是2位,这里要切记要先根据D的值,来算整数位能最多有多少位。

           通过分析x,y和z也就简单了,

            y字段上的值,整数部分最多是2位,小数点后的位数最多是3位,也就是说小数点后超过了3位,就会四舍五入。

            z字段上的值,整数部分最多只能是一位,小数点后的位数最多是4位,如果不足4位,也会用0补充。比如插入1.56,在数据库中存的就是1.5600, 比如插入25.46,这个就会报错,因为整数部分只能是一位,小数点后的位数已经占了4位了。这里要搞清楚。

 

  3.2、FLOAT、DOUBLE、DECIMAL三者的区别

            都是用来表示我们所说的小数的也就是浮点数,但是三种的精度不一样,也就是后面显示的位数不一样,

              区别一:

                FLOAT显示后面的小数点位大概在40多位,

                DOUBLE能显示的就是300多位了,不是一个层次上的,

                DECIMAL这个小数点后面能显示的位数跟DOUBLE差不多,

              区别二:

                 FLOAT和DOUBLE在不指定精度时,也就是不用(M,D),默认会按照实际的精度,也就是你写多少就是多少,而DECIMAL如不指定精度默认为(10,0),也就是如果不指定精度,插入数值56.89,在数据库中存储的就是57。所以一般使用DECIMAL时就会指定精度,而使用FLOAT和DOUBLE就不用。

              区别三:

                 浮点数相对与定点数(DECIMAL)的优点就是在长度一定的情况下,浮点数能够表示更大的数据范围,但是缺点是会引起精度问题。

 

  3.3、什么时候使用FLOAT、DOUBLE、DECIMAL

            对精度要求比较高的时候,比如货币、科学数据等,使用DECIMAL的类型比较好。其他的时候,看你要存放的数据的大小而定了,一般使用DOUBLE。

          并且在使用浮点数时需要注意,尽量避免做浮点数的比较,比如加、减,谁大谁小,这样的操作,会引起精度缺失。相信在一些程序语言中,遇到过float精度丢失的问题。   

四、日期与时间类型

            

         现在有些东西看不懂没关系,大概有个了解先,接下来一一进行讲解。

  4.1、YEAR 

           1)重点看他的存储范围,1901~2155. 在插入该数值时,有两种方式,一种是用字符串来代表插入的YEAR值,另一种是用数字代表YEAR值,其中字符串插入的可以用单引号和双引号,没区别,

              跟一些程序设计语言不一样,单个字符就必须用单引号,多字符就要用双引号,在MySQL中,单双引号度表示字符。

             例子:

              CREATE TABLE tmp(

                y YEAR

              );     

             向表中插入数据:INSERT INTO tmp VALUES(2010),('2010'),("2010");

             查询表中数据:SELECT * FROM tmp;

             能查看三条记录度插入到数据库tmp表中了。注意:这里插入数据和查询数据操作还没学过,如果不知道,可以暂时跳过,直接看结论。

                        

 

             如果向表中插入超出范围的值,2166则会报错

                       

          2)在插入完整年份时,用字符串和用数字代表YEAR值的效果是一样的,但是当省略YEAR值时,用这两种方式就不一样了。

              例子一:就拿上面那张tmp表来说。向表中插入用字符串代表的YEAR值,'’0' 、'00'、 '77'、 '10'

                删除表中数据:DELETE FROM tmp;

                向表中插入数据:INSERT INTO tmp VALUES('0'),('00'),('77'),('10');

                       

               结果:

                  插入的字符'0'、'00'变成了2000

                  插入的字符'77'变成了1977

                  插入的字符'10'变成了2010

 

             例子二:向tmp表中y字段插入2位数字表示YEAR值,0,00,78,11

                删除表中数据:DELETE FROM tmp;

                向表中插入数据:INSERT INTO tmp VALUES(0),(00),(77),(11);

                       

                结果:

                   插入的数字0、00变成了0000

                   插入的数字77变成了1977

                   插入的数字11变成了2011

        

            结论:在省略写年份时,

               1、用字符表示和用数字表示的区别就在于0。如果是字符0或字符00,则在数据库中会生成2000,如果是数字0或00,则会生成0000. 

               2、在不超过70,也就是小于70,度会生成2000年以上,也就是如果是69,则生成2069.如果是70以上包含70,就会变成1970以上。比如70,就会变为1970。也就是00-69范围的年值转换为2000~2069. 70-99范围的年值转换为1970~1999

               3、一般我们如果要使用,也就用全称,这样不容易混淆,但是得知道有这些特

  4.2、TIME       

          格式:HH:MM:SS   HH表示小时 、MM表示分钟、SS表示秒

          取值范围:-838:59:59 ~ 838:59:59

          解释:这里的时间不仅仅可以用来表示一天的时间(也就是24小时),还可能是某件事情过去的时间或两个事件之间的时间间隔,通俗点讲,我们平常每天的时间就是从凌晨0点就重新开始计时,计满24个小时,然后又重新开始,也就相当于当前我们看到的时间是凌晨0点              过去的时间,也就是距凌晨0点过去了多少个小时。 早上7点,也就是距离凌晨0点这件事7个小时,以此类推,直到距离了24个小时,然后重新开始计算。 在MySQL中,这个TIME就不局限于每天距离凌晨0点多长时间了,可以是过去某个时间距离现在多长时间                了,比如昨天早上7点,距离现在上午9.00多长时间了,就超过了24小时,所以。这个TIME的取值范围就比我们所理解的24小时更大。

          1)表示TIME有很多种格式,上面的HH:MM:SS只是标准的一种,

            1、D HH:MM:SS :D表示日、天数。在数据库中存储时,D会被转换为小时保存,D*24+HH

            2、HH:MM 、D:HH、 SS  :这些格式度是可以的,注意最后一个,如果是单独就是2个数字,那么就代表的是秒,比如"20"那就代表的是00:00:20 

            3、HHMMSS: 这是没有间隔符的字符串或者数值,比如101112会被理解为10:11:12,但是109712就是不合法的,因为分钟位上超过了59。存储时会报错。

              这个没有冒号时需要注意一点,数值的最右边两位表示秒,以此类推,比如 5523 表示的是00:55:23而不是55:23:00。

              所以说上面SS格式时代表的是秒就是这样来的,从最右边看起。如果有冒号,则从左边小时开始看起,比如 55:23 就是代表的55:23:00 

          例如:

            CREATE TABLE tmp(

              t TIME

            );

            插入值"10:05:05"、"23:23"、"2 10:10"、"3 02"、"10"、"101112"、"109712"

            INSERT INTO tmp VALUES("10:05:05"),("23:23"),("2 10:10"),("3 02"),("10"),("101112");

            SELECT * FROM tmp;  

                      

            可以看出:都是如我们预期的那样显示数据。  

          2)使用系统的函数,插入当前的时间。

            DELETE FROM tmp;

            INSERT INTO tmp VALUES(CURRENT_TIME),(NOW());

            SELECT * FROM tmp;

                     

            

  4.3、DATE

            格式:YYYY-MM-DD  YYYY表示年份  MM表示月份  DD表示日

            取值范围:1000-01-01~9999-12-3

              使用字符或者数值的数据度可以插入

            注意:这个除了标准格式之外,跟TIME一样YEAR一样,在年份这里也有其省略格式,其规则和YEAR中一样。00-69范围的年值转换为2000~2069. 70-99范围的年值转换为1970~1999。  例如:12-12-31 表示2012-12-31  981231表示1998-12-31

            也可以使用CURRENT_DATE或者NOW()插入当前的系统日期。

            例子:(注意,每次创建表之前,会把之前的老表给删除掉,这里省略掉了,使用DROP TABLE 表名; )

               CREATE TABLE tmp(

                 d DATE

               );

               INSERT INTO tmp VALUES("1998-08-08"),(19980808),(100511),(CURRENT_DATE),(NOW());

               SELECT * FROM tmp;

                      

 

            注意:MySQL允许“不严格”语法,也就是任何标点符号度可以当用日期部分之间的间隔符,比如"98.11.23"、"98/11/31"、"98@11@31"都可以,自己可以去尝试尝试,但是一般使用标准格式比较好,让人看起来舒服。

 

  4.4、DATETIME  

            格式:YYYY-MM-DD HH:MM:SS 

            取值范围:1000-01-01 00:00:00~9999-12-3 23:59:59

                  这个不用做多解释,因为这个就是DATE和TIME的结合体。其各种特点在这里也能够适合。但是注意HH:MM:SS 只能表示一天的时间,也就最多到23:59:59.

            例子:

               CREATE TABLE tmp(

                 dt DATETIME

               );        

               INSERT INTO tmp VALUES("1998-08-08 08-08-08"),(980808080808),(CURRENT_DATE()),(NOW());

               SELECT * FROM tmp;

                      

 

             CURRENT_DATE()返回的是当前系统的日期 格式 YYYY-MM-DD 所以在前面打印YEAR和DATE度可以用到该函数,因为包含了其数据类型所要的信息

             NOE()返回当前系统的日期和时间值,格式为YYYY-MM-DD HH:MM:SS,所以在这里能够使用其输出DATETIME类型的值。

 

  4.5、TIMESTAMP

             格式:YYYY-MM-DD HH:MM:SS

             取值范围:1970-01-01 00:00:01 UTC ~ 2038-01-19 03:14:17 UTC

             解释:显示宽度固定在 19个字符。也就是这个输出标准格式,UTC表示世界标准时间,这个跟DATETIME基本上一样,但是有一个最大的区别,我们需要知道。

             区别:存储字节和支持的范围不一样,最重要的区别在DATETIME在存储日期数据时,按实际输入的格式存储,即输入什么就存储什么,也就输出什么,与时区无关,而TIMESTAMP值的存储是以UTC格式保存,存储时会对当前时区进行转换,检索时再转换回当前                时区,也就是查询时,会根据当前时区的不同,显示的时间值不同。 时区的意思就是,你在美国和你在中国两边的时间显示不一样,你在美国有在美国的时间,比中国快多长时间,

                比如在中国才早上8点,在美国可能就是晚上8.9点了(这个只是打个比方,准备转换时间我没去看。)

             例如:

              CREATE TABLE tmp(

                ts TIMESTAMP

              );

              INSERT INTO tmp VALUES(NOW());

              SELECT * FROM tmp;

                      

              转换时区

                      

              可以看到,如我们所想,输出时间变了,增加了两个小时,这个是关于什么东10区,东8区等,我也不懂这些时差,总之能够得出结论就行了。

              也就是说,TIMESTAMP和DATETIME其实差不多,就是一个时区的差别。TIMESTAMP也叫时间戳。以后遇到它我们就应该知道是什么东西

五、字符串类型

         有CHAR、CARCHAR、TINYTEXT、TEXT、MEDIUMTEXT、LONGTEXT、ENUM、SET

                    

  5.1、CHAR和VARCHAR

            CHAR(M):为固定长度字符串,固定长度的意思就是M的值为多少,那么该M的值就是其实际存储空间的值,就算插入的数据少于M位,其存储空间还是那么大,多余的用空格补齐。

                  在输出时,空格将被删除不输出。M最大为255,比如char(4),如果插入abc,则存储的值为'abc '后面多了一个空格,输出还是‘abc’, 存储空间还是占4个字节。M最大为255

            VARCHAR(M):长度可变的字符串,跟CHAR相反,会根据实际的大小值来确定存储空间的大小,比如 VARCHAR(4),插入'ab',则存储空间为3字节,看上面图就知道VARCHAR会多一个字节用来存储长度,M最大为65535.

            注意:字符串跟数值类型不一样,M为多大,就最多能插入多少字符,超过了M,就会报错

            例子:

              CREATE TABLE tmp(

                ch CHAR(4),

                vch VARCHAR(4);

              );          

              INSERT INTO tmp VALUES('asdf','asdfg');

              结果报错:

                      

              INSERT INTO tmp VALUES('ab  ','ab  ');

              SELECT concat( '(', ch ,')' ),concat( '(',vch,')' ) FROM tmp;//这句话的意思就用(将结果包起来,用来观察输出的字符长度)

                        

              说明,CHAR不能够存储空格字符,而VARCHAR可以。        

      

  5.2、TEXT

              text分四种:TINYTEXT、TEXT、MEDIUMTEXT和LONGTEXT

                TINYTEXT:255字符

                TEXT:65535字符

                MEDIUNTEXT:16777215字符

                LONGTEXT:4294967295,大概4GB的字符

              也就是说,比如我们要存一本小说,那么就需要使用上面四种中的一种来存储,选取MEDIUNTEXT或者LONGTEXT差不多。

 

  5.3、ENUM

              枚举,格式:字段名 ENUM('值1','值2','值3'...,'值n');  n最多为65535

              例如:

                CREATE TABLE tmp(

                  enm ENUM('first','second','third');

                );      

                解释:enm字段的数据类型为ENUM,枚举类型,那么在插入该字段中的值只能为枚举中的这几个值,不能插入别得值,否则报错

                INSERT INTO tmp VALUES('first'),('FIRST');

                SELECT * FROM tmp;

                        

                  MySQL不区分大小写。

                  INSERT INTO tmp VALUES('four');

                  报错:

                        

                例子二:

                  CREATE TABLE tmp(

                    soc INT,

                    level ENUM('excellent','good','bad')

                  );

                  INSERT INTO tmp VALUES(70,2),(90,1),(55,3);

                  SELECT * FROM tmp;

                        

                  使用索引值,也可以选择枚举中得值,从1开始,不是0,注意这点

 

                总结:使用ENUM类型就是为了限制字段上的值的取值范围,只能取我们所规定的值。

 

  5.4、SET

                格式:字段名 SET('值1','值2','值3','值4'...,'值n')  n最大为64

                通过例子来讲解这个SET的特点

                  CREATE TABLE tmp(

                    s SET('a','b','c','d');

                  );

                  INSERT INTO tmp VALUES('a'),('a,b,a'),('c,a,d');

                  SELECT * FROM tmp;

                        

                   a 变成 a

                   a,b,a 变成 a,b

                   c,a,d 变成 a,c,d

                   结论:

                      1、插入SET字段中的值如果有重复,则会自动删除重复的值

                      2、插入SET字段中的值会按顺序排列,排列规则就是按照SET中的值的排列优先顺序

                   INSERT INTO tmp VALUES('a,x,b');

                   报错:

                        

                   结论:

                      3、如果插入了不属于SET中的值,就会报错

                   SET的特性就上面所说的三点   

 

六、二进制类型  

           用来存放二进制数,也就是01010这种。有BIT、BINARY、VARBINARY、TINYBLOB、BLOB、MEDIUNBLOB和LONGBLOB

                       

  6.1、BIT类型 

                位字段类型,M表示插入值的位数,最大为64位,默认值为1,如果插入值小于M位,值的左边用0填充,

                例子:

                   CREATE TABLE tmp(

                      b BIT(4)

                   );   

                   解释:4位的二进制,也就是能够保存0到15之间的值。

                   INSERT INTO tmp VALUES(2),(10),(15);       

                   SELECT BIN(b+0) FROM tmp;

                         

                   解释:我们将2,10,15这三个10进制存入数据表中,其字段为BIT类型,所以在表中存放的是二进制数,但是将其显示出来,要先将二进制数转换为对应的数字的值,也就是通过b+0,

                       然后在通过BIN()函数将数字转换为二进制。我们可以尝试不用BIN()函数,只用b+0,看输出什么

                   SELECT b+0 FROM tmp;

                          

 

  6.2、BINARY和VARBINARY类型

                  格式:字段 BINARY(M)或者VARBINARY(M)

                  这两个跟CHAR和VARCHAR类似,

                    BINARY:长度是固定的,指定长度后,不足最大程度的,将在它们右边填充"\0"来达到指定长度,

                    VARBINARY:长度是可变的,制定好长度后,其长度可以在0到最大值之间,例如,指定字段数据类型为VARBINARY(20),如果插入的值的长度只有10,则实际存储空间为10加1,即实际占用的空间为字符串的实际长度加1.

                            说了这么多,但是还是不明白这两个有什么用处,现在来告诉你,我们说MySQL中对大小写不敏感,但是这两个数据类型却对大小写敏感,

                        原因是他们是用二进制来保存数据的,比如A和a,两个的二进制就不一样。所以在很多时候我们需要区分大小写的时候,就会用到该类型。

                  注意:这两个类型的长度计算的是字节长度,一个字符等于2个字节,比如BINARY(4)这个表示能够存放4个字节的长度,也就是只能存放2个汉字。可以存4个字母。

                      不要把这个长度当成二进制位的长度了,说是二进制字符串的意思是,用二进制来进行存储,但是其长度约束是字节长度。

                  例子:

                    CREATE TABLE tmp(

                      b BINARY(10)

                    );

                    INSERT INTO tmp VALUES('a');

                    select * from tmp WHERE b='A';

                          

                    解释:在tmp表中存放了一个小写a,然后通过大写A查找表中,看是否能找到a,结果找不到,就验证了我们上面的说法,具有区分大小写的功能。

 

                总结:BINARY和VARBINARY的主要作用就是用来区分大小写的,其他没什么作用,但是使用时要注意限制其大小的是字节数,而不是二进制位,它存储的格式是用二进制来存储的。这两个不要搞混淆了。

 

  6.3、BLOB类型

                是一个二进制大对象,TINYBLOB(32kb)、BLOB(64kb)、MEDIUMBLOB(16M)和LONGBLOB(4GB)。一般存储的是一些图像,音频文件。

七、如何选择数据类型             

        1、整数和浮点数

            如果不需要小数部分,则使用整数来保存数据,并且根据整数的大小,来选择合适的整数类型,如果需要小数部分,则使用浮点数类型,浮点数类型中,有float和double,如果需要精度高一点,则选择double。根据自己的需求来决定选什么。

        2、浮点数和定点数

            浮点数FLOAT、DOUBLE相对应定点数DECIMAL的优势在于:在长度一定的情况下,浮点数能表示更大的数据范围,但是浮点数容易产生误差,

            因此在精度比较高时,建议使用DECIMAL,比如货币这一类东西,就用DECIMAL比较合理,注意浮点数在进行加减运算时也容易出现问题。如果进行数值比较,也建议用DECIMAL

        3、日期与时间类型

            可以看上面详解时的图,根据各种格式,选择自己所需要的数据类型,注意TIMESTAMP和DATETIME的区别,一个是跟时区有关,一个无关,其他没什么大的区别。

        4、CHAR与VARCHAR之间的特点与选择

            区别:

              CHAR是固定长度字符、VARCHAR是可变长度字符。CHAR会自动删除插入数据的尾部空格,VARCHAR不会。 

              CHAR是固定长度,处理速度比VARCHAR更快,缺点很明显,浪费存储空间,所以对存储不大,但在速度上有要求的可以使用CHAR类型,反之用VARCHAR。

        5、ENUM和SET

             ENUM只能取单值,也就是从枚举类型中选取其中一个值,但是SET可以取多值,

             ENUM最多能存放65535个成员,SET只能65个

             空字符串也能在SET中存储,

             要存储一个人的喜爱时,最好使用SET类型,其实最重要的是看具体的情况在选取最为合适的把

        6、BLOB和TEXT

             BLOB是二进制字符串,TEXT是非二进制字符串,两者均可存放大容量的信息,BLOB主要存储图片、音频信息,而TEXT只能存储纯文本文件。分清楚两者的用途

        7、BINARY和VARBINARY

             这两个的区别和CHAR与VARCHAR的区别差不多,BINARY是固定长度、VARBINARY是可变程度,这两个的作用就是为了区分大小写的,注意这两个是字节字符串。