mysql怎么匹配 mysql怎么连接查询

mysql字符串怎么完全正则匹配,用regexp

以前我要查找数据都是使用like后来发现mysql中也有正则表达式了并且感觉性能要好于like,下面我来给大家分享一下mysql REGEXP正则表达式使用详解,希望此方法对大家有帮助。

创新互联建站于2013年创立,是专业互联网技术服务公司,拥有项目成都做网站、成都网站制作网站策划,项目实施与项目整合能力。我们以让每一个梦想脱颖而出为使命,1280元错那做网站,已为上家服务,为错那各地企业和个人服务,联系电话:18980820575

MySQL采用Henry Spencer的正则表达式实施,其目标是符合POSIX 1003.2。请参见附录C:感谢。MySQL采用了扩展的版本,以支持在SQL语句中与REGEXP操作符一起使用的模式匹配操作。请参见3.3.4.7节,“模式匹配”。

在本附录中,归纳了在MySQL中可用于REGEXP操作的特殊字符和结构,并给出了一些示例。本附录未包含可在Henry

Spencer的regex(7)手册页面中发现的所有细节。该手册页面包含在MySQL源码分发版中,位于regex目录下的regex.7文件中。

正则表达式描述了一组字符串。最简单的正则表达式是不含任何特殊字符的正则表达式。例如,正则表达式hello匹配hello。

非平凡的正则表达式采用了特殊的特定结构,从而使得它们能够与1个以上的字符串匹配。例如,正则表达式hello|word匹配字符串hello或字符串word。

作为一个更为复杂的示例,正则表达式B[an]*s匹配下述字符串中的任何一个:Bananas,Baaaaas,Bs,以及以B开始、以s结束、并在其中包含任意数目a或n字符的任何其他字符串。

以下是可用于随REGEXP操作符的表的模式。

应用示例,查找用户表中Email格式错误的用户记录:

SELECT *

FROM users

WHERE email NOT REGEXP '^[A-Z0-9._%-]+@[A-Z0-9.-]+.[A-Z]{2,4}$'

MySQL数据库中正则表达式的语法,主要包括各种符号的含义。

(^)字符

匹配字符串的开始位置,如“^a”表示以字母a开头的字符串。

mysql select 'xxxyyy' regexp '^xx';

+-----------------------+

| 'xxxyyy' regexp '^xx' |

+-----------------------+

| 1 |

+-----------------------+

1 row in set (0.00 sec)

查询xxxyyy字符串中是否以xx开头,结果值为1,表示值为true,满足条件。

($)字符

匹配字符串的结束位置,如“X^”表示以字母X结尾的字符串。

(.)字符

这个字符就是英文下的点,它匹配任何一个字符,包括回车、换行等。

(*)字符

星号匹配0个或多个字符,在它之前必须有内容。如:

mysql select 'xxxyyy' regexp 'x*';

这个SQL语句,正则匹配为true。

(+)字符

加号匹配1个或多个字符,在它之前也必须有内容。加号跟星号的用法类似,只是星号允许出现0次,加号则必须至少出现一次。

(?)字符

问号匹配0次或1次。

实例:

现在根据上面的表,可以装置各种不同类型的SQL查询以满足要求。在这里列出一些理解。考虑我们有一个表为person_tbl和有一个字段名为名称:

查询找到所有的名字以'st'开头

mysql SELECT name FROM person_tbl WHERE name REGEXP '^st';

查询找到所有的名字以'ok'结尾

mysql SELECT name FROM person_tbl WHERE name REGEXP 'ok$';

查询找到所有的名字包函'mar'的字符串

mysql SELECT name FROM person_tbl WHERE name REGEXP 'mar';

查询找到所有名称以元音开始和'ok'结束 的

mysql SELECT name FROM person_tbl WHERE name REGEXP '^[aeiou]|ok$';

一个正则表达式中的可以使用以下保留字

^

所匹配的字符串以后面的字符串开头

mysql select "fonfo" REGEXP "^fo$"; - 0(表示不匹配)

mysql select "fofo" REGEXP "^fo"; - 1(表示匹配)

$

所匹配的字符串以前面的字符串结尾

mysql select "fono" REGEXP "^fono$"; - 1(表示匹配)

mysql select "fono" REGEXP "^fo$"; - 0(表示不匹配)

.

匹配任何字符(包括新行)

mysql select "fofo" REGEXP "^f.*"; - 1(表示匹配)

mysql select "fonfo" REGEXP "^f.*"; - 1(表示匹配)

a*

匹配任意多个a(包括空串)

mysql select "Ban" REGEXP "^Ba*n"; - 1(表示匹配)

mysql select "Baaan" REGEXP "^Ba*n"; - 1(表示匹配)

mysql select "Bn" REGEXP "^Ba*n"; - 1(表示匹配)

a+

匹配任意多个a(不包括空串)

mysql select "Ban" REGEXP "^Ba+n"; - 1(表示匹配)

mysql select "Bn" REGEXP "^Ba+n"; - 0(表示不匹配)

a?

匹配一个或零个a

mysql select "Bn" REGEXP "^Ba?n"; - 1(表示匹配)

mysql select "Ban" REGEXP "^Ba?n"; - 1(表示匹配)

mysql select "Baan" REGEXP "^Ba?n"; - 0(表示不匹配)

de|abc

匹配de或abc

mysql select "pi" REGEXP "pi|apa"; - 1(表示匹配)

mysql select "axe" REGEXP "pi|apa"; - 0(表示不匹配)

mysql select "apa" REGEXP "pi|apa"; - 1(表示匹配)

mysql select "apa" REGEXP "^(pi|apa)$"; - 1(表示匹配)

mysql select "pi" REGEXP "^(pi|apa)$"; - 1(表示匹配)

mysql select "pix" REGEXP "^(pi|apa)$"; - 0(表示不匹配)

(abc)*

匹配任意多个abc(包括空串)

mysql select "pi" REGEXP "^(pi)*$"; - 1(表示匹配)

mysql select "pip" REGEXP "^(pi)*$"; - 0(表示不匹配)

mysql select "pipi" REGEXP "^(pi)*$"; - 1(表示匹配)

{1}

{2,3}

这是一个更全面的方法,它可以实现前面好几种保留字的功能

a*

可以写成a{0,}

a+

可以写成a{1,}

a?

可以写成a{0,1}

在{}内只有一个整型参数i,表示字符只能出现i次;在{}内有一个整型参数i,后面跟一个“,”,表示字符可以出现i次或i次以上;在{}内只有一个整型参数i,后面跟一个“,”,再跟一个整型参数j,表示字符只能出现i次以上,j次以下(包括i次和j次)。其中的整型参数必须大于等于0,小于等于

RE_DUP_MAX(默认是255)。 如果有两个参数,第二个必须大于等于第一个

[a-dX]

匹配“a”、“b”、“c”、“d”或“X”

[^a-dX]

匹配除“a”、“b”、“c”、“d”、“X”以外的任何字符。

“[”、“]”必须成对使用

mysql select "aXbc" REGEXP "[a-dXYZ]"; - 1(表示匹配)

mysql select "aXbc" REGEXP "^[a-dXYZ]$"; - 0(表示不匹配)

mysql select "aXbc" REGEXP "^[a-dXYZ]+$"; - 1(表示匹配)

mysql select "aXbc" REGEXP "^[^a-dXYZ]+$"; - 0(表示不匹配)

mysql select "gheis" REGEXP "^[^a-dXYZ]+$"; - 1(表示匹配)

mysql select "gheisa" REGEXP "^[^a-dXYZ]+$"; - 0(表示不匹配)

MySQL正则表达式匹配

1. 基本字符匹配:

select name from user where name REGEXP '1000';

检索name中包含文本1000的所有行。

select name from user where name REGEXP '.000';

.在正则表达式中表示匹配任意一个字符。

2. 进行OR匹配:

select name from user where name REGEXP '1000|2000';

检索name中包含文本1000或2000的所有行。

3. 匹配几个字符之一:

select name from user where name REGEXP '[123] Ton';

[123]定义一组字符,它的意思是匹配1或2或3。

select name from user where name REGEXP '[1-3] Ton';

-用来定义一个范围。

4. 匹配特殊字符:

匹配特殊字符,必须用\为前导,\-表示查找-,\.表示查找.

5. 匹配多个实例:

*: 0个或多个匹配;

+:1个或多个匹配(等于{1,});

?:0个或1个匹配(等于{0,1});

{n}:指定数目的匹配;

{n,}:不少于指定数目的匹配;

{n,m}:匹配数目的范围(m不超过255)。

6. 定位符:

^:文本的开始;

$:文本的结尾;

[[::]]:词的开始;

[[::]]:词的结尾;

^在集合中:用来否定该集合,例如[^0-9],表示不匹配数字

深入浅析Mysql联合索引最左匹配原则

之前在网上看到过很多关于mysql联合索引最左前缀匹配的文章,自以为就了解了其原理,最近面试时和面试官交流,发现遗漏了些东西,这里自己整理一下这方面的内容。

最左前缀匹配原则

在mysql建立联合索引时会遵循最左前缀匹配的原则,即最左优先,在检索数据时从联合索引的最左边开始匹配,示例:

对列col1、列col2和列col3建一个联合索引

KEY test_col1_col2_col3 on test(col1,col2,col3);

联合索引 test_col1_col2_col3 实际建立了 (col1)、(col1,col2)、(col,col2,col3) 三个索引。

SELECT * FROM test WHERE col1=“1” AND clo2=“2” AND clo4=“4”

上面这个查询语句执行时会依照最左前缀匹配原则,检索时会使用索引(col1,col2)进行数据匹配。

注意

索引的字段可以是任意顺序的,如:

SELECT * FROM test WHERE col1=“1” AND clo2=“2”

SELECT * FROM test WHERE col2=“2” AND clo1=“1”

这两个查询语句都会用到索引(col1,col2),mysql创建联合索引的规则是首先会对联合合索引的最左边的,也就是第一个字段col1的数据进行排序,在第一个字段的排序基础上,然后再对后面第二个字段col2进行排序。其实就相当于实现了类似 order by col1 col2这样一种排序规则。

有人会疑惑第二个查询语句不符合最左前缀匹配:首先可以肯定是两个查询语句都保函索引(col1,col2)中的col1、col2两个字段,只是顺序不一样,查询条件一样,最后所查询的结果肯定是一样的。既然结果是一样的,到底以何种顺序的查询方式最好呢?此时我们可以借助mysql查询优化器explain,explain会纠正sql语句该以什么样的顺序执行效率最高,最后才生成真正的执行计划。

减少开销 。建一个联合索引(col1,col2,col3),实际相当于建了(col1),(col1,col2),(col1,col2,col3)三个索引。每多一个索引,都会增加写操作的开销和磁盘空间的开销。对于大量数据的表,使用联合索引会大大的减少开销!

覆盖索引 。对联合索引(col1,col2,col3),如果有如下的sql: select col1,col2,col3 from test where col1=1 and col2=2。那么MySQL可以直接通过遍历索引取得数据,而无需回表,这减少了很多的随机io操作。减少io操作,特别的随机io其实是dba主要的优化策略。所以,在真正的实际应用中,覆盖索引是主要的提升性能的优化手段之一。

效率高 。索引列越多,通过索引筛选出的数据越少。有1000W条数据的表,有如下sql:select from table where col1=1 and col2=2 and col3=3,假设假设每个条件可以筛选出10%的数据,如果只有单值索引,那么通过该索引能筛选出1000W10%=100w条数据,然后再回表从100w条数据中找到符合col2=2 and col3= 3的数据,然后再排序,再分页;如果是联合索引,通过索引筛选出1000w10% 10% *10%=1w,效率提升可想而知!

引申

对于联合索引(col1,col2,col3),查询语句 SELECT * FROM test WHERE col2=2; 是否能够触发索引?

大多数人都会说NO,实际上却是YES。

原因:

EXPLAIN SELECT * FROM test WHERE col2=2;

EXPLAIN SELECT * FROM test WHERE col1=1;

观察上述两个explain结果中的type字段。查询中分别是:

index: 这种类型表示mysql会对整个该索引进行扫描。要想用到这种类型的索引,对这个索引并无特别要求,只要是索引,或者某个联合索引的一部分,mysql都可能会采用index类型的方式扫描。但是呢,缺点是效率不高,mysql会从索引中的第一个数据一个个的查找到最后一个数据,直到找到符合判断条件的某个索引。所以,上述语句会触发索引。

ref: 这种类型表示mysql会根据特定的算法快速查找到某个符合条件的索引,而不是会对索引中每一个数据都进行一一的扫描判断,也就是所谓你平常理解的使用索引查询会更快的取出数据。而要想实现这种查找,索引却是有要求的,要实现这种能快速查找的算法,索引就要满足特定的数据结构。简单说,也就是索引字段的数据必须是有序的,才能实现这种类型的查找,才能利用到索引。

以上所述是我给大家介绍的Mysql联合索引最左匹配原则,希望对大家有所帮助,如果大家有任何疑问请给我留言,我会及时回复大家的。

《 两个月拿到N个offer,看看我是如何做到的 》

《 面试总结:2019年最全面试题资料学习大全—(含答案) 》

《 淘宝面试回来,想对程序员们谈谈 》

《 看过太多大厂面试题,其实考的无非是这 3 点能力 》

mysql索引最左匹配原则

只要where有a的查询就会用到上面的联合索引,无关顺序

比如:

explain select * from test where a10 ;

explain select * from test where b10 and a 10;

explain select * from test where b10 and a 10 and c10;

explain select * from test where a10 and c 10;(a走索引了,c没走)

explain select * from test where a10 and b 10;

explain select * from test where a10 and b 10 and c10;

下面不会用到联合索引(没有用到a)

explain select * from test where b10 and c 10;

当b+树的数据项是复合的数据结构,比如(name,age,sex)的时候,b+数是按照从左到右的顺序来建立搜索树的,比如当(张三,20,F)这样的数据来检索的时候,b+树会优先比较name来确定下一步的所搜方向,如果name相同再依次比较age和sex,最后得到检索的数据;

但当(20,F)这样的没有name的数据来的时候,b+树就不知道下一步该查哪个节点,因为建立搜索树的时候name就是第一个比较因子,必须要先根据name来搜索才能知道下一步去哪里查询。

比如当(张三,F)这样的数据来检索时,b+树可以用name来指定搜索方向,但下一个字段age的缺失,所以只能把名字等于张三的数据都找到,然后再匹配性别是F的数据了, 这个是非常重要的性质,即索引的最左匹配特性。

explain select * from test where a10 and b 10;

explain select * from test where b 10 and a10;

实际上只会用到index_a索引


分享标题:mysql怎么匹配 mysql怎么连接查询
网页URL:http://hbruida.cn/article/doesgde.html