❶ sql查询中in和exists有什么区别
1.exist,notexist一般都是与子查询一起使用.In可以与子查询一起使用,也可以直接in(a,b.....)x0dx0ax0dx0a2.exist会针对子查询的表使用索引.notexist会对主子查询都会使用索引.in与子查询伍虚源一起使用的时候,只能针对主查询使用索引.notin则不会使用任何索引.注意,一直以来认为exists比in效率高的说法是不准确的。x0dx0ain是把外表和内表作hash连接,而exists是对外表作loop循环,每次loop循环再对内表进行查询。x0dx0a如果查询的两个表大小相当,那么用in和exists差别不大。x0dx0a如果两个表中一个较小,一个是大腔态表,则子查询表大的用exists,子查询表小的用in:x0dx0a例如:表A(小表),表B(大表)1:select*fromAwhereccin(selectccfromB)x0dx0a效率低,用到了A表上cc列的索引;select*fromAwhereexists(selectccfromBwherecc=A.cc)x0dx0a效率高,用到了B表上cc列的索引。x0dx0a相反的2:select*fromBwhereccin(selectccfromA)x0dx0a效率高,用到了B表上cc列的索引;select*fromBwhereexists(selectccfromAwherecc=B.cc)x0dx0a效率低,用到了A表上cc列的索引。x0dx0anotin和notexists如果查询语句使用了notin那么内外表都进行全表扫描,没有用到索引;而notextsts的子查询依然能用到表上的索引。所以无论那个表大,用notexists都比notin要快。x0dx0a3.exist与in都可以实现一个目的.二者都可以用来过滤数据.x0dx0a示例:x0dx0ax0dx0aselectcount(1)fromt1;--160Wx0dx0aselectcount(1)fromt2;--90Wx0dx0ax0dx0aSELECTcount(1)(.keyid=b.keyidANDa.ideaid=b.ideaid);--主大子小,不适合使用exist,因为exist只会利用子表t2的复合索引keyid+ideaid,而子表内容要小与主表,主表由于无法使用索引,查询效率低下.x0dx0ax0dx0aselectcount(1)fromt1awhereaccountidin(.keyid=b.keyidANDa.ideaid=b.ideaid);--主大子小,适合用in,因为in只会使用主表t1里面的复合主键keyid-ideaid,在主表大于子表的情况下,会很好的利用主表的索引.x0dx0ax0dx0a--后二条sql的执行结果都是一样的.说明exist与in在用法上可以达到一个目的,不同的地方是x0dx0a--1.性能的考虑此时就按子表大主表小用exist,子表小主表大用in的原则就可以.x0dx0a--2.写法的不同,exist的where条件是:"......whereexist(.....wherea.id=b.id)"x0dx0a--in的where条件是:"......whereidin(selectid....wherea.id=b.id)"x0dx0ax0dx0a4.exist的原理:x0dx0aexists做为where条件时,是先对where前的主查询询进行查询,然后用主查询的结果一个一个的代入exists的查询进行判断,如果为真则输出当前这一条主查询的结誉游果,否则不输出x0dx0a比如x0dx0a如下:x0dx0a表表表A和表B是一对多的关系A.ID-->B.AIDx0dx0ax0dx0aSELECTID,NAMEFROMAWHEREEXISTS(SELECT*FROMBWHEREA.ID=B.AID)x0dx0a执行结果为x0dx0a1A1x0dx0a2A2x0dx0a原因可以按照如下分析x0dx0aSELECTID,NAMEFROMAWHEREEXISTS(SELECT*FROMBWHEREB.AID=1)x0dx0a-->SELECT*FROMBWHEREB.AID=1有值返回真所以有数据x0dx0ax0dx0aSELECTID,NAMEFROMAWHEREEXISTS(SELECT*FROMBWHEREB.AID=2)x0dx0a-->SELECT*FROMBWHEREB.AID=2有值返回真所以有数据x0dx0ax0dx0aSELECTID,NAMEFROMAWHEREEXISTS(SELECT*FROMBWHEREB.AID=3)x0dx0a-->SELECT*FROMBWHEREB.AID=3无值返回真所以没有数据x0dx0ax0dx0aNOTEXISTS就是反过来x0dx0aSELECTID,NAMEFROMAWHERENOTEXIST(SELECT*FROMBWHEREA.ID=B.AID)x0dx0a执行结果为x0dx0a3A3x0dx0a5.in与=的区别x0d('zhang','wang','li','zhao');x0dx0a与x0d='zhang'orname='li'orname='wang'orname='zhao'x0dx0a的结果是相同的。x0dx0ain的字段也可以与其它字段建复合索引.x0dx0a比如x0dx0aT1包含下面key,accountd,groupid.x0dx0ax0dx0aSELECT*x0dx0aFROMT1ax0dx0aWHEREa.groupid=2001x0dx0aANDa.accountid=1001x0dx0aANDa.keyIN('abc','def','ala');x0dx0ax0dx0a--上面的sql可以将accountid,key建成复合索引.
❷ SQL中IN和EXISTS用法的区别
IN表示条件是在一个集合里,做世比如
in('A','B','好兄C','D')
条件就是在ABCD这个集合里找。
EXISTS返回的是一个布尔值,也就是它判断的是真假纯袜肢,比如
EXISTS(select*from用户表where姓名='张三')
表示:有张三这个用户则返回“真”,否则返回“假”
❸ SQL关于IN和EXISTS的区别
IN
确定给定的值是否与子查询或列表中的值相匹配。
EXISTS
指定一个子查询,检测行的存在。
比较使用 EXISTS 和 IN 的查询
exists()后面的子查询被称做相关子查询 他是不返回列表的值的.只是返回一个ture或false的结果,其运行方式是先运行主查询一次 再去子查询里查询与其对应的结果 如果是ture则输出,反之则不输出.再根据主查询中的每一行去子查询里去查询.
in()后面的子查询 是返回结果集的,换句话说执行次序和exists()不一样.子查询先产生结果集,然后主查询再去结果集里去找符合要求的字段列表去.符合要求的输出,反之则不输出.
❹ sql server 嵌套查询语句中什么时候用in,什么时候又用exists!
sqlserver嵌套查询语句中使用in或者exists的场景和原则如下:
如果查询的两个表大小相当,那么用in和exists差别不大。两者都可以使用。
in 是把外表和内表作hash 连接,而exists是对外表作loop循环,每次loop循环再对内表进行查询。所以当有多重循环,使用in更合适,效率越高。
如果两个表中一个较小,一个是大表,则子查询表大的用exists,子查询表小的用in。
NOT EXISTS,exists的用法跟in不一样,一般都需要和子表进行关联,而且关联时,需要用索引,这样就可以加快速度。
❺ 在sql语句多表连接中,in、exists、join哪个效率更高一点
EXISTS、IN与JOIN,都可以用来实现形如“查询A表中在(或不在)B表中的记录”的查询逻辑。x0dx0ax0dx0a在查询的两个表大小相当的情况下,3种查询方式的执行时间通常是:x0dx0aEXISTS <= IN <= JOINx0dx0aNOT EXISTS <= NOT IN <= LEFT JOINx0dx0a只有当表中字段允许NULL时,NOT IN的方式最慢:x0dx0aNOT EXISTS <= LEFT JOIN <= NOT INx0dx0ax0dx0a但是如果两个表中一个较小,一个较大,则子查询表大的用exists,子查询表小的用in,因为in 是把外表和内表作hash 连接,而exists是对外表作loop循环,每次loop循环再对内表进行查询。而无论那个表大,用not exists都比not in要快。这是因为如果查询语句使用了not in 那么内外表都进行全表扫描,没有用到索引;而not extsts 的子查询依然能用到表上的索引。x0dx0ax0dx0aIN的好处是逻辑直观简单(通常是独立子查询);缺点是只能判断单字段,并且当NOT IN时效率较低,而且NULL会导致不想要的结果。x0dx0aEXISTS的好处是效率高,可以判断单字段和组合字段,并不受NULL的影响;缺点是逻昌数辑稍微复杂(通常是相关子查询)。x0dx0aJOIN用在这种场合,往颂岁往是吃力不讨好。JOIN的用途耐樱首是联接两个表,而不是判断一个表的记录是否在另一个表。
❻ sql中in和exists的区别效率问题 转
很多人和说法会认为in和Exists相比后者的效率要高。
但是以我本人使用数据库的经验来看,两者的运行效率其实不相伯仲,不管有无可被利用的索引,它们在运行速度上没有太明显的分别,硬要说哪个快一些的话exists可能会快一点点,但是这种区别通常可以忽略。
然而在求非交集时 not in和not exists运行效率上的差距就很大,碰到大数据表时not in不管有无可被利用的索引,都会导致效率悲剧,其运行速度极之糟糕往往要运行很长的时间才能返回结果,期间系统就像假死一样。not exists在有可被利用的索引的情况下碰到大数据表时其运行效率非常高、表现优异,但是若没有可被利用索引的情况下其运行效率也很不好,此时其运行速度尽管要比not in快上不少但还是属于那种令人无法接受的“蜗速”。
in和exists随各人喜好随便用,特别是数据量不大时。面对大数据表时就要小心,not in无论有无可被利用的索引都应避免使用,not exists在有可被利用索引的情况下可作为首选,反之也要避免使用。
❼ SQL语句中 in和exist区别
本文主要分析了in和exists的区别与执行效率的问题:
in可以分为三类:
1、形如select * from t1 where f1 in ( 'a ', 'b '),应该和以下两种比较效率。
select * from t1 where f1= 'a ' or f1= 'b '
或者
select * from t1 where f1 = 'a ' union all select * from t1 f1= 'b '
你可能指的不是这一类,这里不做讨论。
2、形如
select * from t1 where f1 in (select f1 from t2 where t2.fx= 'x '),
其中子查询的where里的条件不受外层查询的影响,这类查询一般情况下,自动优化会转成exist语句,也就是效率和exist一样。
3、形如
select * from t1 where f1 in (select f1 from t2 where t2.fx=t1.fx),
其中子查询的where里的条件受外层查询的影响,这类查询的效率要看相关条件涉及的字段的中好索引情况和数据量多少,一般认为效率不如exists。
除了第一类in语句都是可以转化成exists 语句的,一般编程习惯应该是用exists而不用in.
A,老培兄B两个表,
(1)当只显示一个表的数据如A,关系条件只一个如ID时,使用IN更快:
select * from A where id in (select id from B)
(2)当只显示一个表的数据如A,关系条件不只一个如ID,col1时,使用IN就不方便了,可以使用EXISTS:
select * from Awhere exists (select 1 from B where id = A.id and col1 = A.col1)
(3)当只显示两个表的数据时,使用IN,EXISTS都不合适侍袭,要使用连接:
select * from A left join B on id = A.id
所以使用何种方式,要根据要求来定。
这是一般情况下做的测试:
测试结果:
set statistics io on select * from sysobjects where exists (select 1 from syscolumns where id=syscolumns.id) select * from sysobjects where id in (select id from syscolumns ) set statistics io off (47 行受影响)
表 'syscolpars '。扫描计数 1,逻辑读取 3 次,物理读取 0 次,预读 2 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
表 'sysschobjs '。扫描计数 1,逻辑读取 3 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
(1 行受影响)
(44 行受影响)
表 'syscolpars '。扫描计数 47,逻辑读取 97 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
表 'sysschobjs '。扫描计数 1,逻辑读取 3 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
(1 行受影响)
set statistics io on select * from syscolumns where exists (select 1 from sysobjects where id=syscolumns.id) select * from syscolumns where id in (select id from sysobjects ) set statistics io off
(419 行受影响)
表 'syscolpars '。扫描计数 1,逻辑读取 10 次,物理读取 0 次,预读 15 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
表 'sysschobjs '。扫描计数 1,逻辑读取 3 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
(1 行受影响)
(419 行受影响)
表 'syscolpars '。扫描计数 1,逻辑读取 10 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
表 'sysschobjs '。扫描计数 1,逻辑读取 3 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
(1 行受影响)
测试结果(总体来讲exists比in的效率高):
效率:条件因素的索引是非常关键的
把syscolumns 作为条件:syscolumns 数据大于sysobjects
用in
扫描计数 47,逻辑读取 97 次,
用exists
扫描计数 1,逻辑读取 3 次
把sysobjects作为条件:sysobjects的数据少于syscolumns
exists比in多预读 15 次
❽ sql中in和exist语句的区别
两者都能实现表功能查询,主要区别如下:
1、适用表的类型不同。
in是子查询为驱动表,外面的表为被驱动表,故适用于子查询结果集小而外面的表结果集大的情况。
exists是外面的表位驱动表,子查询里面的表为被驱动表,故适用于外面的表结果集小而子查询结果集大的情况。
2、子查询关联不同。
exists一般都是关联子查询。对于关联子查询,必须先执行外层查询,接着对所有通过过滤条件的记录,执行内层查询。外层查询和内层查询相互依赖,因为外层查询会把数据传递给内层查询。
in则一般都是非关联子查询,非关联子查询则必须先完成内层查询之后,外层查询才能介入。
3、执行次数不同。
IN 语句:只执行一次,确定给定的值是否与子查询或列表中的值相匹配。in在查询的时候,首先查询子查询的表,然后将内表和外表做一个笛卡尔积,然后按照条件进行筛选。所以相对内表比较小的时候,in的速度较快。
EXISTS语句:执行次数根据表的长度而定。指定一个子查询,检测行的存在。遍历循环外表,然后看外表中的记录有没有和内表的数据一样的。匹配上就将结果放入结果集中。
❾ sql exist和in的区别及查询效率比较
SQL查询中in和exists的区别分析
select * from A where id in (select id from B);
select * from A where exists (select 1 from B where A.id=B.id);对于以上两种情况,in是在内存里遍历比较,而exists需要查询数据库,所以当B表数据量较大时,exists效率优于in。
1、IN()语句内部工作原理
IN()只执行一次,它查出B表中的所有id字段并缓存起来。之后,检查A表的id是否与B表中的id相等,如果相等则将A表的记录加入结果集中,直到遍历完A表的所有记录。
它的查询过程类似于以下过程:List resultSet={};
Array A=(select * from A);
Array B=(select id from B);for(int i=0;i<A.length;i++)
{
for(int j=0;j<B.length;j++) {
if(A[i].id==B[j].id) {
resultSet.add(A[i]); break;
}
}
}return resultSet;可以看出,当B表数据较大时不适合使用in(),因为它会B表数据全部遍历一次
例1:A表有10000条记录,B表有1000000条记录,那么最多有可能遍历10000*1000000次,效率很差。
例2:A表有10000条记录,B表有100条记录,那么最多有可能遍历10000*100次,遍历次数大大减少,效率大大提升。
结论:IN()适合B表比A表数据小的情况
2、EXISTS()语句内部工作原理
exists()会执行A.length次,它并不缓存exists()结果集,因为exists()结果集的内容并不重要,重要的是其内查询语句的结果集空或者非空,空则返回false,非空则返回true。
它的查询过程类似于以下过程:List resultSet={};
Array A=(select * from A);
for(int i=0;i<A.length;i++)
{ if(exists(A[i].id) { //执行select 1 from B where B.id=A.id是否有记录返回
- resultSet.add(A[i]);
- }
- }return resultSet;
当B表比A表数据大时适合使用exists(),因为它没有那么多遍历操作,只需要再执行一次查询就行。
例1:A表有10000条记录,B表有1000000条记录,那么exists()会执行10000次去判断A表中的id是否与B表中的id相等。
例2:A表有10000条记录,B表有100000000条记录,那么exists()还是执行10000次,因为它只执行A.length次,可见B表数据越多,越适合exists()发挥效果。
例3:A表有10000条记录,B表有100条记录,那么exists()还是执行10000次,还不如使用in()遍历10000*100次,因为in()是在内存里遍历比较,而exists()需要查询数据库,我们都知道查询数据库所消耗的性能更高,而内存比较很快。
结论:EXISTS()适合B表比A表数据大的情况
3、使用情况分析
当A表数据与B表数据一样大时,in与exists效率差不多,可任选一个使用。
在插入记录前,需要检查这条记录是否已经存在,只有当记录不存在时才执行插入操作,可以通过使用 EXISTS 条件句防止插入重复记录。
insert into A (name,age) select name,age from B
where not exists (select 1 from A where A.id=B.id);
EXISTS与IN的使用效率的问题,通常情况下采用exists要比in效率高,因为IN不走索引。但要看实际情况具体使用:
IN适合于外表大而内表小的情况;
EXISTS适合于外表小而内表大的情况。
4、关于EXISTS:
EXISTS用于检查子查询是否至少会返回一行数据,该子查询实际上并不返回任何数据,而是返回值True或False。
EXISTS 指定一个子查询,检测行的存在。
语法: EXISTS subquery
参数: subquery 是一个受限的 SELECT 语句 (不允许有 COMPUTE 子句和 INTO 关键字)。
结果类型: Boolean 如果子查询包含行,则返回 TRUE ,否则返回 FLASE 。
结论:
- select * from A where exists (select 1 from B where A.id=B.id)
EXISTS(包括 NOT EXISTS )子句的返回值是一个boolean值。 EXISTS内部有一个子查询语句(SELECT ... FROM...),我将其称为EXIST的内查询语句。其内查询语句返回一个结果集, EXISTS子句根据其内查询语句的结果集空或者非空,返回一个布尔值。
一种通俗的可以理解为:将外查询表的每一行,代入内查询作为检验,如果内查询返回的结果取非空值,则EXISTS子句返回TRUE,这一行行可作为外查询的结果行,否则不能作为结果。
分析器会先看语句的第一个词,当它发现第一个词是SELECT关键字的时候,它会跳到FROM关键字,然后通过FROM关键字找到表名并把表装入内存。接着是找WHERE关键字,如果找不到则返回到SELECT找字段解析,如果找到WHERE,则分析其中的条件,完成后再回到SELECT分析字段。最后形成一张我们要的虚表。
WHERE关键字后面的是条件表达式。条件表达式计算完成后,会有一个返回值,即非0或0,非0即为真(true),0即为假(false)。同理WHERE后面的条件也有一个返回值,真或假,来确定接下来执不执行SELECT。
分析器先找到关键字SELECT,然后跳到FROM关键字将STUDENT表导入内存,并通过指针找到第一条记录,接着找到WHERE关键字计算它的条件表达式,如果为真那么把这条记录装到一个虚表当中,指针再指向下一条记录。如果为假那么指针直接指向下一条记录,而不进行其它操作。一直检索完整个表,并把检索
出来的虚拟表返回给用户。EXISTS是条件表达式的一部分,它也有一个返回值(true或false)。
作者:IronM
链接:https://www.jianshu.com/p/f212527d76ff
来源:简书
着作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。