数据库优化技巧:notin及in语句的连接替代方案
在编写SQL语句时,如果要实现一张表有而另一张表没有的数据库时,通常第一直觉的写法就是:
select * from table1 where table1.id notin (select id from table2),这种方法虽然很直观,但是in及notin的写法经常会影响其执行的效率,对于大数据量时,这个原因经常是性能的瓶颈。在SQL Server中,可以通过左连接的方法来解决,其替代写法如下:
select a.* from table<st1:chmetcnv w:st="on" TCSC="0" NumberType="1" Negative="False" HasSpace="True" SourceValue="1" UnitName="a">1 a</st1:chmetcnv> left join table2 b on a.id=b.id where b.id is null
同理,这个方法也适用于in的情况
9.用EXISTS替代IN
在许多基于基础表的查询中,为了满足一个条件,往往需要对另一个表进行联接
在这种情况下,使用EXISTS(或NOT EXISTS)通常将提高查询的效率
低效
SELECT *
FROM EMP (基础表)
WHERE EMPNO > 0
AND DEPTNO IN (SELECT DEPTNO
FROM DEPT
WHERE LOC = 'MELB')
高效
SELECT *
FROM EMP (基础表)
WHERE EMPNO > 0
AND EXISTS (SELECT 'X'
FROM DEPT
WHERE DEPT.DEPTNO = EMP.DEPTNO
AND LOC = 'MELB')
10.用NOT EXISTS替代NOT IN
在子查询中,NOTIN子句将执行一个内部的排序和合并
无论在哪种情况下,NOTIN都是最低效的,因为它对子查询中的表执行了一个全表遍历
为了避免使用NOTIN,我们可以把它改写成外连接(Outer Joins)或NOT EXISTS
例如:
SELECT …
FROM EMP
WHERE DEPT_NO NOTIN (SELECT DEPT_NO
FROM DEPT
WHERE DEPT_CAT = 'A');
为了提高效率改写为
高效
SELECT …
FROM EMP A, DEPT B
WHERE A.DEPT_NO = B.DEPT(+)
AND B.DEPT_NO IS NULL
AND B.DEPT_CAT(+) = 'A'
最高效
SELECT …
FROM EMP E
WHERE NOT EXISTS (SELECT 'X'
FROM DEPT D
WHERE D.DEPT_NO = E.DEPT_NO
AND DEPT_CAT = 'A');