1. 서브쿼리(SubQuery)란?
하나의 SQL문 안에 포함되어 있는 또 다른 SQL문을 말함.
2. 서브쿼리 특징
1) 조인의 경우 조인에 참여하는 모든 테이블이 대등한 관계에 있기 때문에 조인에 참여하는 모든 테이블의 컬럼을 어느 위치에서라도 자유롭게 사용
2) 서브쿼리의 경우 메인쿼리의 컬럼을 모두 사용 할 수 있지만 메인쿼리는 서브쿼리의 컬럼을 사용 할 수 없음.
ex.
SELECT A.USER_ID, A.USER_EAMIL, B.USER_NAME -- 서브쿼리의 컬럼(사용 x) FROM USER A WHERE USER_ID = ( SELECT B.USER_ID FROM USER_DETAIL B WHERE A.USER_ID = B.USER_ID -- A.USER_ID는 메인쿼리의 컬럼 )
▲ 위와 같이 서브쿼리에서 사용한 B 테이블을 메인 쿼리에서 사용할 수 없음. (에러 발생)
3) 질의 결과에 서브쿼리 컬럼을 표시해야 된다면 조인 방식으로 변환하거나 함수, 스칼라 서브쿼리(Scalar Subquery) 등을 사용해야 한다.
ex.
3-1) 조인 방식 SELECT A.USER_ID, A.USER_EAMIL, B.USER_NAME FROM USER A, USER_DETAIL B WHERE A.USER_ID = B.USER_ID 3-2)스칼라 서브쿼리 SELECT A.USER_ID A.USER_EMAIL, (SELECT B.USER_NAME FROM USER_DATIL B WHERE A.USER_ID = B.USER_ID)AS USER_NAME FORM USER A
▲ 위와 같이 서브쿼리에서 사용한 B 테이블을 메인 쿼리에서 사용할 수 없음. (에러 발생)
참고) 서브쿼리 명칭
- SLEECT 문에 있는 서브쿼리 : 스칼라 서브쿼리
- FROM 절에 있는 서브쿼리 : 인라인 뷰
- WHERE 절에 있는 서브쿼리 : 서브쿼리
4) 조인은 집합간의 곱(Product)의 관계
4-1) 1:1 관계의 테이블을 조인하면 1(= 1*1) 레벨의 집합이 생성
4-2) 1:M 관계의 테이블을 조인하면 M(= 1*M) 레벨의 집합이 생성
4-3) M:N 관계의 테이블을 조인하면 MN(= M*N) 레벨의 집합이 생성
ex.
5) 서브쿼리는 서브쿼리 레벨과는 상관없이 항상 메인쿼리 레벨로 결과를 생성
ex.
부서 테이블(메인쿼리로 사용)
부서번호 | 부서명 |
B001 | 경영팀 |
B002 | 개발팀 |
사원 테이블(서브쿼리로 사용)
사원번호 | 사원이름 | 부서번호 |
S001 | 홍길동 | B001 |
S002 | 홍길순 | B002 |
S003 | 잡스 | B002 |
5-1) 서브쿼리 방식을 사용 한 경우
SELECT A.부서번호 ,A.부서명 FORM 부서 A WHERE A.부서번호 IN (SELECT B.부서번호 FROM 사원 B WHERE A.부서번호 = B.부서번호)
▲ 위와 같이 서브쿼리를 사용하면 결과 집합은 부서 레벨이 됨,
5-1-1) 결과
부서번호 | 부서명 |
B001 | 경영팀 |
B002 | 개발팀 |
5-2) 잘못 된 판단으로 조인 방식을 사용 한 경우
SELECT A.부서번호 ,A.부서명 FORM 부서 A, 사원 B WHERE A.부서번호 = B.부서번호
▲ 위와 같이 잘못 된 판단으로 조인을 사용하면 결과 집합은 사원 레벨이 됨.
5-2-2) 결과
부서번호 | 부서명 |
B001 | 경영팀 |
B002 | 개발팀 |
B002 | 개발팀 |
5-2-3) 5-1-1과 같이 부서레벨로 만드려면 DISTINCT를 사용해서 중복 데이터가 있는 경우 하나만 들고 오게 수정해야 됨.
3. 서브쿼리 사용 시 주의사항1) 서브쿼리는 괄호로 감싼 후 사용2) 서브쿼리는 단일 행(Single Row) 또는 복수 행(Multiple Row) 비교 연산자와 함께 사용 가능2-1) 단일 행 비교 연산자는 서브쿼리의 결과가 반드시 1건 이하이어야 하고 복수 행 비교 연산자는 서브쿼리의 결과 건수와 상관 없음.3) 서브쿼리에서는 ORDER BY를 사용하지 못한다. ORDER BY절은 SELECT절에서 오직 한 개만 올 수 있기 대문에 ORDER BY 절은 메인쿼리의 마지막 문자에 위치
4. SQL문에서 사용 가능한 서브쿼리 위치1) SELECT 절2) FROM 절3) WHERE 절4) HAVING 절5) ORDER BY 절6) INSERT문의 VALUES 7) UPDATE문의 SET
5.서브쿼리 종류
1) Un-Correlated 서브쿼리
: 서브쿼리에서 메인쿼리 컬럼을 사용하지 않음.
(Un-Correlated Subquery로 검색하면 잘 안 나오고 Non-Correlated Subquery로 검색해야 잘 나옴.)
ex.
SELECT A.부서번호 ,A.부서명 FORM 부서 A WHERE A.부서번호 IN (SELECT B.부서번호 FROM 사원 B) -- 서브쿼리에서 메인쿼리에서 사용된 A테이블의 컬럼을 사용하지 않음.
2) Correlated 서브쿼리
: 서브쿼리에서 메인쿼리 컬럼을 사용 함.
ex.
SELECT A.부서번호 ,A.부서명 FORM 부서 A WHERE A.부서번호 IN (SELECT B.부서번호 FROM 사원 B WHERE B.USER_ID = A.USER_ID) -- 서브쿼리에서 메인쿼리에서 사용된 A테이블의 컬럼을 사용함.
6. 서브쿼리 분류
서브쿼리는 메인쿼리 안에 포함된 종속적인 관계이기 때문에 논리적인 실행순서는 항상 메인쿼리에서 읽혀진 데이터에 대해 서브쿼리에서 해당 조건이 만족하는지 확인하는 방식으로 수행되어야 함.
하지만 실제 서브쿼리 실행순서는 상황에 따라 달라짐.
▲ 반환되는 데이터 형태에 따라 세 가지로 분류
SELECT
PLAYER_NAME 선수명
, POSITION 포지션
, BACK_NO 백넘버
FROM PLAYER
WHERE TEAM_ID = (
SELECT
TEAM_ID
FROM PLAYER
WHERE PLAYER_NAME = '정남일'
)
ORDER BY PLAYER_NAME;
SELECT
PLAYER_NAME 선수명
, POSITION 포지션
, BACK_NO 백넘버
FROM PLAYER
WHERE HEIGHT <= (
SELECT
AVG(HEIGHT)
FROM PLAYER
)
ORDER BY PLAYER_NAME;
SELECT
PLAYER_NAME 선수명
, POSITION 포지션
, BACK_NO 백넘버
FROM PLAYER
WHERE HEIGHT <= (
SELECT
AVG(HEIGHT), TEAM_ID
FROM PLAYER
)
ORDER BY PLAYER_NAME; --에러 발생
SELECT
PLAYER_NAME 선수명
, POSITION 포지션
, BACK_NO 백넘버
FROM PLAYER
WHERE (HEIGHT, TEAM_ID) IN (
SELECT
AVG(HEIGHT), TEAM_ID
FROM PLAYER
)
ORDER BY PLAYER_NAME; --해당 기능은 SQL Server에서는 지원되지 않음.
SELECT
PLAYER_NAME 선수명
, POSITION 포지션
, BACK_NO 백넘버
, HEIGHT 키
FROM PLAYER
WHERE HEIGHT IN (
SELECT
HEIGHT
FROM PLAYER
WHERE HEIGHT = '165' OR HEIGHT = '190' OR HEIGHT = '178'
)
ORDER BY PLAYER_NAME;
-- 서브쿼리 결과 값이 178, 190, 165 이라는 전제
-- HEIGHT = '178' OR HEIGHT = '190' OR HEIGHT = '165' 와 같음
-- 하지만, IN()의 경우 FULLSCAN을 하기 때문에 속도가 느림.
-- 예를 들면 IN의 경우 178, 190, 165 중 178이 맞아도 다음줄로 안 넘어가고 190, 165를 다 검사함.
-- = 와 OR를 사용하면 178 하나만 맞으면 다음줄로 넘어감.
( 이 부분은 발표때 추가 설명 하겠음!!)
SELECT
PLAYER_NAME 선수명
, POSITION 포지션
, BACK_NO 백넘버
, HEIGHT 키
FROM PLAYER
WHERE HEIGHT > ALL(
SELECT
HEIGHT
FROM PLAYER
WHERE HEIGHT = '165' OR HEIGHT = '190' OR HEIGHT = '178')
ORDER BY PLAYER_NAME;
-- 서브쿼리 결과 값이 178, 190, 165 으로 다중반환 된 경우 > ALL은 이 중 최대값보다 크다는 것을 의미 / < ALL 은 최소값보다 작은 것을 의미
-- 서브쿼리에서 리턴되는 모든 값을 만족하면 조건이 성립되기 때문에, 서브쿼리 결과 값 중에서 최대값으로 비교하면 모든 조건이 성립된다.
-- > ALL : 178보다 크고, 165보다 크고, 190보다 크다라는 AND 조건이 성립
-- < ALL : 190 보다 작고, 178보다 작고, 165보다 작다라는 AND 조건이 성립
SELECT
PLAYER_NAME 선수명
, POSITION 포지션
, BACK_NO 백넘버
FROM PLAYER
WHERE HEIGHT > ANY(
SELECT
HEIGHT
FROM PLAYER
)
ORDER BY PLAYER_NAME;
-- 서브쿼리 결과 값이 178, 190, 165 으로 다중반환 된 경우 > ANY는 이 중 어느 하나라도 만족하면 되므로 최소값 165보다 큰 것을 찾음.
-- 즉, 현재 비교연산자로 >를 사용했으므로 165보다 큰 HEIGHT 데이터를 찾음 / <를 사용했으면 190보다 작은 데이터를 찾음.
TEAM_INFO 테이블
-- EXISTS() 사용
SELECT PLAYER_NAME 선수명 , POSITION 포지션 , BACK_NO 백넘버 , HEIGHT 키 , TEAM_ID 팀아이디 FROM PLAYER P WHERE EXISTS ( SELECT * FROM TEAM_INFO T WHERE T.TEAM_ID = P.TEAM_ID ) ORDER BY PLAYER_NAME ;
--IN() 사용
SELECT PLAYER_NAME ,POSITION ,BACK_NO ,HEIGHT ,TEAM_ID FROM PLAYER P WHERE TEAM_ID IN ( SELECT
TEAM_ID
FROM TEAM_INFO T
)
ORDER BY PLAYER_NAME;
-- NOT EXISTS() 사용 SELECT PLAYER_NAME 선수명 , POSITION 포지션 , BACK_NO 백넘버 , HEIGHT 키 , TEAM_ID 팀아이디 FROM PLAYER P WHERE NOT EXISTS ( SELECT * FROM TEAM_INFO T WHERE T.TEAM_ID = P.TEAM_ID ) ORDER BY PLAYER_NAME ; --NOT IN() 사용 SELECT PLAYER_NAME ,POSITION ,BACK_NO ,HEIGHT ,TEAM_ID FROM PLAYER P WHERE TEAM_ID NOT IN ( SELECT TEAM_ID FROM TEAM_INFO T ) ORDER BY PLAYER_NAME;
ex8-1. NOT EXISTS 결과(OR)
▲ TEAM_INFO 테이블에 저장된 TEAM_ID의 경우 T001, T002, NULL 이니 일반적으로 T001, T002, NULL이 아닌 T003, T004을 팀으로 가지는 송중기, 원빈만 데이터로 나올 것이라고 생각할 수 있음.
하지만 결과를 보면 TEAM_ID가 NULL인 김땡땡도 보여짐.
EXISTS의 경우는 NULL 이 안 나오는데 NOT EXISTS의 경우는 NULL도 나와서 찾아본 바로는 1. NULL = NULL 이면 false 이니(NULL끼리 비교는 안 되므로) 당연히 안 보여져야 되는데 NOT 으로 인해 true 가 되니 메인쿼리가 null도 보여지게 되는 거라고 함.(2개의 테이블에 null만 있는 데이터 1개씩 넣어서 테스트 해보면 조금 더 이해가 됨.)내가 이해한대로라면 NOT EXISTS (001, 002, FALSE(NULL)) 가 되어 결과는 003 OR 004 OR TURE(NULL) 가 되어 위의 결과가 보여지는 듯 함.
ex8-2. NOT IN 결과(AND)
▲ NOT IN의 경우도 T001, T002, NULL 이 포함되지 않은 데이터 T003, T004를 팀으로 가지는 송중기, 원빈이 나올 것이라고 생각하게 됨.
하지만 0건의 데이터가 결과로 나옴.
혹시나 해서 TEAL_INFO 테이블에 TEAM_ID가 NULL 인 데이터에 T006을 넣어줬더니 원하는 결과가 나왔음.
풀어서 써보면 TEAM_ID <> T001 AND TEAM_ID <> T002 AND TEAM_ID <> NULL 인데 NULL이 아닌 경우는 IS NOT NULL을 써야되므로 TEAM_ID <> NULL는 당연히 문법적으로 틀렸기 때문에 1건도 검색하지 못 하게 됨.
반대로 생각해서 그럼 IN은 왜 NULL 데이터가 있어도 검색이 되지? 라고 생각할 수 있는데 IN은 OR 조건이기 때문에 하나라도 TRUE가 되면 서브쿼리 자체가 TRUE로 반환되므로 나오는 것임.ex8-3. 결론IN()은 조건에 만족하는 데이터를 찾는 것이고 EXISTS는 TRUE인지 FALSE인지를 체크하는 것임.IN의 경우 JOIN 연산을 하지 않고, EXISTS는 JOIN 연산을 함.그러므로 NULL 값을 가질 때 NOT IN의 경우 값을 비교하는거다보니 값 <> NULL이 되어 잘못된 문법으로 결과에서 아예 제외되버리고, EXISTS의 경우 값을 만족하는지 안 하는지에 대해서만 체크를 하고 데이터를 비교하는게 아니기 때문에 FALSE를 리턴하고 FALSE의 NOT이니까 결국 TURE가 되어 NULL도 결과에 포함됨.만약 NOT IN에서 NULL값도 비교하게 하고 싶다면 NVL을 이용하여 NULL 처리를 해줘야 됨.
9. 그 밖에 위치에서 사용하는 서브쿼리
1) SELECT 절에 서브쿼리 사용하기(스칼라 쿼리) : 한 행, 한 컬럼만을 반환해야 함 / 2건 이상 반환되면 오류 발생
SELECT
PLAYER_NAME
,HEIGHT
,(SELECT AVG(HEIGHT) FROM PLAYER X WHERE X.TEAM_ID = P.TEAM_ID)AS AVG_HEIGHT
FROM PLAYER P
2) FROM 절에서 서브쿼리 사용하기(인라인 뷰) :
- 인라인 뷰는 SQL문이 실행될 때만 임시적으로 생성되는 동적인 뷰이기 때문에 데이터베이스에 해당 정보가 저장되지 않음.
- 일반적인 뷰를 정적 뷰(Static View)라고 하고, 인라인 뷰를 동적 뷰(Dynamic View)라고 함.
- 인라인 뷰는 테이블 명이 올 수 있는 곳에서 사용 가능- 서브쿼리의 컬럼은 메인쿼리에서 사용 할 수 없으나 인라인 뷰는 동적으로 생성된 테이블임.- 인라인 뷰를 사용하는 것은 조인 방식을 사용하는 것과 같기 때문에 인라인 뷰의 컬럼을 SQL문에서 자유롭게 참조할 수 있음.
SELECT
T.TEAM_NAME
,P.PLAYER_NAME
,P.BACK_NO
FROM
(
SELECT TEAM_ID
,PLAYER_NAME
,BACK_NO
FROM PLAYER
WHERE POSITION = 'MF'
) P
, TEAM T
WHERE P.TEAM_ID = T.TEAM_ID
ORDER BY TEAM_NAME;
-- TOP-쿼리 : 인라인 뷰에서 먼저 정렬을 수행하고 정렬된 결과 중에서 일부 데이터를 추출하는 작업
SELECTPLAYER_NAME
BACK_NOFROM(SELECT TEAM_ID,PLAYER_NAME,BACK_NOFROM PLAYERWHERE HEIGHT IS NOT NULLORDER BY HEIGHT DESC
) WHERE ROWNUM <= 5;
3) HAVING 절에서 서브쿼리 사용하기 : GROUP함수를 사용할 때 그룹핑 된 결과에 대해 부가적인 조건을 줄 때 사용
SELECT
P.TEAM_ID
,T.TEAM_NAME
,AVG(P.HEIGHT) AS AVG_HEIGHT
FROM
PLAYER P
, TEAM T
WHERE P.TEAM_ID = T.TEAM_ID
GROUP BY P.TEAM_ID
,T.TEAM_NAME
HAVING AVG(P.HEIGHT) < (SELECT AVG(HEIGHT) FROM PLAYER WHERE TEAM_ID = 'K02')
4) UPDATE문의 SET 절에서 사용하기 : 서브쿼리 결과가 NULL을 반환할 경우 해당 컬럼의 결과가 NULL이 될 수 있기 때문에 주의 필요
UPDATE
TEAM A
SET
A.STADIUM_NAME = (
SELECT
X.STADIUM_NAME
FROM STADIUM X
WHERE X.STADIUM_ID = A.STADIUM_ID
)
5) INSERT 문의 VALUES 절에서 사용하기
INSERT INTO
PLAYER
(
PLAYER_ID
, PLAYER_NAME
, TEAM_ID
)
VALUES
(
(SELECT TO_CHAR(MAX(TO_NUMBER(PALYER_ID))+1) FROM PLAYER)
,'홍길동'
,'K06'
);
-- 테이블 복사 할때도 사용(데이터 복사)
CREATE TABLE TEMP_PLAYERAS SELECT * FROM PLAYER;-- mysql의 경우 테이블 구조까지 복사되지 않음 / 테이블 구조도 복사하는 방법CREATE TEMP_PLAYER LIKE PLAYER ;--테이블 및 테이블 구조 복사 후INSERT INTO TEMP_PLAYER SELECT * FROM PLAYER ;-- 데이터 복사
-- 테이블만 복사CREATE TABLE TEMP_PLAYERAS SELECT * FROM PLAYER WHERE 1 = 2 ;--조건이 성립하지 않게 해서 데이터는 복사하지 않음.
10. 뷰(VIEW)
- 테이블은 실제 데이터를 가지고 있는 반면, 뷰는 실제 데이터를 가지고 있지 않음.- 뷰는 단지 뷰 정의만을 가지고 있음.- SQL문에서 뷰를 사용하면 DBMS 내부적으로 뷰 정의를 참고해 재작성하여 SQL문을 수행함.- 가상 테이블이라고 함.
CREATE VIEW
V_PLAYER_TEAM
AS
SELECT
P.PLAYER_NAME
, P.POSITION
, P.BACK_NO
, P.TEAM_ID
, T.TEAM_NAME
FROM PLAYER P, TEAM T
WHERE P.TEAM_ID = T.TEAM_ID;
-- 이미 존재하는 뷰를 참조해서 뷰 생성 가능 / 하지만 뷰를 포함하는 뷰를 잘 못 생성하는 경우 성능상의 문제를 유발 할 수 있음.
CREATE VIEWV_PLAYER_TEAM_FILTERAS SELECT * FROM V_PLAYER_TEAMWHERE POSITION IN('GK','MF');-- 뷰를 통해 데이터 조회SELECT PLAYER_NAME, TEAM_NAME FROM V_PLAER_TEAM WHERE PLAYER_NAME LIKE '%맹고%';
-- 뷰를 통해 조회하면 아래와 같이 DBMS가 내부적으로 SQL문을 재작성함.SELECT PLAYER_NAME, TEAM_NAME FROM (SELECTP.PLAYER_NAME, P.POSITION, P.BACK_NO, P.TEAM_ID, T.TEAM_NAME FROM PLAYER P, TEAM TWHERE P.TEAM_ID = T.TEAM_ID)WHERE P.PLAYER_NAME LIKE '%맹고%';
--뷰 제거DROP VIEW V_PLAYER_TEAM;
* DB 스터디 참고 교재 : SQL 개발자 가이드
* 포스팅 참고 URL :
1) https://dataonair.or.kr/db.db?cmd=view&boardUid=148203&boardConfigUid=9&categoryUid=216&boardIdx=135&boardStep=1
2) http://ttend.tistory.com/623
3)https://technet.microsoft.com/ko-kr/library/ms187074(v=sql.105).aspx
4)http://www.kkomzi.net/wordpress/128
5)http://tystory.tistory.com/211
6)http://tipland.tistory.com/6
'자격증 > SQLD(SQL 개발자)' 카테고리의 다른 글
SQLD - SQL 기본 (0) | 2022.11.01 |
---|---|
SQLD - 데이터 모델과 성능 (0) | 2022.10.25 |
SQLD - 데이터 모델링의 이해 (2) | 2022.10.24 |
SQLD(SQL 개발자) 요약/요점정리 (0) | 2022.10.24 |
[SQL활용] 그룹 함수 (0) | 2017.12.06 |
댓글