티스토리 뷰
1. 인덱스 특징과 종류
인덱스는 원하는 데이터를 쉽게 찾을 수 있도록 돕는 책의 찾아보기와 유사한 개념이다.
Insert, Update, Delete 등과 같은 DML 작업은 테이블과 인덱스를 함께 변경해야 하기 때문에 오히려 느려질 수 있다는 단점이 존재한다.
가. 트리 기반 인덱스
- B-트리 인덱스 = 브랜치 블록(Branch Block)과 리프 블록(Leaf Block)
n 브랜치 블록 중에서 가장 사우이에 있는 블록을 루트 블록(Root Block)
n 브랜치 블록은 다음 단계의 블록을 가리키는 포인터를 가지고 있다.
n 리프 블록은 트리의가장 아래 단계에 존재한다.
n 리프블록은 인덱스를 구성하는 칼럼의 데이터와 해당 데이터를 가지고 있는 행의 위치를 가리키는 레코드 식별자(RID, Recode Identifier/Rowid)로 구성
n 인덱스 데이터는
인덱스를 구성하는 칼럼의 값으로 정렬된다.
만약 인덱스 데이터의 값이 동일하면 레코드 식별자의 순서로 저장된다.
n 리프 블록은
양방향 링크(Double Link)를 가지고 있다.
이것을 통해서 오름차순(Ascending Order)과 내림차순(Descending Order) 검색을 쉽게 할 수 있다.
n B-트리 인덱스는 ‘=’로 검색하는 일치(Exact Match) 검색과 ‘BETWEEN’, ‘>’ 등과 같은 연산자로 검색하는 범위(Range) 검색 모두에 적합한 구조
나. SQL Server의 클러스터형 인덱스
- SQL Server의 인덱스 종류 : 저장 구조에 따라 클러스터형(Clustered) 인덱스와 비클러스터형(nonclustered) 인덱스로 나뉜다.
- 클러스터형 인덱스
n 첫째, 인덱스의 리프 페이지가 곧 데이터 페이지다. 따라서 테이블 탐색에
필요한 레코드 식별자가 리프페이지에 없다. (인덱스 키 칼럼과 나머지 칼럼을 리프 페이지에 같이 저장하기
때문에 테이블을 랜덤 액세스 할 필요가 없다.)
클러스터형 인덱스의 리프 페이지를 탐색하면 해당 테이블의 모든 칼럼 값을 곧바로 얻을 수 있다.
n 둘째, 리프페이지의 모든 로우(=데이터)는
인덱스 키 칼럼 순으로 물리적으로 정렬되어 저장된다.
테이블 로우는 물리적으로 한 가지 순서로만 정렬될 수 있다.
그러므로 클러스터형 인덱스는 테이블당 한 개만 생성할 수 있다.
2. 전체 테이블 스캔과 인덱스 스캔
가. 전체 테이블 스캔
전체 테이블 스캔 방식으로 데이터를 검색한다는 것은 테이블에 존재하는 모든 데이터를 읽어 가면서 조건에 맞으면 결과로서 추출하고 조건에 맞지 않으면 버리는 방식으로 검색한다.
- Oracle : 전체 테이블 스캔 방식으로 데이터를 검색할 때 고수위 마크(HWM)까지의 블록 내 모든 데이터를 읽어야 하기 때문에 모든 결과를 찾을 때까지 시간이 오래 걸릴 수 있다. 이와 같이 전체 테이블 스캔 방식은 테이블에 존재하는 모든 블록의 데이터를 읽는다. 그러나 이것은 결과를 찾기 위해 꼭 필요해서 모든 블록을 읽은 것이다. 따라서 이렇게 읽은 블록들은 재사용성이 떨어진다. 그래서 전체 테이블 스캔 방식으로 읽은 블록들은 메모리에서 곧 제거될 수 있도록 관리한다.
- 옵티마이저가 연산으로서 전체 테이블 스캔 방식을 선택하는 이유
1.
SQL문에 조건이 존재하지 않는 경우
SQL문에 조건이 존재하지 않는다는 것은 테이블에 존재하는 모든 데이터가 답이 된다는 것이다.
2.
SQL문의 주어진 조건에 사용 가능한 인덱스가
존재하지 않는 경우
또한 주어진 조건에 사용 가능한 인덱스는 존재하나 함수를 사용하여 인덱스 칼럼을 변형한 경우에도 인덱스를 사용할 수 없다.
3.
옵티마이저의 취사 선택
조건을 만족하는 데이터가 많은 경우, 결과를 추출하기 위해서 테이블의 대부분의 블록을 액세스해야
한다고 옵티마이저가 판단하면 조건에 사용 가능한 인덱스가 존재해도 전체 테이블 스캔 방식으로 읽을 수 있다.
4.
그밖의 경우
병렬처리 방식으로 처리하는 경우 또는 전체테이블 스캔 방식의 힌트를 사용한 경우
나. 인덱스 스캔
인덱스의 리프 블록은 인덱스 구성하는 칼럼과 레코드 식별자로 구성되어 있다. 따라서 검색을 위해 인덱스의 리프 블록을 읽으면 인덱스 구성 칼럼의 값과 테이블의 레코드 식별자를 알 수 있다.
인덱스는 인덱스 구성 칼럼의 순서로 정렬되어 있다. 인덱스가 구성 칼럼으로 정렬되어 있기 때문에 인덱스를 경유하여 데이터를 읽으면 그 결과 또한 정렬되어 반환된다.
따라서 인덱스의 순서와 동일한 정렬 순서를 사용자가 원하는 경우에는 정렬 작업을 하지 않을 수 있다.
1.
인덱스 유일 스캔은 유일 인덱스(Unique Index)를
사용하여 단 하나의 데이터를 추출하는 방식이다. 유일 인덱스는 중복을 허락하지 않는 인덱스이다.
유일 인덱스 구성 칼럼에 모두 ‘=’로 값이 주어지면 결과는 최대 1건이 된다.
2. 인덱스 범위 스캔은 인덱스를 이용하여 한 건 이상의 데이터를 추철하는 방식이다. 유일 인덱스의 구성 칼럼 모두에 대해 ‘=’로 값이 주어지지 않은 경우와 비유일 인덱스(Non-Unique Index)를 이용하는 모든 액세스 방식은 인덱스 범위 스캔 방식으로 데이터를 액세스하는 것이다.
3. ㅇ인덱스 역순 범위 스캔은 인덱스의 리프 블록의 양방향 링크를 이용하여 내림차순으로 데이터를 읽는 방식이다. 이 방식을 이용하여 최대값(Max Value)을 쉽게 찾을 수 있다. 이 또한 인덱스 범위 스캔의 일종이다.
4.
기타 방식들
인덱스 전체 스캔(Index Full Scan), 인덱스 고속 전체 스캔(Fast Index Full Scan), 인덱스 스킵 스캔(Index Skip
Scan)
다. 전체 테이블 스캔과 인덱스 스캔 방식의 비교
- 데이터를 액세스하는 방법은 크게 두 가지로 나눠 볼 수 있다. 인덱스를 경유해서 읽는 인덱스 스캔 방식과 테이블의 전체 데이터를 모두 읽으면서 데이터를 추출하는 전체 테이블 스캔 방식이다.
- 인덱스 스캔 방식은 사용 가능한 적절한 인덱스가 존재할 때만 이용할 수 있는 스캔 방식이지만 전체 테이블 스캔 방식은 인데스의 존재 유무와 상관없이 항상 이용 가능한 스캔 방식이다.
- 옵티마이저는 인덱스가 존재하더라도 전체 테이블 스캔 방식을 취사 선택할 수 있다.
l 인덱스 스캔은 인덱스에 존재하는 레코드 식별자를 이용해서 검색하는 데이터의 정확한 위치를 알고서 데이터를 읽는다. 한번의 I/O 요청에 한 블록씩 데이터를 읽는다.
l 전체 테이블 스캔은 테이블의 모든 데이터를 읽으면서 원하는 데이터를 찾아야 하기 때문에 비효율적인 검색을 하게 된다. 반대로 테이블의 대부분의 데이터를 찾을 때는 한 블록씩 읽는 인덱스 스캔 방식 보다는 한번에 여러 블록씩 읽는 전체 테이블 스캔 방식이 유리할 수 있다.
'자격증 > SQLD' 카테고리의 다른 글
SQLD 요약 목록 (0) | 2017.10.27 |
---|---|
SQLD - SQL 최적화 기본 원리 [조인 수행 원리] (0) | 2017.08.17 |
SQLD - SQL 최적화 기본 원리 [옵티마이저와 실행계획] (0) | 2017.08.17 |
SQLD - SQL 활용 [절차형 SQL] (0) | 2017.08.16 |
SQLD - SQL 활용 [DCL] (0) | 2017.08.16 |