클러스터형 인덱스의 크기 예측

적용 대상:SQL ServerAzure SQL DatabaseAzure SQL Managed Instance

다음 단계를 사용하여 클러스터형 인덱스로 데이터를 저장하는 데 필요한 공간의 양을 예측할 수 있습니다.

  1. 클러스터형 인덱스의 리프 수준에서 데이터를 저장하는 데 사용되는 공간을 계산합니다.

  2. 클러스터형 인덱스에 대한 인덱스 정보를 저장하는 데 사용되는 공간을 계산합니다.

  3. 계산된 값의 합계입니다.

1단계 리프 수준에 데이터를 저장하는 데 사용되는 공간 계산

  1. 테이블에 있을 행 수를 지정합니다.

    Num_Rows = 테이블의 행 수

  2. 고정 길이 및 가변 길이 열 수를 지정하고 이러한 열을 스토리지하는 데 필요한 공간을 계산합니다.

    이러한 각 열 그룹이 데이터 행 내에서 차지하는 공간을 계산합니다. 열의 크기는 데이터 형식 및 길이 사양에 따라 달라집니다.

    Num_Cols = 열의 총 수(고정 길이 및 가변 길이)

    Fixed_Data_Size = 모든 고정 길이 열의 총 바이트 크기

    Num_Variable_Cols = 가변 길이 열의 수

    Max_Var_Size = 모든 가변 길이 열의 최대 바이트 크기

  3. 클러스터형 인덱스가 고유하지 않은 경우 uniqueifier 열을 계산합니다.

    uniqueifier는 nullable의 가변 길이 열입니다. 고유하지 않은 키 값이 있는 행에서 이 열은 Null이 아니며 크기는 4바이트입니다. 이 값은 인덱스 키의 일부이며 모든 행에 고유한 키 값이 있는지 확인해야 합니다.

    Num_Cols = Num_Cols + 1

    Num_Variable_Cols = Num_Variable_Cols + 1

    Max_Var_Size = Max_Var_Size + 4

    이러한 수정에서는 모든 값이 고유하지 않다고 가정합니다.

  4. 행의 Null 비트맵 부분은 열의 Null 허용 여부 관리를 위해 예약됩니다. 다음과 같이 이 부분의 크기를 계산합니다.

    Null_Bitmap = 2 + ((Num_Cols + 7) / 8)

    이전 식의 정수 부분만 사용해야 합니다. 는 나머지를 취소합니다.

  5. 가변 길이 데이터 크기를 계산합니다.

    테이블에 가변 길이 열이 있는 경우 행 내에 열을 저장하는 데 사용되는 공간을 결정합니다.

    Variable_Data_Size = 2 + (Num_Variable_Cols x 2) + Max_Var_Size

    Max_Var_Size에 추가된 바이트는 각 변수 열을 추적하기 위한 것입니다. 이 수식에서는 모든 가변 길이 열이 100% 가득 찼다고 가정합니다. 가변 길이 열 스토리지 공간의 더 작은 비율을 사용할 것으로 예상되는 경우 Max_Var_Size 값을 해당 백분율로 조정하여 전체 테이블 크기를 보다 정확하게 예측할 수 있습니다.

    참고 항목

    정의된 총 테이블 너비가 8,060바이트를 초과하는 varchar, nvarchar, varbinary또는 sql_variant 열을 결합할 수 있습니다. 이러한 각 열의 길이는 varchar, varbinary 또는 sql_variant 열의 경우 8,000바이트, nvarchar 열의 경우 4,000바이트 이내여야 합니다. 그러나 결합된 너비는 테이블의 8,060 바이트 제한을 초과할 수 있습니다.

    가변 길이 열이 없으면 Variable_Data_Size 0으로 설정합니다.

  6. 총 행 크기를 계산합니다.

    = Row_Size Fixed_Data_Size + Variable_Data_Size + Null_Bitmap + 4

    값 4는 데이터 행의 행 머리글 오버헤드입니다.

  7. 페이지당 행 수를 계산합니다(페이지당 8096바이트 사용 가능).

    Rows_Per_Page = 8096 / (Row_Size + 2)

    행은 페이지에 걸쳐 있지 않으므로 페이지당 행 수를 가장 가까운 전체 행으로 반올림해야 합니다. 수식의 값 2는 페이지의 슬롯 배열에 있는 행의 항목에 대한 값입니다.

  8. 지정한 채우기 비율에 따라 페이지당 예약된 여유 행 수를 계산합니다.

    Free_Rows_Per_Page = 8096 x ((100 - Fill_Factor) / 100) / (Row_Size + 2)

    계산에 사용되는 채우기 비율은 백분율 대신 정수 값입니다. 행은 페이지에 걸쳐 있지 않으므로 페이지당 행 수를 가장 가까운 전체 행으로 반올림해야 합니다. 채우기 비율이 클수록 각 페이지에 더 많은 데이터가 저장되고 페이지 수는 줄어듭니다. 수식의 값 2는 페이지의 슬롯 배열에 있는 행의 항목에 대한 값입니다.

  9. 모든 행을 저장하는 데 필요한 페이지 수를 계산합니다.

    Num_Leaf_Pages = Num_Rows / (Rows_Per_Page - Free_Rows_Per_Page)

    예상 페이지 수는 가장 가까운 전체 페이지로 반올림되어야 합니다.

  10. 리프 수준에서 데이터를 저장하는 데 필요한 공간의 양을 계산합니다(페이지당 총 바이트 수 8192바이트).

    Leaf_space_used = 8192 x Num_Leaf_Pages

2단계. 인덱스 정보를 저장하는 데 사용되는 공간 계산

다음 단계를 사용하여 인덱스의 상위 수준을 저장하는 데 필요한 공간의 양을 예측할 수 있습니다.

  1. 인덱스 키의 고정 길이 및 가변 길이 열 수를 지정하고 이러한 열을 스토리지하는 데 필요한 공간을 계산합니다.

    인덱스의 키 열에는 고정 길이 및 가변 길이 열이 포함될 수 있습니다. 내부 수준 인덱스 행 크기를 예측하려면 이러한 각 열 그룹이 인덱스 행 내에서 차지하는 공간을 계산합니다. 열의 크기는 데이터 형식 및 길이 사양에 따라 달라집니다.

    Num_Key_Cols = 키 열의 총 수(고정 길이 및 가변 길이)

    Fixed_Key_Size = 모든 고정 길이 키 열의 총 바이트 크기

    Num_Variable_Key_Cols = 가변 길이 키 열의 수

    Max_Var_Key_Size = 모든 가변 길이 키 열의 최대 바이트 크기

  2. 인덱스가 고유하지 않은 경우 필요한 고유 식별자를 계산합니다.

    uniqueifier는 nullable의 가변 길이 열입니다. 고유하지 않은 인덱스 키 값이 있는 행에서 이 열은 Null이 아니며 크기는 4바이트입니다. 이 값은 인덱스 키의 일부이며 모든 행에 고유한 키 값이 있는지 확인해야 합니다.

    Num_Key_Cols = Num_Key_Cols + 1

    Num_Variable_Key_Cols = Num_Variable_Key_Cols + 1

    Max_Var_Key_Size = Max_Var_Key_Size + 4

    이러한 수정에서는 모든 값이 고유하지 않다고 가정합니다.

  3. Null 비트맵 크기를 계산합니다.

    인덱스 키에 null 허용 열이 있는 경우 인덱스 행의 일부가 null 비트맵에 대해 예약됩니다. 다음과 같이 이 부분의 크기를 계산합니다.

    Index_Null_Bitmap = 2 + ((인덱스 행의 열 수 + 7) / 8)

    위 식의 정수 부분만 사용하고 나머지를 삭제합니다.

    Null을 허용하는 키 열이 없으면 Index_Null_Bitmap을 0으로 설정합니다.

  4. 가변 길이 데이터 크기를 계산합니다.

    인덱스에 가변 길이 열이 있는 경우에는 해당 인덱스 행 안에 열을 저장하는 데 사용되는 공간을 결정합니다.

    Variable_Key_Size = 2 + (Num_Variable_Key_Cols x 2) + Max_Var_Key_Size

    Max_Var_Key_Size에 추가된 바이트는 각 가변 길이 열을 추적하기 위한 것입니다. 이 수식에서는 모든 가변 길이 열이 100% 가득 찼다고 가정합니다. 사용할 가변 길이 열 스토리지 공간 비율이 더 적을 것으로 예상되는 경우 해당 비율로 Max_Var_Key_Size 값을 조정하여 전체 테이블 크기를 보다 정확하게 예측할 수 있습니다.

    가변 길이 열이 없는 경우에는 Variable_Key_Size를 0으로 설정합니다.

  5. 인덱스 행 크기를 계산합니다.

    Index_Row_Size = Fixed_Key_Size + Variable_Key_Size + Index_Null_Bitmap + 1(인덱스 행의 행 머리글 오버헤드) + 6(자식 페이지 ID 포인터)

  6. 페이지당 인덱스 행 수를 계산합니다. 페이지당 사용 가능한 바이트 수는 8,096바이트입니다.

    Index_Rows_Per_Page = 8096 / (Index_Row_Size + 2)

    인덱스 행이 여러 페이지에 걸쳐 배치되지는 않으므로 페이지당 인덱스 행 수는 가장 근사한 정수 값으로 버림하여 계산해야 합니다. 수식에서 값 2는 페이지의 슬롯 배열에서 행의 입력을 위한 것입니다.

  7. 인덱스의 수준 수를 계산합니다.

    Non-leaf_Levels = 1 + log (Index_Rows_Per_Page) (Num_Leaf_Pages / Index_Rows_Per_Page)

    이 값을 가장 가까운 정수로 반올림합니다. 이 값은 클러스터형 인덱스의 리프 수준을 포함하지 않습니다.

  8. 인덱스의 리프가 아닌 페이지 수를 계산합니다.

    Num_Index_Pages = ∑Level (Num_Leaf_Pages / (Index_Rows_Per_Page^Level))

    여기서 1 <= Level <= Non-leaf_Levels

    각 피가수를 가장 근사한 정수로 올립니다. 간단한 예로 Num_Leaf_Pages = 1000 및 Index_Rows_Per_Page = 25인 인덱스를 고려합니다. 리프 수준 위 첫 번째 인덱스 수준에 인덱스 행이 1000개 저장되고 리프 페이지당 인덱스 행 1개씩, 각 페이지마다 인덱스 행 25개가 들어갈 수 있습니다. 즉, 1000개의 인덱스 행을 저장하려면 40페이지가 필요합니다. 인덱스의 다음 수준에서는 40개 행을 저장해야 하므로 즉, 2페이지가 필요합니다. 인덱스의 최종 수준에서는 2개 행을 저장해야 하므로 즉, 1페이지가 필요합니다. 이렇게 하면 리프가 아닌 인덱스 페이지가 43개 있습니다. 이전 수식에서 이러한 숫자를 사용하는 경우 결과는 다음과 같습니다.

    Non-leaf_Levels = 1 + log(25) (1000 / 25) = 3

    Num_Index_Pages = 1000/(25^3)+ 1000/(25^2) + 1000/(25^1) = 1 + 2 + 40 = 43(예에서 설명한 페이지 수)

  9. 인덱스 크기를 계산합니다. 페이지당 총 바이트 수는 8,192바이트입니다.

    Index_Space_Used = 8192 x Num_Index_Pages

3단계: 계산 값 합계

이전 두 단계에서 얻은 값의 합계:

클러스터형 인덱스 크기(바이트) = Leaf_Space_Used + Index_Space_used

이 계산에서는 다음을 고려하지 않습니다.

  • 분할

    분할의 공간 오버헤드는 최소화되지만 계산하기는 복잡합니다. 포함해야 하는 것은 중요하지 않습니다.

  • 할당 페이지

    힙에 할당된 페이지를 추적하는 데 사용되는 IAM 페이지가 하나 이상 있지만 공간 오버헤드는 최소화되며 사용되는 IAM 페이지 수를 정확하게 계산하는 알고리즘은 없습니다.

  • LOB(큰 개체) 값

    LOB 데이터 형식 varchar(max), varbinary(max), nvarchar(max), text, ntext, xml이미지 값을 저장하는 데 사용할 공간을 정확히 결정하는 알고리즘은 복잡합니다. 예상되는 LOB 값의 평균 크기를 추가하고 Num_Rows한 다음 총 클러스터형 인덱스 크기에 추가하면 됩니다.

  • 압축

    압축된 인덱스의 크기를 미리 계산할 수 없습니다.

  • 스파스 열

    스파스 열의 공간 요구 사항에 대한 자세한 내용은 스파스 열 사용을 참조 하세요.

다음 단계