估计非聚集索引的大小

可使用下列步骤估计存储非聚集索引所需的空间大小:

  1. 计算用于存储非聚集索引的非叶级中的索引信息的空间。
  2. 计算用于存储非聚集索引的叶级中的索引信息的空间。
  3. 对计算出的值求和。

步骤 1. 计算用于存储非叶级中的索引信息的空间

ms190620.note(zh-cn,SQL.90).gif重要提示:
保留在此步骤中使用的值,以便在步骤 2 中使用。

可使用下列步骤估计存储索引的较高级别所需的空间大小。

  1. 指定表中显示的行数:
    Num_Rows = 表中的行数
  2. 指定索引键中固定长度和可变长度列的数量,并计算存储所需的空间:
    索引键列可以包括固定长度和可变长度列。若要估计内部级别索引行的大小,请计算每组列在索引行中所占据的空间。列的大小取决于数据类型和长度规定。有关详细信息,请参阅数据类型(数据库引擎)
    Num_Key_Cols = 总键列数(固定长度和可变长度)
    Fixed_Key_Size = 所有固定长度键列的总字节大小
    Num_Variable_Key_Cols = 可变长度键列的数量
    Max_Var_Key_Size = 所有可变长度键列的最大字节大小
  3. 如果索引不是唯一的,对所需的数据行定位符说明如下:
    如果非聚集索引不是唯一的,数据行定位符将与非聚集索引键组合使用,以便为每一行生成唯一的键值。
    如果非聚集索引在堆上,则数据行定位符是堆 RID。其大小是 8 个字节。
    Num_Key_Cols = Num_Key_Cols + 1
    Num_Variable_Key_Cols = Num_Variable_Key_Cols + 1
    Max_Var_Key_Size = Max_Var_Key_Size + 8
    如果非聚集索引在聚集索引之上,则数据行定位符是聚集键。必须与非聚集索引键结合使用的列是聚集键中的以下列:不在非聚集索引键列集中的列。
    Num_Key_Cols = Num_Key_Cols + 不在非聚集索引键列集中的聚集键列数(如果聚集索引不唯一,则 + 1)
    Fixed_Key_Size = Fixed_Key_Size + 不在非聚集索引键列集中的固定长度聚集键列的总字节大小
    Num_Variable_Key_Cols = Num_Variable_Key_Cols + 不在非聚集索引键列集中的可变长度聚集键列数(如果聚集索引不唯一,则 + 1)
    Max_Var_Key_Size = Max_Var_Key_Size + 不在非聚集索引键列集中的可变长度聚集键列的最大字节大小(如果聚集索引不唯一,则 + 4)
  4. 可以保留行的一部分(称为“空位图”),以管理列的为空性。计算大小:
    如果索引键中有可为空的列(包括步骤 1.3 中所述的所有必要的聚集键列),则保留索引行的一部分,以用于空位图。
    Index_Null_Bitmap = 2 + ((可以为空的键列数 + 7) / 8)
    仅使用上述表达式中的整数部分,而放弃所有余数。
    如果没有可为空的键列,请将 Index_Null_Bitmap 设置为 0。
  5. 计算可变长度数据大小:
    如果索引键中有可变长度的列(包括所有必要的聚集索引键列),请确定存储索引行中的这些列需使用的空间:
    Variable_Key_Size* = 2 + (Num_Variable_Key_Cols x 2) + *Max_Var_Key_Size 此公式假设所有可变长度列均百分之百填充。如果预计可变长度列占用的存储空间比例较低,则可以按照该比例调整 Max_Var_Key_Size 值,从而对整个表大小得出一个更准确的估计。
    如果没有可变长度列,请将 Variable_Key_Size 设置为 0。
  6. 计算索引行大小:
    Index_Row_Size = Fixed_Key_Size + Variable_Key_Size + Index_Null_Bitmap + 1(对应于索引行的行标题开销)+ 6(对应于子页 ID 指针)
  7. 下一步,计算每页的索引行数(每页有 8096 个可用字节):
    Index_Rows_Per_Page = 8096 / (Index_Row_Size + 2)
    因为索引行不能跨页,所以每页的索引行数应向下舍入到最接近的整数。公式中的数值 2 是计算行数时引入的行大小余量。
  8. 计算索引中的级别数:
    Levels = 1 + log Index_Rows_Per_Page (Num_Rows / Index_Rows_Per_Page)
    请注意,此值不包括叶级非聚集索引。
  9. 计算索引中的页数:
    Num_Index_Pages = Level (Index_Rows_Per_Page)Level – 1
    其中,1 <= Level <= Levels
    作为一个简单示例,请考虑这样的索引:其中叶级以上的级别所需总索引行数是 1000,且每页可容纳 10 个索引行。这意味着存储这 1000 行需要 100 页。下一级索引必须存储 100 行。这意味着需要 10 页。最后一级索引必须存储 10 行。这意味着需要 1 页。使用这些以前的公式中的数字可得到下列结果:
    Height = 1 + log10 (1000 / 10) = 3
    Num_Index_Pages = (10)3-1 + (10)2-1 + (10)1-1 = 111,这是示例中所述的页数。
  10. 计算聚集索引的大小(每页总共有 8192 个字节):
    Index_Space_Used* = 8192 x *Num_Index_Pages

步骤 2. 计算用于存储叶级中的索引信息的空间

可使用下列步骤估计存储叶级索引所需的空间大小。需要使用从步骤 1 中保留的值来完成此步骤。

  1. 指定叶级的固定长度列和可变长度列的数量,并计算存储这些列所需的空间:
    ms190620.note(zh-cn,SQL.90).gif注意:
    SQL Server 2005 通过包括索引键列和非键列引入了扩展非聚集索引的功能。这些额外的列只存储在叶级非聚集索引。有关详细信息,请参阅创建带有包含性列的索引
    ms190620.note(zh-cn,SQL.90).gif注意:
    SQL Server 2005 引入了组合 varcharnvarcharvarbinarysql_variant 列的功能,这些列使定义的表的总宽度超过 8,060 字节。对于 varcharvarbinarysql_variant 中的每一列,其长度不能超过 8,000 字节,对于 nvarchar 列,不能超过 4,000 字节。但是,表中这些列的组合宽度可超过 8,060 字节。这也适用于具有包含性列的非聚集索引叶行。有关详细信息,请参阅行溢出数据超过 8 KB
    如果非聚集索引没有任何包含性列,则使用步骤 1 中的值(包括在步骤 1.3 中进行的任何修改):

Num_Leaf_Cols* = *Num_Key_Cols Fixed_Leaf_Size* = *Fixed_Key_Size Num_Variable_Leaf_Cols* = *Num_Variable_Key_Cols Max_Var_Leaf_Size* = *Max_Var_Key_Size 如果非聚集索引确实具有包含性列,则对步骤 1 中的值加上适当的值(包括在步骤 1.3 中进行的任何修改)。列的大小取决于数据类型和长度规定。有关详细信息,请参阅数据类型(数据库引擎)
Num_Leaf_Cols = Num_Key_Cols + 包含性列数
Fixed_Leaf_Size = Fixed_Key_Size + 固定长度包含性列的总字节大小
Num_Variable_Leaf_Cols = Num_Variable_Key_Cols + 可变长度包含性列的数量
Max_Var_Leaf_Size = Max_Var_Key_Size + 可变长度包含性列的最大字节大小
2. 数据行定位符说明:
如果非聚集索引不是唯一的,则已在步骤 1.3 中考虑了数据行定位符的开销且不需要进行其他的修改。转到下一步。
如果非聚集索引是唯一的,则必须在叶级的所有行中说明数据行定位符。
如果非聚集索引在堆上,则数据行定位符是堆 RID(大小为 8 字节)。
Num_Leaf_Cols = Num_Leaf_Cols + 1
Num_Variable_Leaf_Cols = Num_Variable_Leaf_Cols + 1
Max_Var_Leaf_Size = Max_Var_Leaf_Size + 8
如果非聚集索引在聚集索引之上,则数据行定位符是聚集键。必须与非聚集索引键结合使用的列是聚集键中的以下列:不在非聚集索引键列集中的列。
Num_Leaf_Cols = Num_Leaf_Cols + 不在非聚集索引键列集中的聚集键列数(如果聚集索引不唯一,则 + 1)
Fixed_Leaf_Size = Fixed_Leaf_Size + 不在非聚集索引键列集中的固定长度聚集键列数
Num_Variable_Leaf_Cols = Num_Variable_Leaf_Cols + 不在非聚集索引键列集中的可变长度聚集键列数(如果聚集索引不唯一,则 + 1)
Max_Var_Leaf_Size = Max_Var_Leaf_Size + 不在非聚集索引键列集中的可变长度聚集键列的字节大小(如果聚集索引不唯一,则 + 4)
3. 计算空位图大小:
Leaf_Null_Bitmap = 2 + ((Num_Leaf_Cols + 7) / 8)
仅使用上述表达式中的整数部分,而放弃所有余数。
4. 计算可变长度数据大小:
如果索引键中有可变长度的列(包括在以前的步骤 2.2 中所述的所有必要的聚集索引键列),请确定存储索引行中的这些列需使用的空间:
Variable_Leaf_Size* = 2 + (Num_Variable_Leaf_Cols x 2) + *Max_Var_Leaf_Size 此公式假定所有可变长度列均百分之百填充。如果预计可变长度列占用的存储空间比例较低,则可以按照该比例调整 Max_Var_Leaf_Size 值,从而对整个表大小得出一个更准确的估计。
如果没有可变长度的列,则将 Variable_Key_Size 设置为 0。
5. 计算索引行大小:
Index_Row_Size = Fixed_Key_Size + Variable_Key_Size + Index_Null_Bitmap + 1(对应于索引行的行标题开销)+ 6(对应于子页 ID 指针)
6. 下一步,计算每页的索引行数(每页有 8096 个可用字节):
Leaf_Rows_Per_Page = 8096 / (Leaf_Row_Size + 2)
因为索引行不能跨页,所以每页的索引行数应向下舍入到最接近的整数。公式中的数值 2 是计算行数时引入的行大小余量。
7. 根据指定的填充因子计算每页保留的空行数:
Free_Rows_Per_Page = 8096 x ((100 - Fill_Factor) / 100) / (Leaf_Row_Size + 2)
计算中使用的填充因子为整数值,而不是百分比。因为行不跨页,所以每页的行数应向下舍入到最接近的整数。填充因子增大时,每页将存储更多的数据,因此页数将减少。公式中的数值 2 是计算行数时引入的行大小余量。
8. 计算存储所有行所需的页数:
Num_Leaf_Pages = Num_Rows / (Leaf_Rows_Per_Page - Free_Rows_Per_Page)
估计的页数应向上舍入到最接近的整数。
9. 计算索引的大小(每页总共有 8192 个字节):
Leaf_Space_Used* = 8192 x *Num_Leaf_Pages

步骤 3. 对计算出的值求和

对从前面两个步骤中得到的值求和:

Nonclustered index size (bytes) = Leaf_Space_Used + Index_Space_used

此计算不考虑以下因素:

  • 分区
    分区的空间开销很小,但是计算复杂。是否包括它并不重要。
  • 分配页
    至少有一个 IAM 页用于跟踪为堆分配的页,但是空间开销很小,并且没有算法可以精确地计算出要使用的 IAM 页数。
  • 大型对象 (LOB) 值
    精确确定存储 LOB 数据类型 varchar(max)varbinary(max)nvarchar(max)textntextxmlimage 值所用的空间量的算法非常复杂。只需加上期望的 LOB 值的平均大小,再乘以 Num_Rows,然后将所得结果加到非聚集索引的总大小。

请参阅

概念

聚集索引设计指南
创建索引(数据库引擎)
非聚集索引设计指南
估计表大小
估计聚集索引的大小
估计堆的大小

其他资源

估计数据库的大小

帮助和信息

获取 SQL Server 2005 帮助