高级查询优化概念

Microsoft SQL Server 使用内存中的排序和哈希联接技术执行排序、交集、并集、差分等操作。SQL Server 利用这种类型的查询计划支持垂直表分区(有时称为分列存储)。

SQL Server 使用三种类型的联接操作:

  • Nested Loops 联接

  • 合并联接

  • 哈希联接

如果一个联接输入很小(不到 10 行),而另一个联接输入很大而且已在其联接列上创建了索引,则索引 Nested Loops 连接是最快的联接操作,因为它们需要的 I/O 和比较都最少。有关 Nested Loops 的详细信息,请参阅了解嵌套循环联接

如果两个联接输入并不小但已在二者联接列上排序(例如,如果它们是通过扫描已排序的索引获得的),则合并联接是最快的联接操作。如果两个联接输入都很大,而且这两个输入的大小差不多,则预先排序的合并联接提供的性能与哈希联接相近。但是,如果这两个输入的大小相差很大,则哈希联接操作通常快得多。有关详细信息,请参阅了解合并联接

哈希联接可以有效处理未排序的大型非索引输入。它们对复杂查询的中间结果很有用,因为:

  • 中间结果未经索引(除非已经显式保存到磁盘上然后创建索引),而且通常不为查询计划中的下一个操作进行适当的排序。

  • 查询优化器只估计中间结果的大小。由于对于复杂查询,估计可能有很大的误差,因此如果中间结果比预期的大得多,则处理中间结果的算法不仅必须有效而且必须适度弱化。

哈希联接可以减少使用非规范化。非规范化一般通过减少联接操作获得更好的性能,尽管这样做有冗余之险(如不一致的更新)。哈希联接则减少使用非规范化的需要。哈希联接使垂直分区(用单独的文件或索引代表单个表中的几组列)得以成为物理数据库设计的可行选项。有关详细信息,请参阅了解哈希联接