CREATE STATISTICS(Transact-SQL)

적용 대상: Microsoft Fabric의 Microsoft FabricWarehouse에 있는 SQL ServerAzure SQL DatabaseAzure SQL Managed InstanceAzure Synapse AnalyticsSQL 분석 엔드포인트

하나 이상의 테이블 열, 인덱싱된 뷰 또는 외부 테이블에 대한 쿼리 최적화 통계를 만듭니다. 쿼리 최적화 프로그램은 대부분의 쿼리에 대해 고품질의 쿼리 계획에 필요한 통계를 기본적으로 생성합니다. 따라서 쿼리 성능을 향상시키기 위해 CREATE STATISTICS를 사용하여 추가 통계를 만들거나 쿼리 설계를 수정해야 하는 경우는 드뭅니다.

자세한 내용은 통계를 참조하세요.

참고 항목

Microsoft Fabric의 통계에 대한 자세한 내용은 Microsoft Fabric의 통계를 참조하세요.

Transact-SQL 구문 표기 규칙

Syntax

-- Syntax for SQL Server and Azure SQL Database
-- Create statistics on an external table

CREATE STATISTICS statistics_name
ON { table_or_indexed_view_name } ( column [ ,...n ] )
    [ WITH FULLSCAN ] ;
  
-- Create statistics on a regular table or indexed view
CREATE STATISTICS statistics_name
ON { table_or_indexed_view_name } ( column [ ,...n ] )
    [ WHERE <filter_predicate> ]
    [ WITH
        [ [ FULLSCAN
            [ [ , ] PERSIST_SAMPLE_PERCENT = { ON | OFF } ]
          | SAMPLE number { PERCENT | ROWS }
            [ [ , ] PERSIST_SAMPLE_PERCENT = { ON | OFF } ]
          | <update_stats_stream_option> [ ,...n ]
        [ [ , ] NORECOMPUTE ]
        [ [ , ] INCREMENTAL = { ON | OFF } ]
        [ [ , ] MAXDOP = max_degree_of_parallelism ]
        [ [ , ] AUTO_DROP = { ON | OFF } ]
    ] ;
  
<filter_predicate> ::=
    <conjunct> [AND <conjunct>]
  
<conjunct> ::=
    <disjunct> | <comparison>
  
<disjunct> ::=
        column_name IN (constant ,...)
  
<comparison> ::=
        column_name <comparison_op> constant
  
<comparison_op> ::=
    IS | IS NOT | = | <> | != | > | >= | !> | < | <= | !<
    
<update_stats_stream_option> ::=
    [ STATS_STREAM = stats_stream ]
    [ ROWCOUNT = numeric_constant ]
    [ PAGECOUNT = numeric_contant ]
-- Syntax for Azure Synapse Analytics and Parallel Data Warehouse 
  
CREATE STATISTICS statistics_name
    ON { database_name.schema_name.table_name | schema_name.table_name | table_name }
    ( column_name  [ ,...n ] )
    [ WHERE <filter_predicate> ]
    [ WITH {
           FULLSCAN
           | SAMPLE number PERCENT
      }
    ]
[;]
  
<filter_predicate> ::=
    <conjunct> [AND <conjunct>]
  
<conjunct> ::=
    <disjunct> | <comparison>
  
<disjunct> ::=
        column_name IN (constant ,...)
  
<comparison> ::=
        column_name <comparison_op> constant
  
<comparison_op> ::=
    IS | IS NOT | = | <> | != | > | >= | !> | < | <= | !<
-- Syntax for Microsoft Fabric
CREATE STATISTICS statistics_name
    ON { database_name.schema_name.table_name | schema_name.table_name | table_name }
    ( column_name )
    [ WITH {
           FULLSCAN
           | SAMPLE number PERCENT
      }
    ]
[;]

참고 항목

SQL Server 2014(12.x) 및 이전 버전에 대한 Transact-SQL 구문을 보려면 이전 버전 설명서를 참조 하세요.

인수

statistics_name

만들 통계의 이름입니다.

table_or_indexed_view_name

통계를 만드는 대상이 되는 테이블, 인덱싱된 뷰 또는 외부 테이블의 이름입니다. 다른 데이터베이스에 대한 통계를 만들려면 정규화된 테이블 이름을 지정합니다.

column [ ,...n]

통계에 포함할 하나 이상의 열입니다. 열의 우선 순위는 왼쪽에서 오른쪽이어야 합니다. 히스토그램을 만드는 데에는 첫 번째 열만이 사용됩니다. 모든 열은 밀도라는 열간 상관 관계 통계에 사용됩니다.

다음 예외 사항을 제외하고 인덱스 키 열로 지정할 수 있는 모든 열을 지정할 수 있습니다.

  • XML, 전체 텍스트 및 파일 스트림 열은 지정할 수 없습니다.

  • ARITHABORT 및 QUOTED_IDENTIFIER 데이터베이스 설정이 ON으로 설정된 경우에만 계산 열을 지정할 수 있습니다.

  • CLR 사용자 정의 형식 열은 이진 순서 정렬이 지원될 경우에만 지정할 수 있습니다. 사용자 정의 형식 열의 메서드 호출로 정의된 계산 열은 메서드가 결정적 메서드로 표시된 경우에 지정할 수 있습니다.

WHERE <filter_predicate>

통계 개체를 만들 때 포함할 행 하위 집합을 선택하는 식을 지정합니다. 필터 조건자를 사용하여 만든 통계를 필터링된 통계라고 합니다. 필터 조건자는 간단한 비교 논리를 사용하며 계산 열, UDT 열, 공간 데이터 형식 열 또는 hierarchyID 데이터 형식 열을 참조할 수 없습니다. 비교 연산자에는 NULL 리터럴을 사용한 비교를 사용할 수 없습니다. 대신 IS NULL 및 IS NOT NULL 연산자를 사용합니다.

다음은 Production.BillOfMaterials 테이블에 대한 필터 조건자의 몇 가지 예입니다.

  • WHERE StartDate > '20000101' AND EndDate <= '20000630'
  • WHERE ComponentID IN (533, 324, 753)
  • WHERE StartDate IN ('20000404', '20000905') AND EndDate IS NOT NULL

필터 조건자에 대한 자세한 내용은 필터링된 인덱스 만들기를 참조하세요.

FULLSCAN

적용 대상: SQL Server 2016(13.x)(SQL Server 2016(13.x) SP1 CU4부터) 이상(SQL Server 2017(14.x) CU1부터)

모든 행을 검사하여 통계를 컴퓨팅합니다. FULLSCAN과 SAMPLE 100 PERCENT의 결과는 같습니다. FULLSCAN은 SAMPLE 옵션과 함께 사용할 수 없습니다.

생략하면 SQL Server는 샘플링을 사용하여 통계를 만들고 고품질 쿼리 계획을 만드는 데 필요한 샘플 크기를 결정합니다.

Microsoft Fabric의 Warehouse에서는 단일 열 FULLSCAN 및 단일 열 SAMPLE 기반 통계만 지원됩니다. 옵션이 포함되지 않으면 FULLSCAN 통계가 생성됩니다.

SAMPLE number { PERCENT | ROWS }

쿼리 최적화 프로그램에서 통계를 만들 때 사용할 테이블이나 인덱싱된 뷰에 있는 행의 비율이나 개수를 대략적으로 지정합니다. PERCENT의 경우 number가 0부터 100까지일 수 있고, ROWS의 경우 number가 0부터 총 행 수까지일 수 있습니다. 쿼리 최적화 프로그램에서 샘플링하는 실제 행의 비율이나 개수는 지정된 비율이나 개수와 일치하지 않을 수 있습니다. 예를 들어, 쿼리 최적화 프로그램에서는 데이터 페이지의 모든 행을 검색합니다.

SAMPLE은 기본 샘플링을 기반으로 하는 쿼리 계획이 만족스럽지 못한 특별한 경우에 유용합니다. 대부분의 경우 쿼리 최적화 프로그램은 기본적으로 고품질의 쿼리 계획을 만들기 위해 필요에 따라 샘플링을 사용하고 통계적으로 중요한 샘플 크기를 결정하기 때문에 SAMPLE을 지정할 필요가 없습니다.

SAMPLE은 FULLSCAN 옵션과 함께 사용할 수 없습니다. SAMPLE과 FULLSCAN을 둘 다 지정하지 않으면 기본적으로 쿼리 최적화 프로그램에서 샘플링된 데이터를 사용하고 샘플 크기를 계산합니다.

0 PERCENT 또는 0 ROWS로 지정하지 않는 것이 좋습니다. 0 PERCENT 또는 0 ROWS로 지정하면 통계 데이터가 포함되지 않은 빈 통계 개체가 만들어집니다.

Microsoft Fabric의 Warehouse에서는 단일 열 FULLSCAN 및 단일 열 SAMPLE 기반 통계만 지원됩니다. 옵션이 포함되지 않으면 FULLSCAN 통계가 생성됩니다.

PERSIST_SAMPLE_PERCENT = { ON | OFF }

ON인 경우 통계는 샘플링 비율을 명시적으로 지정하지 않는 후속 업데이트에 대한 생성 샘플링 비율을 유지합니다. OFF인 경우 통계 샘플링 백분율은 샘플링 비율을 명시적으로 지정하지 않는 후속 업데이트에서 기본 샘플링으로 다시 설정됩니다. 기본값은 OFF입니다.

참고

테이블이 잘린 경우 잘린 HoBT에서 작성된 모든 통계가 기본 샘플링 비율을 사용하도록 되돌아갑니다.

STATS_STREAM *=***stats_stream

정보를 제공하기 위해서만 확인됩니다. 지원 안 됨 향후 호환성은 보장되지 않습니다.

NORECOMPUTE

statistics_name에 대해 자동 통계 업데이트 옵션인 AUTO_STATISTICS_UPDATE를 비활성화합니다. 이 옵션을 지정하면 쿼리 최적화 프로그램에서 statistics_name에 대해 진행 중인 모든 통계 업데이트를 완료하고 이후의 업데이트를 비활성화합니다.

통계 업데이트를 다시 활성화하려면 DROP STATISTICS를 사용하여 통계를 제거한 다음, NORECOMPUTE 옵션 없이 CREATE STATISTICS를 실행합니다.

경고

이 옵션을 사용하면 최적이 아닌 쿼리 계획이 생성될 수 있습니다. 이 옵션은 자격 있는 시스템 관리자가 꼭 필요한 경우에만 사용하는 것이 좋습니다.

AUTO_STATISTICS_UPDATE 옵션에 대한 자세한 내용은 ALTER DATABASE SET 옵션(Transact-SQL)을 참조하세요. 통계 업데이트를 비활성화하고 다시 활성화하는 방법은 통계를 참조하세요.

INCREMENTAL = {ON | OFF}

적용 대상: SQL Server 2014(12.x) 이상

ON으로 설정된 경우 파티션 통계별로 통계가 작성됩니다. OFF로 설정된 경우 통계는 모든 파티션에 대해 결합됩니다. 기본값은 OFF입니다.

파티션별 통계가 지원되지 않으면 오류가 생성됩니다. 다음 통계 유형에 대해서는 증분 통계가 지원되지 않습니다.

  • 기본 테이블을 기준으로 파티션 정렬되지 않은 인덱스를 사용하여 작성된 통계입니다.
  • Always On 읽기 가능한 보조 데이터베이스에 대해 작성된 통계입니다.
  • 읽기 전용 데이터베이스에 대해 작성된 통계입니다.
  • 필터링된 인덱스에 대해 작성된 통계입니다.
  • 뷰에 대해 작성된 통계입니다.
  • 내부 테이블에 대해 작성된 통계입니다.
  • 공간 인덱스 또는 XML 인덱스를 사용하여 작성된 통계입니다.

MAXDOP = max_degree_of_parallelism

적용 대상: SQL Server (SQL Server 2016(13.x) SP2 및 SQL Server 2017(14.x) CU3부터 시작).

통계 작업 기간 동안 최대 병렬 처리 수준 구성 옵션을 재정의합니다. 자세한 내용은 max degree of parallelism 서버 구성 옵션 구성을 참조하세요. MAXDOP를 사용하여 병렬 계획 실행에 사용되는 프로세서 수를 제한할 수 있습니다. 최대값은 64개입니다.

max_degree_of_parallelism은 다음 중 하나일 수 있습니다.

1
병렬 계획이 생성되지 않습니다.

>1
병렬 통계 작업에 사용되는 최대 프로세서 수를 현재 시스템 워크로드에 따라 지정된 수 또는 더 적은 수로 제한합니다.

0(기본값)
현재 시스템 작업에 따라 실제 프로세서 수 이하의 프로세서를 사용합니다.

update_stats_stream_option

정보를 제공하기 위해서만 확인됩니다. 지원 안 됨 향후 호환성은 보장되지 않습니다.

AUTO_DROP = { ON | OFF }

적용 대상: Azure SQL Database, Azure SQL Managed Instance, SQL Server 2022(16.x)부터 시작

SQL Server 2022(16.x) 이전, 현재 고객 데이터베이스에서 사용자 타사 도구로 통계를 수동으로 만드는 경우 이러한 통계 개체는 고객이 원하는 스키마 변경을 차단하거나 방해할 수 있습니다.

SQL Server 2022(16.x)부터 AUTO_DROP 옵션은 기본적으로 모든 새 데이터베이스 및 마이그레이션된 데이터베이스에서 사용하도록 설정됩니다. AUTO_DROP 속성을 사용하면 통계 개체에 의해 후속 스키마 변경 이 차단되지 않고 필요에 따라 통계가 삭제되도록 모드에서 통계 개체를 만들 수 있습니다. 이러한 방식으로 AUTO_DROP을 사용하도록 설정된 수동으로 만든 통계는 자동 생성된 통계처럼 동작합니다.

참고

자동 생성된 통계에서 Auto_Drop 속성을 설정하거나 설정 해제하려고 하면 오류가 발생할 수 있습니다. 자동 생성된 통계는 항상 자동 삭제를 사용합니다. 복원된 일부 백업은 다음에 통계 개체가 업데이트될 때까지(수동 또는 자동) 이 속성이 잘못 설정될 수 있습니다. 그러나 자동 생성 통계는 항상 자동 삭제 통계처럼 동작합니다. 이전 버전에서 SQL Server 2022(16.x)로 데이터베이스를 복원하는 경우 데이터베이스에서 sp_updatestats를 실행하여 통계 AUTO_DROP 기능에 대한 적절한 메타데이터를 설정하는 것이 좋습니다.

자세한 내용은 AUTO_DROP 옵션을 참조하세요.

사용 권한

다음 중 한 가지 권한이 필요합니다.

  • ALTER TABLE
  • 사용자가 테이블 소유자
  • db_ddladmin 고정 데이터베이스 역할의 멤버 자격

설명

SQL Server는 통계를 만들기 전에 tempdb를 사용하여 샘플링된 행을 정렬합니다.

외부 테이블에 대한 통계

외부 테이블 통계를 만들 때 SQL Server는 외부 테이블을 임시 SQL Server 테이블로 가져온 다음, 통계를 만듭니다. 샘플 통계의 경우 샘플링된 행만 가져옵니다. 외부 테이블이 큰 경우 전체 검사 옵션 대신 기본 샘플링을 사용하는 것이 더 빠릅니다.

외부 테이블이 데이터 형식으로 사용하거나 DELTA 데이터 형식으로 사용하는 PARQUETCSVDELIMITEDTEXT경우 외부 테이블은 명령당 CREATE STATISTICS 하나의 열에 대한 통계만 지원합니다.

필터링된 조건을 적용한 통계

필터링된 통계는 잘 정의된 데이터의 하위 집합에서 선택하는 쿼리에 대한 쿼리 성능을 높일 수 있습니다. WHERE 절의 필터 조건자를 사용하여 통계에 포함되는 데이터의 하위 집합을 선택합니다.

CREATE STATISTICS를 사용하는 경우

CREATE STATISTICS를 사용하는 경우에 대한 자세한 내용은 통계를 참조하세요.

필터링된 통계의 종속성 참조

sys.sql_expression_dependencies 카탈로그 뷰에서는 필터링된 통계 조건자의 각 열을 참조 종속성으로 추적합니다. 필터링된 통계 조건자에서 정의된 테이블 열은 삭제, 이름 바꾸기 또는 정의 변경을 수행할 수 없으므로 필터링된 통계를 만들기 전에 테이블 열에서 수행하는 작업을 고려하세요.

제한 사항

  • 외부 테이블에 대해서는 통계 업데이트가 지원되지 않습니다. 외부 테이블에 대한 통계를 업데이트하려면 통계를 삭제하고 다시 만듭니다.
  • 정적 개체당 최대 64개의 열을 나열할 수 있습니다.
  • MAXDOP 옵션은 STATS_STREAM, ROWCOUNT 및 PAGECOUNT 옵션과 호환되지 않습니다.
  • MAXDOP 옵션은 Resource Governor 워크로드 그룹 MAX_DOP 설정으로 제한됩니다(사용된 경우).
  • 외부 테이블에 대한 CREATE 및 DROP STATISTICS는 Azure SQL Database에서 지원되지 않습니다.

예제

예제에서는 AdventureWorks 데이터베이스를 사용합니다.

A. CREATE STATISTICS에 SAMPLE number PERCENT 사용

다음 예제에서는 AdventureWorks2022 데이터베이스 테이블의 5% BusinessEntityIDEmailPromotion 열에 Person 대한 무작위 샘플을 사용하여 통계를 만듭니다ContactMail1.

CREATE STATISTICS ContactMail1
    ON Person.Person (BusinessEntityID, EmailPromotion)
    WITH SAMPLE 5 PERCENT;

B. CREATE STATISTICS에 FULLSCAN 및 NORECOMPUTE 사용

다음 예에서는 NamePurchase 테이블의 BusinessEntityIDEmailPromotion 열에서 모든 행에 대한 Person 통계를 만듭니다. 통계의 자동 다시 계산 기능은 사용하지 않습니다.

CREATE STATISTICS NamePurchase
    ON AdventureWorks2022.Person.Person (BusinessEntityID, EmailPromotion)
    WITH FULLSCAN, NORECOMPUTE;

C. CREATE STATISTICS를 사용하여 필터링된 통계 만들기

다음 예에서는 필터링된 통계 ContactPromotion1을 만듭니다. 데이터베이스 엔진은 데이터의 50%를 샘플링한 다음, EmailPromotion이 2인 행을 선택합니다.

CREATE STATISTICS ContactPromotion1
    ON Person.Person (BusinessEntityID, LastName, EmailPromotion)
WHERE EmailPromotion = 2
WITH SAMPLE 50 PERCENT;
GO

D. 외부 테이블에 대한 통계 만들기

열 목록을 제공하는 것을 제외하고, 외부 테이블에 대한 통계를 만들 때 내려야 하는 유일한 결정은 통계를 만드는 방법이 행 샘플링인지 아니면 모든 행 검사인가 하는 것입니다. 외부 테이블에 대한 CREATE 및 DROP STATISTICS는 Azure SQL Database에서 지원되지 않습니다.

SQL Server는 통계를 만들기 위해 외부 테이블의 데이터를 임시 테이블로 가져오기 때문에 전체 검사 옵션이 훨씬 더 오래 걸립니다. 큰 테이블의 경우 일반적으로 기본 샘플링 방법으로 충분합니다.

--Create statistics on an external table and use default sampling.
CREATE STATISTICS CustomerStats1 ON DimCustomer (CustomerKey, EmailAddress);
  
--Create statistics on an external table and scan all the rows
CREATE STATISTICS CustomerStats1 ON DimCustomer (CustomerKey, EmailAddress) WITH FULLSCAN;

E. FULLSCAN 및 PERSIST_SAMPLE_PERCENT와 함께 CREATE STATISTICS 사용

다음 예제에서는 Person 테이블의 BusinessEntityIDEmailPromotion 열에 있는 모든 행에 대한 NamePurchase 통계를 만들고 샘플링 비율을 명시적으로 지정하지 않은 모든 이후 업데이트에 대해 100% 샘플링 비율을 설정합니다.

CREATE STATISTICS NamePurchase
    ON AdventureWorks2022.Person.Person (BusinessEntityID, EmailPromotion)
    WITH FULLSCAN, PERSIST_SAMPLE_PERCENT = ON;

AdventureWorksDW 데이터베이스를 사용하는 예제

F. 두 열에 대한 통계 만들기

다음 예제에서는 DimCustomer 테이블의 CustomerKeyEmailAddress 열을 기반으로 CustomerStats1 통계를 만듭니다. 통계는 Customer 테이블에 있는 행의 통계적으로 의미 있는 샘플링을 기반으로 작성됩니다.

CREATE STATISTICS CustomerStats1 ON DimCustomer (CustomerKey, EmailAddress);

G. 전체 검사를 사용하여 통계 만들기

다음 예제에서는 DimCustomer 테이블의 모든 행 검사를 기반으로 CustomerStatsFullScan 통계를 만듭니다.

CREATE STATISTICS CustomerStatsFullScan
ON DimCustomer (CustomerKey, EmailAddress) WITH FULLSCAN;

H. 샘플 비율을 지정하여 통계 만들기

다음 예제에서는 DimCustomer 테이블 행의 50% 검사를 기반으로 CustomerStatsSampleScan 통계를 만듭니다.

CREATE STATISTICS CustomerStatsSampleScan
ON DimCustomer (CustomerKey, EmailAddress) WITH SAMPLE 50 PERCENT;

9\. CREATE STATISTICS를 AUTO_DROP과 함께 사용

자동 삭제 통계를 사용하려면 통계 만들기 또는 업데이트의 “WITH” 절에 다음을 추가하기만 하면 됩니다.

CREATE STATISTICS CustomerStats1 ON DimCustomer (CustomerKey, EmailAddress) WITH AUTO_DROP = ON

기존 통계에 대한 자동 삭제 설정을 평가하려면 sys.statsauto_drop 열을 사용합니다.

SELECT object_id, [name], auto_drop
FROM sys.stats;

다음 단계