Appendice A: Monitorare l'integrità di SQL Server

Aggiornato: 2009-04-30

In Microsoft SQL Server 2005 sono disponibili alcuni strumenti per il monitoraggio dei database, tra cui le viste a gestione dinamica. Le viste a gestione dinamica (DMV, Dynamic Management View) e le funzioni a gestione dinamica (DMF, Dynamic Management Function) restituiscono informazioni sullo stato del server che possono essere utilizzate per monitorare lo stato dell'istanza di un server, diagnosticare problemi e regolare le prestazioni.

Vengono elencati di seguito alcuni degli oggetti generali a gestione dinamica dei server:

  • dm_db_*: database e oggetti di database

  • dm_exec_*: esecuzione di codice utente e connessioni associate

  • dm_os_*: memoria, blocco e pianificazione

  • dm_tran_*: transazioni e isolamento

  • dm_io_*: input/output su reti e dischi

In questa sezione vengono descritte alcune delle query di utilizzo più comune eseguite su queste viste e funzioni a gestione dinamica per monitorare l'integrità di SQL Server.

Query di esempio

È possibile eseguire la query seguente per ottenere tutti i nomi DMV e DMF:

SELECT * FROM sys.system_objects
WHERE name LIKE 'dm_%'
ORDER BY name

Monitoraggio dei colli di bottiglia della CPU

Un collo di bottiglia della CPU spesso è causato da un piano di query non ottimale, da una configurazione non appropriata, da fattori di progettazione inadeguati o da risorse hardware insufficienti. Vengono riportate di seguito alcune query comuni che consentono di individuare la causa di un collo di bottiglia della CPU.

Con la query seguente è possibile ottenere una visualizzazione di livello superiore dei batch o delle stored procedure attualmente memorizzate nella cache che consumano una quantità elevata di CPU.

SELECT TOP 50 
      SUM(qs.total_worker_time) AS total_cpu_time, 
      SUM(qs.execution_count) AS total_execution_count,
      COUNT(*) AS  number_of_statements, 
      qs.sql_handle 
FROM sys.dm_exec_query_stats AS qs
GROUP BY qs.sql_handle
ORDER BY SUM(qs.total_worker_time) DESC

La query seguente consente di visualizzare l'utilizzo della CPU di aggregazione da parte di piani memorizzati nella cache con testo SQL.

SELECT 
      total_cpu_time, 
      total_execution_count,
      number_of_statements,
      s2.text
      --(SELECT SUBSTRING(s2.text, statement_start_offset / 2, ((CASE WHEN statement_end_offset = -1 THEN (LEN(CONVERT(NVARCHAR(MAX), s2.text)) * 2) ELSE statement_end_offset END) - statement_start_offset) / 2) ) AS query_text
FROM 
      (SELECT TOP 50 
            SUM(qs.total_worker_time) AS total_cpu_time, 
            SUM(qs.execution_count) AS total_execution_count,
            COUNT(*) AS  number_of_statements, 
            qs.sql_handle --,
            --MIN(statement_start_offset) AS statement_start_offset, 
            --MAX(statement_end_offset) AS statement_end_offset
      FROM 
            sys.dm_exec_query_stats AS qs
      GROUP BY qs.sql_handle
      ORDER BY SUM(qs.total_worker_time) DESC) AS stats
      CROSS APPLY sys.dm_exec_sql_text(stats.sql_handle) AS s2 

La query seguente consente di visualizzare le prime 50 istruzioni SQL con un consumo medio di CPU elevato.

SELECT TOP 50
total_worker_time/execution_count AS [Avg CPU Time],
(SELECT SUBSTRING(text,statement_start_offset/2,(CASE WHEN statement_end_offset = -1 then LEN(CONVERT(nvarchar(max), text)) * 2 ELSE statement_end_offset end -statement_start_offset)/2) FROM sys.dm_exec_sql_text(sql_handle)) AS query_text, *
FROM sys.dm_exec_query_stats 
ORDER BY [Avg CPU Time] DESC

Di seguito vengono riportate query DMV che consentono di individuare compilazioni/ricompilazioni eccessive.

select * from sys.dm_exec_query_optimizer_info
where 
      counter = 'optimizations'
      or counter = 'elapsed time'

La query di esempio seguente restituisce le prime 25 stored procedure che sono state ricompilate. Il valore plan_generation_num indica il numero di ricompilazioni eseguite dalla query.

select top 25
      sql_text.text,
      sql_handle,
      plan_generation_num,
      execution_count,
      dbid,
      objectid 
from sys.dm_exec_query_stats a
      cross apply sys.dm_exec_sql_text(sql_handle) as sql_text
where plan_generation_num > 1
order by plan_generation_num desc

Un piano di query insufficiente può comportare un maggiore consumo della CPU.

Con la query seguente viene mostrata quale query utilizza la CPU più cumulativa.

SELECT 
    highest_cpu_queries.plan_handle, 
    highest_cpu_queries.total_worker_time,
    q.dbid,
    q.objectid,
    q.number,
    q.encrypted,
    q.[text]
from 
    (select top 50 
        qs.plan_handle, 
        qs.total_worker_time
    from 
        sys.dm_exec_query_stats qs
    order by qs.total_worker_time desc) as highest_cpu_queries
    cross apply sys.dm_exec_sql_text(plan_handle) as q
order by highest_cpu_queries.total_worker_time desc

Nella query seguente vengono mostrati alcuni operatori che consumano molta CPU, ad esempio '%Hash Match%', '%Sort%' per ricercare i sospetti.

select *
from 
      sys.dm_exec_cached_plans
      cross apply sys.dm_exec_query_plan(plan_handle)
where 
      cast(query_plan as nvarchar(max)) like '%Sort%'
      or cast(query_plan as nvarchar(max)) like '%Hash Match%'

Se sono stati rilevati piani di query insufficienti che comportano un elevato consumo della CPU, eseguire UPDATE STATISTICS sulle tabelle coinvolte nella query e controllare se il problema persiste. Raccogliere quindi i dati e segnalare il problema al supporto tecnico di PerformancePoint Planning.

Un numero eccessivo di compilazioni e ricompilazioni nel sistema può comportare un problema di prestazioni associato alla CPU.

Per individuare compilazioni/ricompilazioni eccessive, è possibile eseguire le query DMV seguenti.

select * from sys.dm_exec_query_optimizer_info
where 
counter = 'optimizations'
or counter = 'elapsed time'

La query di esempio seguente restituisce le prime 25 stored procedure che sono state ricompilate. Il valore plan_generation_num indica il numero di ricompilazioni eseguite dalla query.

select top 25
sql_text.text,
sql_handle,
plan_generation_num,
execution_count,
dbid,
objectid 
from sys.dm_exec_query_stats a
cross apply sys.dm_exec_sql_text(sql_handle) as sql_text
where plan_generation_num > 1
order by plan_generation_num desc

Se è stato rilevato un numero eccessivo di compilazioni o ricompilazioni, raccogliere tutti i dati possibili e segnalarli al supporto tecnico di Planning.

Colli di bottiglia della memoria

Prima di avviare le operazioni di rilevamento e indagine sull'utilizzo della memoria, verificare di aver abilitato le opzioni avanzate in SQL Server. Eseguire la query seguente nel database master per attivare innanzitutto questa opzione.

sp_configure 'show advanced options'
go
sp_configure 'show advanced options', 1
go
reconfigure
go

Eseguire la query seguente per controllare le opzioni di configurazione relative alla memoria.

sp_configure 'awe_enabled'
go
sp_configure 'min server memory'
go
sp_configure 'max server memory'
go
sp_configure 'min memory per query'
go
sp_configure 'query wait'
go

Eseguire la query DMV seguente per visualizzare le informazioni relative alla CPU, alla memoria dell'utilità di pianificazione e al pool di buffer.

select 
cpu_count,
hyperthread_ratio,
scheduler_count,
physical_memory_in_bytes / 1024 / 1024 as physical_memory_mb,
virtual_memory_in_bytes / 1024 / 1024 as virtual_memory_mb,
bpool_committed * 8 / 1024 as bpool_committed_mb,
bpool_commit_target * 8 / 1024 as bpool_target_mb,
bpool_visible * 8 / 1024 as bpool_visible_mb
from sys.dm_os_sys_info

Colli di bottiglia di I/O

Individuare i colli di bottiglia di I/O esaminando le attese latch. Eseguire la query DMV seguente per ottenere le statistiche relative alle attese latch di I/O.

select wait_type, waiting_tasks_count, wait_time_ms, signal_wait_time_ms, wait_time_ms / waiting_tasks_count
from sys.dm_os_wait_stats  
where wait_type like 'PAGEIOLATCH%'  and waiting_tasks_count > 0
order by wait_type

Esiste un problema di I/O se i valori waiting_task_counts e wait_time_ms cambiano in modo significativo rispetto alla normalità. È importante ottenere una linea di base di contatori delle prestazioni e output di query DMV chiave quando SQL Server viene eseguito senza problemi.

Questi valori wait_types possono indicare se nel sottosistema di I/O si verifica un collo di bottiglia.

Utilizzare la query DMV seguente per individuare le richieste di I/O attualmente in sospeso. Eseguire questa query periodicamente per controllare lo stato del sottosistema di I/O e isolare il disco o i dischi fisici coinvolti nei colli di bottiglia di I/O.

select 
    database_id, 
    file_id, 
    io_stall,
    io_pending_ms_ticks,
    scheduler_address 
from  sys.dm_io_virtual_file_stats(NULL, NULL)t1,
        sys.dm_io_pending_io_requests as t2
where t1.file_handle = t2.io_handle

La query in genere non restituisce alcun valore nella situazione di normalità. Se invece la query restituisce alcune righe, è necessario eseguire ulteriori indagini.

È inoltre possibile trovare query associate a I/O eseguendo la query DMV seguente.

select top 5 (total_logical_reads/execution_count) as avg_logical_reads,
                   (total_logical_writes/execution_count) as avg_logical_writes,
           (total_physical_reads/execution_count) as avg_physical_reads,
           Execution_count, statement_start_offset, p.query_plan, q.text
from sys.dm_exec_query_stats
      cross apply sys.dm_exec_query_plan(plan_handle) p
      cross apply sys.dm_exec_sql_text(plan_handle) as q
order by (total_logical_reads + total_logical_writes)/execution_count Desc

La query DMV seguente può essere utilizzata per individuare batch/richieste che generano la maggior parte delle operazioni di I/O. Una query DMV come quella riportata di seguito può essere utilizzata per trovare le prime cinque richieste che generano la maggior parte delle operazioni di I/O. Regolando queste query è possibile migliorare le prestazioni del sistema.

select top 5 
    (total_logical_reads/execution_count) as avg_logical_reads,
    (total_logical_writes/execution_count) as avg_logical_writes,
    (total_physical_reads/execution_count) as avg_phys_reads,
     Execution_count, 
    statement_start_offset as stmt_start_offset, 
    sql_handle, 
    plan_handle
from sys.dm_exec_query_stats  
order by  (total_logical_reads + total_logical_writes) Desc

Blocco

Eseguire la query seguente per determinare le sessioni di blocco.

select blocking_session_id, wait_duration_ms, session_id from 
sys.dm_os_waiting_tasks
where blocking_session_id is not null

Utilizzare questa chiamata per individuare il codice SQL restituito da blocking_session_id. Se ad esempio il valore blocking_session_id è 87, eseguire questa query per ottenere il codice SQL.

dbcc INPUTBUFFER(87)

Con la query seguente vengono mostrate l'analisi delle attese SQL e le prime 10 risorse in stato di attesa.

select top 10 *
from sys.dm_os_wait_stats
--where wait_type not in ('CLR_SEMAPHORE','LAZYWRITER_SLEEP','RESOURCE_QUEUE','SLEEP_TASK','SLEEP_SYSTEMTASK','WAITFOR')
order by wait_time_ms desc

Per individuare quale spid blocca un altro spid, creare la stored procedure seguente nel database e quindi eseguirla. La stored procedure segnala la situazione di blocco. Digitare sp_who per individuare @spid, ovvero il parametro facoltativo.

create proc dbo.sp_block (@spid bigint=NULL)
as
select 
    t1.resource_type,
    'database'=db_name(resource_database_id),
    'blk object' = t1.resource_associated_entity_id,
    t1.request_mode,
    t1.request_session_id,
    t2.blocking_session_id    
from 
    sys.dm_tran_locks as t1, 
    sys.dm_os_waiting_tasks as t2
where 
    t1.lock_owner_address = t2.resource_address and
    t1.request_session_id = isnull(@spid,t1.request_session_id)

Vengono riportati di seguito alcuni esempi di utilizzo della stored procedure.

exec sp_block
exec sp_block @spid = 7

Vedere anche