Appendice A: Monitorare l'integrità di SQL Server
Aggiornato: 2009-04-30
In Microsoft SQL Server 2005 sono disponibili alcuni strumenti per il monitoraggio dei database, tra cui le viste a gestione dinamica. Le viste a gestione dinamica (DMV, Dynamic Management View) e le funzioni a gestione dinamica (DMF, Dynamic Management Function) restituiscono informazioni sullo stato del server che possono essere utilizzate per monitorare lo stato dell'istanza di un server, diagnosticare problemi e regolare le prestazioni.
Vengono elencati di seguito alcuni degli oggetti generali a gestione dinamica dei server:
dm_db_*: database e oggetti di database
dm_exec_*: esecuzione di codice utente e connessioni associate
dm_os_*: memoria, blocco e pianificazione
dm_tran_*: transazioni e isolamento
dm_io_*: input/output su reti e dischi
In questa sezione vengono descritte alcune delle query di utilizzo più comune eseguite su queste viste e funzioni a gestione dinamica per monitorare l'integrità di SQL Server.
Query di esempio
È possibile eseguire la query seguente per ottenere tutti i nomi DMV e DMF:
SELECT * FROM sys.system_objects
WHERE name LIKE 'dm_%'
ORDER BY name
Monitoraggio dei colli di bottiglia della CPU
Un collo di bottiglia della CPU spesso è causato da un piano di query non ottimale, da una configurazione non appropriata, da fattori di progettazione inadeguati o da risorse hardware insufficienti. Vengono riportate di seguito alcune query comuni che consentono di individuare la causa di un collo di bottiglia della CPU.
Con la query seguente è possibile ottenere una visualizzazione di livello superiore dei batch o delle stored procedure attualmente memorizzate nella cache che consumano una quantità elevata di CPU.
SELECT TOP 50
SUM(qs.total_worker_time) AS total_cpu_time,
SUM(qs.execution_count) AS total_execution_count,
COUNT(*) AS number_of_statements,
qs.sql_handle
FROM sys.dm_exec_query_stats AS qs
GROUP BY qs.sql_handle
ORDER BY SUM(qs.total_worker_time) DESC
La query seguente consente di visualizzare l'utilizzo della CPU di aggregazione da parte di piani memorizzati nella cache con testo SQL.
SELECT
total_cpu_time,
total_execution_count,
number_of_statements,
s2.text
--(SELECT SUBSTRING(s2.text, statement_start_offset / 2, ((CASE WHEN statement_end_offset = -1 THEN (LEN(CONVERT(NVARCHAR(MAX), s2.text)) * 2) ELSE statement_end_offset END) - statement_start_offset) / 2) ) AS query_text
FROM
(SELECT TOP 50
SUM(qs.total_worker_time) AS total_cpu_time,
SUM(qs.execution_count) AS total_execution_count,
COUNT(*) AS number_of_statements,
qs.sql_handle --,
--MIN(statement_start_offset) AS statement_start_offset,
--MAX(statement_end_offset) AS statement_end_offset
FROM
sys.dm_exec_query_stats AS qs
GROUP BY qs.sql_handle
ORDER BY SUM(qs.total_worker_time) DESC) AS stats
CROSS APPLY sys.dm_exec_sql_text(stats.sql_handle) AS s2
La query seguente consente di visualizzare le prime 50 istruzioni SQL con un consumo medio di CPU elevato.
SELECT TOP 50
total_worker_time/execution_count AS [Avg CPU Time],
(SELECT SUBSTRING(text,statement_start_offset/2,(CASE WHEN statement_end_offset = -1 then LEN(CONVERT(nvarchar(max), text)) * 2 ELSE statement_end_offset end -statement_start_offset)/2) FROM sys.dm_exec_sql_text(sql_handle)) AS query_text, *
FROM sys.dm_exec_query_stats
ORDER BY [Avg CPU Time] DESC
Di seguito vengono riportate query DMV che consentono di individuare compilazioni/ricompilazioni eccessive.
select * from sys.dm_exec_query_optimizer_info
where
counter = 'optimizations'
or counter = 'elapsed time'
La query di esempio seguente restituisce le prime 25 stored procedure che sono state ricompilate. Il valore plan_generation_num indica il numero di ricompilazioni eseguite dalla query.
select top 25
sql_text.text,
sql_handle,
plan_generation_num,
execution_count,
dbid,
objectid
from sys.dm_exec_query_stats a
cross apply sys.dm_exec_sql_text(sql_handle) as sql_text
where plan_generation_num > 1
order by plan_generation_num desc
Un piano di query insufficiente può comportare un maggiore consumo della CPU.
Con la query seguente viene mostrata quale query utilizza la CPU più cumulativa.
SELECT
highest_cpu_queries.plan_handle,
highest_cpu_queries.total_worker_time,
q.dbid,
q.objectid,
q.number,
q.encrypted,
q.[text]
from
(select top 50
qs.plan_handle,
qs.total_worker_time
from
sys.dm_exec_query_stats qs
order by qs.total_worker_time desc) as highest_cpu_queries
cross apply sys.dm_exec_sql_text(plan_handle) as q
order by highest_cpu_queries.total_worker_time desc
Nella query seguente vengono mostrati alcuni operatori che consumano molta CPU, ad esempio '%Hash Match%', '%Sort%' per ricercare i sospetti.
select *
from
sys.dm_exec_cached_plans
cross apply sys.dm_exec_query_plan(plan_handle)
where
cast(query_plan as nvarchar(max)) like '%Sort%'
or cast(query_plan as nvarchar(max)) like '%Hash Match%'
Se sono stati rilevati piani di query insufficienti che comportano un elevato consumo della CPU, eseguire UPDATE STATISTICS sulle tabelle coinvolte nella query e controllare se il problema persiste. Raccogliere quindi i dati e segnalare il problema al supporto tecnico di PerformancePoint Planning.
Un numero eccessivo di compilazioni e ricompilazioni nel sistema può comportare un problema di prestazioni associato alla CPU.
Per individuare compilazioni/ricompilazioni eccessive, è possibile eseguire le query DMV seguenti.
select * from sys.dm_exec_query_optimizer_info
where
counter = 'optimizations'
or counter = 'elapsed time'
La query di esempio seguente restituisce le prime 25 stored procedure che sono state ricompilate. Il valore plan_generation_num indica il numero di ricompilazioni eseguite dalla query.
select top 25
sql_text.text,
sql_handle,
plan_generation_num,
execution_count,
dbid,
objectid
from sys.dm_exec_query_stats a
cross apply sys.dm_exec_sql_text(sql_handle) as sql_text
where plan_generation_num > 1
order by plan_generation_num desc
Se è stato rilevato un numero eccessivo di compilazioni o ricompilazioni, raccogliere tutti i dati possibili e segnalarli al supporto tecnico di Planning.
Colli di bottiglia della memoria
Prima di avviare le operazioni di rilevamento e indagine sull'utilizzo della memoria, verificare di aver abilitato le opzioni avanzate in SQL Server. Eseguire la query seguente nel database master per attivare innanzitutto questa opzione.
sp_configure 'show advanced options'
go
sp_configure 'show advanced options', 1
go
reconfigure
go
Eseguire la query seguente per controllare le opzioni di configurazione relative alla memoria.
sp_configure 'awe_enabled'
go
sp_configure 'min server memory'
go
sp_configure 'max server memory'
go
sp_configure 'min memory per query'
go
sp_configure 'query wait'
go
Eseguire la query DMV seguente per visualizzare le informazioni relative alla CPU, alla memoria dell'utilità di pianificazione e al pool di buffer.
select
cpu_count,
hyperthread_ratio,
scheduler_count,
physical_memory_in_bytes / 1024 / 1024 as physical_memory_mb,
virtual_memory_in_bytes / 1024 / 1024 as virtual_memory_mb,
bpool_committed * 8 / 1024 as bpool_committed_mb,
bpool_commit_target * 8 / 1024 as bpool_target_mb,
bpool_visible * 8 / 1024 as bpool_visible_mb
from sys.dm_os_sys_info
Colli di bottiglia di I/O
Individuare i colli di bottiglia di I/O esaminando le attese latch. Eseguire la query DMV seguente per ottenere le statistiche relative alle attese latch di I/O.
select wait_type, waiting_tasks_count, wait_time_ms, signal_wait_time_ms, wait_time_ms / waiting_tasks_count
from sys.dm_os_wait_stats
where wait_type like 'PAGEIOLATCH%' and waiting_tasks_count > 0
order by wait_type
Esiste un problema di I/O se i valori waiting_task_counts e wait_time_ms cambiano in modo significativo rispetto alla normalità. È importante ottenere una linea di base di contatori delle prestazioni e output di query DMV chiave quando SQL Server viene eseguito senza problemi.
Questi valori wait_types possono indicare se nel sottosistema di I/O si verifica un collo di bottiglia.
Utilizzare la query DMV seguente per individuare le richieste di I/O attualmente in sospeso. Eseguire questa query periodicamente per controllare lo stato del sottosistema di I/O e isolare il disco o i dischi fisici coinvolti nei colli di bottiglia di I/O.
select
database_id,
file_id,
io_stall,
io_pending_ms_ticks,
scheduler_address
from sys.dm_io_virtual_file_stats(NULL, NULL)t1,
sys.dm_io_pending_io_requests as t2
where t1.file_handle = t2.io_handle
La query in genere non restituisce alcun valore nella situazione di normalità. Se invece la query restituisce alcune righe, è necessario eseguire ulteriori indagini.
È inoltre possibile trovare query associate a I/O eseguendo la query DMV seguente.
select top 5 (total_logical_reads/execution_count) as avg_logical_reads,
(total_logical_writes/execution_count) as avg_logical_writes,
(total_physical_reads/execution_count) as avg_physical_reads,
Execution_count, statement_start_offset, p.query_plan, q.text
from sys.dm_exec_query_stats
cross apply sys.dm_exec_query_plan(plan_handle) p
cross apply sys.dm_exec_sql_text(plan_handle) as q
order by (total_logical_reads + total_logical_writes)/execution_count Desc
La query DMV seguente può essere utilizzata per individuare batch/richieste che generano la maggior parte delle operazioni di I/O. Una query DMV come quella riportata di seguito può essere utilizzata per trovare le prime cinque richieste che generano la maggior parte delle operazioni di I/O. Regolando queste query è possibile migliorare le prestazioni del sistema.
select top 5
(total_logical_reads/execution_count) as avg_logical_reads,
(total_logical_writes/execution_count) as avg_logical_writes,
(total_physical_reads/execution_count) as avg_phys_reads,
Execution_count,
statement_start_offset as stmt_start_offset,
sql_handle,
plan_handle
from sys.dm_exec_query_stats
order by (total_logical_reads + total_logical_writes) Desc
Blocco
Eseguire la query seguente per determinare le sessioni di blocco.
select blocking_session_id, wait_duration_ms, session_id from
sys.dm_os_waiting_tasks
where blocking_session_id is not null
Utilizzare questa chiamata per individuare il codice SQL restituito da blocking_session_id. Se ad esempio il valore blocking_session_id è 87, eseguire questa query per ottenere il codice SQL.
dbcc INPUTBUFFER(87)
Con la query seguente vengono mostrate l'analisi delle attese SQL e le prime 10 risorse in stato di attesa.
select top 10 *
from sys.dm_os_wait_stats
--where wait_type not in ('CLR_SEMAPHORE','LAZYWRITER_SLEEP','RESOURCE_QUEUE','SLEEP_TASK','SLEEP_SYSTEMTASK','WAITFOR')
order by wait_time_ms desc
Per individuare quale spid blocca un altro spid, creare la stored procedure seguente nel database e quindi eseguirla. La stored procedure segnala la situazione di blocco. Digitare sp_who per individuare @spid, ovvero il parametro facoltativo.
create proc dbo.sp_block (@spid bigint=NULL)
as
select
t1.resource_type,
'database'=db_name(resource_database_id),
'blk object' = t1.resource_associated_entity_id,
t1.request_mode,
t1.request_session_id,
t2.blocking_session_id
from
sys.dm_tran_locks as t1,
sys.dm_os_waiting_tasks as t2
where
t1.lock_owner_address = t2.resource_address and
t1.request_session_id = isnull(@spid,t1.request_session_id)
Vengono riportati di seguito alcuni esempi di utilizzo della stored procedure.
exec sp_block
exec sp_block @spid = 7