Trabajar con eventos mediante Application Diagnostics

 

Se aplica a: System Center 2012 R2 Operations Manager, System Center 2012 - Operations Manager, System Center 2012 SP1 - Operations Manager

La gestión de alertas es una característica del uso de System Center 2012 – Operations Manager. Las alertas de la supervisión de aplicaciones .NET muestran la información de otras alertas, como información general e información de producto. Sin embargo, una alerta de aplicación .NET también proporciona un vínculo a la descripción de la alerta. Este vínculo abre el evento que generó la alerta en Application Diagnostics. Aquí puede ver mucha más información para solucionar e identificar el problema, y encontrar la solución.

Nota

La solución detallada de problemas de supervisión de rendimiento de aplicaciones a menudo requiere acceso al código fuente de la aplicación y podría requerir la intervención de los desarrolladores. Puede instalar el módulo de administración de sincronización de elementos de trabajo de Team Foundation Server y reenviar alertas al Team Foundation Server del equipo de desarrollo. El módulo de administración de sincronización de elementos de trabajo de Team Foundation Server realiza el seguimiento y la sincronización de cambios en elementos de trabajo de Team Foundation Server y en alertas de Operations Manager asociadas.

Investigación de alertas de aplicaciones .NET

El objetivo principal de la supervisión de aplicaciones en Operations Manager es la reducción del tiempo necesario para determinar, asignar y resolver problemas. Al recibir una alerta, es necesario encontrar su causa (ya sea el sistema que hospeda a la aplicación o el código), poder mostrar los datos que corroboran dicha conclusión y determinar cómo solucionar el problema. Para saber si es un problema del sistema, es necesario conocer el estado del sistema en el momento del evento. Para determinar la causa principal del problema necesitará saber la cadena de llamadas que se produjeron. Para realizar una investigación más detallada es necesario comparar eventos similares y relacionados que ocurrieron en el mismo momento. La combinación de detalles de evento, contadores de rendimiento y cadenas distribuidas le permitirá determinar quién debería encargarse de este problema en primer lugar. Si se produce un error de sistema, puede ajustar los recursos disponibles o la configuración del sistema host y solucionar el problema a nivel de host. Si se trata de un error de aplicación, se deberá pasar el problema al equipo de aplicaciones, junto con la línea de código en la que se produjo el error. A continuación se indican algunas estrategias para usar las vistas, los filtros y la configuración de Application Diagnostics para descubrir la causa principal del problema, encontrar una solución y determinar quién debe participar en la resolución del mismo.

Para abrir Application Diagnostics desde una alerta

  1. Ya que se responde a alertas relacionadas con los grupos de aplicaciones que se configuraron, es conveniente seleccionar el ámbito de las alertas activas y visualizarlas por grupo de aplicaciones. En la consola de Operations Manager, en el panel de navegación, haga clic en el botón Supervisión, expanda Supervisión de aplicaciones, expanda Supervisión de .NET, haga clic en la carpeta con el nombre del grupo de aplicaciones que configuró para llevar a cabo la supervisión y cuyas alertas desea investigar y, a continuación, haga clic en Alertas activas.

  2. Haga doble clic en la alerta que desea abrir.

  3. En la página Propiedades de alerta, haga clic en el vínculo en el panel Descripción de alerta. Se abre Application Diagnostics, una nueva característica de supervisión de Operations Manager, en un explorador web. En la pestaña Propiedades de evento puede ver información como métricas de rendimiento, la pila de llamadas y notas de recopilación de la alerta. Las pestañas permiten ver eventos similares y relacionados, cadenas de eventos y contadores de rendimiento. Es información detallada sobre el rendimiento o el evento de excepción generado por la aplicación que le permitirá diagnosticar si el origen del problema es la misma aplicación, una llamada a un servicio web o una llamada a una base de datos. Para obtener más información sobre la pestaña Propiedades de evento, consulte Detalles de evento de rendimiento. Haga clic en para cerrar la ventana principal cuando finalice la carga de la información del evento.

    Nota

    Este vínculo a Application Diagnostics también se encuentra en la pestaña Contexto de alerta.

Use los procedimientos siguientes para investigar la alerta. Los profesionales de TI posiblemente desearán usar la información de las pestañas Propiedades de evento, Contadores de rendimiento y Cadenas distribuidas para descubrir qué sucedió, si el problema fue causado por un error del sistema y para investigar el origen de la causa principal del mismo. Es muy probable que los desarrolladores necesiten la información de las pestañas Cadenas distribuidas, Eventos similares y Eventos relacionados para entender el contexto relacionado con un determinado problema de código.

Para solucionar problemas mediante las propiedades de Eventos de excepción en Application Diagnostics

  1. En la ventana de Application Diagnostics de la alerta de excepción que se está investigando, haga clic en la pestaña Propiedades de evento para visualizar los detalles clave de la alerta. Es la primera comprobación que se debe realizar para decidir si el problema de la alerta es evidente. Algunas de las categorías principales de información que se visualizarán en la página Propiedades de evento son las siguientes:

    - **Origen** Haga clic en el vínculo **Origen** en la esquina superior izquierda para visualizar los tiempos de carga y respuesta de aplicaciones. Esta información muestra la carga del sistema en el contexto del error de evento de excepción. Para ver los contadores de rendimiento y realizar una evaluación más detallada del estado del sistema, en la página Origen, haga clic en la pestaña **Informes de tendencias**. Para visualizar los equipos en los que se ejecuta la aplicación y analizar si puede haber un problema de equilibrio de carga entre éstos, haga clic en la pestaña **Equipos**. Para visualizar un desglose de llamadas relacionadas o información sobre el origen de los eventos según las cadenas, haga clic en la pestaña **Topología**.
    
    - **Cadena de excepciones** Se muestra para eventos de excepción. Expanda Cadena de excepciones para visualizar la excepción que se generó.
    
    - **Datos de excepción** Se muestra para eventos de excepción y permite visualizar parámetros y variables establecidos para la clase en la excepción.
    
    - **Pila** Es la pila de llamadas, es decir, el orden en el que ocurrieron los acontecimientos. La vista Árbol de ejecución le permite expandir nodos para investigar llamadas. Haga clic en el botón de radio **Vista Grupo de recursos** para visualizar información general sobre el uso del tiempo. Permite determinar el nivel o la situación del problema.
    
    - **Lista de módulos** Se muestra para eventos de excepción y muestra los módulos cargados en el momento de la excepción.
    
    - **Notas de recopilación** Muestra las notas sobre el evento.
    
    System_CAPS_tipSugerencia

    Use los mismos pasos de solución de problemas de Eventos de excepción para Eventos de rendimiento, Eventos similares, Eventos relacionados, Cadenas distribuidas y Contadores de rendimiento.

Para solucionar problemas mediante las propiedades de Evento de rendimiento en Application Diagnostics

  1. En la ventana de Application Diagnostics de la alerta de rendimiento que se está investigando, haga clic en la pestaña Propiedades de evento para visualizar los detalles clave de la alerta. Es la primera comprobación que se debe realizar para decidir si el problema de la alerta es evidente. Algunas de las categorías principales de información que visualizará en la página Propiedades de rendimiento son las siguientes:

    - **Origen** Haga clic en el vínculo **Origen** en la esquina superior izquierda para visualizar los tiempos de carga y respuesta de aplicaciones. Esta información muestra la carga del sistema en el contexto del error de evento de excepción. Para ver los contadores de rendimiento y realizar una evaluación más detallada del estado del sistema, en la página Origen, haga clic en la pestaña **Informes de tendencias**. Para visualizar los equipos en los que se ejecuta la aplicación y analizar si puede haber un problema de equilibrio de carga entre éstos, haga clic en la pestaña **Equipos**. Para visualizar un desglose de llamadas relacionadas o información sobre el origen de los eventos según las cadenas, haga clic en la pestaña **Topología**.
    
    - **Nodos más lentos** Es una lista de los nodos más lentos en la vista Árbol de ejecución y es la causa más probable de problemas de rendimiento de la aplicación.
    
    - **Pila** Es la pila de llamadas, es decir, el orden en el que ocurrieron los acontecimientos. La vista Árbol de ejecución le permite expandir nodos para investigar llamadas. Haga clic en el botón de radio **Vista Grupo de recursos** para visualizar información general sobre el uso del tiempo. Permite determinar el nivel o la situación en la que se encuentra el problema.
    
    - **Notas de recopilación** Muestra las notas sobre el evento.
    

Para solucionar problemas de estado del sistema mediante contadores de rendimiento

  1. Haga clic en la pestaña Contadores de rendimiento para ver una tabla o un diagrama de los principales contadores de rendimiento.

    Nota

    El sistema supervisado recopila y almacena en memoria caché quince minutos de datos de rendimiento. Cuando se genera un evento de rendimiento o excepción, los datos de rendimiento se envían a Operations Manager junto con el evento.

  2. Active las casillas de los contadores de rendimiento que desea incluir en la información y, a continuación, haga clic en Aplicar.

  3. Use la información de esta pantalla para evaluar el estado de rendimiento del sistema en relación al evento que se está investigando. Por ejemplo, si el rendimiento es uniformemente lento en el momento del evento, la alerta se debe probablemente a un problema de rendimiento del sistema.

Para encontrar el problema principal mediante cadenas distribuidas

  1. Haga clic en la pestaña Cadenas distribuidas para visualizar el orden de las llamadas, es decir, la cadena de eventos de la que el evento forma parte. Contribuye a entender cómo afectaron otros eventos de la aplicación o de aplicaciones relacionadas al evento que se está investigando.

  2. En la vista Cadenas distribuidas, haga clic en una de las llamadas o vínculos en la cadena. Si hay varios eventos para el mismo objeto, se abrirá el Asistente para encadenamiento. El asistente permite seleccionar posibles eventos para ponerlos en correlación en una cadena de eventos. Para iniciar el asistente, haga clic en Siguiente.

    Nota

    Obtenga la marca de tiempo de la llamada seleccionada para asociarla a un evento en la página siguiente.

  3. En la página Seleccionar posible evento de cadena, seleccione el evento que desea analizar. Debería ser el evento con la marca de tiempo más próxima a la llamada seleccionada en la vista Cadenas distribuidas.

  4. La información que se muestra a continuación depende del tipo de problema que se está investigando. Por ejemplo, si se selecciona una transacción en la que no se encuentra un servidor, puede ir a la página de propiedades del evento correspondiente. Esto le permitirá emparejar el error del servidor con el evento que se estaba investigando inicialmente. Al ser un error de servidor, se sabe que el problema no está en el lado del cliente sino del servidor. Puede que se muestre un gráfico del evento seleccionado y que se pueda desglosar un evento de rendimiento según el tiempo de carga de la página.

  5. En las propiedades del evento, haga clic en la llamada del lado del servidor y, a continuación, haga clic en la pestaña Contadores de rendimiento para obtener más detalles.

Para solucionar problemas mediante la visualización de eventos similares

  1. Haga clic en la pestaña Eventos similares para ver si se generaron alertas similares en otras ocasiones, lo que sugeriría la existencia de un problema de la aplicación.

  2. Hay varias maneras de filtrar eventos similares. Haga clic en el menú desplegable Similar por: para seleccionar cómo desea agrupar eventos similares: por problema, acción, clase de excepción o función con errores. En los cuadros de texto Desde y Hasta puede configurar el intervalo de fechas para el que desea visualizar eventos similares. Use la pestaña Eventos similares para determinar si se generaron alertas similares en otras ocasiones, lo que sugeriría la existencia de un problema de la aplicación.

    - **Filtrado por problema** Muestra eventos similares del mismo tipo. Por ejemplo, puede visualizar todos los eventos similares en los que la referencia de objeto no está configurada como una instancia de un objeto. Haga clic en el botón **Vista Diagrama** para visualizar la proporción del número total de eventos del problema actual y el número total de eventos de otros problemas. Esta información ofrece una vista rápida de la magnitud del problema asociado a este evento. Si muchos eventos similares actuales tienen el mismo problema, es posible que la resolución del mismo tenga una prioridad más alta, ya que tendría un gran efecto en la reducción del número de alertas recibidas.
    
    - **Filtrado por la acción** agrupa los eventos similares por aspecto: seguridad, rendimiento, conectividad y error de la aplicación. Haga clic en el botón **Vista Diagrama** para visualizar el número de eventos similares según las categorías de aspecto y detectar con facilidad aquellas que pueden estar relacionadas con el problema.
    
    - El **Filtrado por clase de excepción** agrupa los eventos similares según los nombres asignados durante la configuración. Presumiblemente, estos nombres deben permitir identificar el tipo de excepciones, por ejemplo la clase **System.NullReferenceException**.
    
    - El **Filtrado por función con errores** agrupa los eventos similares por la función que produce la excepción. Esto podría significar que hay un problema con el punto de entrada.
    

    Tenga en cuenta que se trata de eventos similares, relacionados por definición, y que estos filtros proporcionan una mejor idea de cómo se relacionan exactamente entre sí. Por tanto, si usa los filtros de eventos similares podría descubrir que la mayoría del total de eventos tiene el mismo problema que el evento que está viendo, que es un problema de rendimiento, que pertenecen a una clase de excepción que configuró y que la mitad de los eventos similares tiene la misma función con errores. Acción: la función va al desarrollador que debe actualizar el código de función.

Para solucionar problemas mediante la visualización de eventos relacionados

  1. Haga clic en la pestaña Eventos relacionados para ver los eventos relacionados por la hora. Estas excepciones están correlacionadas con otros eventos que podrían proporcionarle una idea del problema.

  2. Para ver los detalles de un evento de la lista, haga clic en el vínculo de la columna Descripción.

    En los eventos relacionados, es posible que observe que el tiempo de respuesta es muy lento para todos los eventos durante un cierto tiempo. Esto podría indicar que hay un problema en el sistema y no en el código, y que por tanto, es posible que vaya a los profesionales de TI para que busquen una solución.