Supervisar Cloud Connector con Operations Management Suite (OMS)

Importante

Cloud Connector Edition se retirará el 31 de julio de 2021 junto con Skype Empresarial Online. Una vez que su organización haya actualizado a Teams, obtenga información sobre cómo conectar su red de telefonía local a Teams mediante enrutamiento directo.

Lea este artículo para obtener información sobre cómo supervisar su implementación de Cloud Connector versión 2.1 y versiones posteriores con Microsoft Operations Management Suite (OMS).

Ahora puede supervisar su implementación de Cloud Connector versión 2.1 y posterior mediante Operations Management Suite (OMS), una solución de administración de TI en la nube de Microsoft. OMS Log Analytics le permite supervisar y analizar la disponibilidad y el rendimiento de los recursos, incluidas las máquinas físicas y virtuales. Para obtener más información sobre OMS y Log Analytics, consulte ¿Qué es Operations Management Suite (OMS)?

Este artículo contiene las siguientes secciones:

  • Requisitos previos

  • Configurar el conector de nube para usar OMS

  • Configurar OMS

  • Analizar las alertas en el repositorio de Log Analytics

  • Conjunto de supervisión recomendada

Requisitos previos

Antes de poder usar OMS para supervisar la implementación de Cloud Connector, necesitará lo siguiente:

Configurar el conector de nube para usar OMS

Tendrá que configurar el entorno local de Cloud Connector para usar OMS. Para ello, necesita su id. y clave del área de trabajo de OMS, que puede encontrar mediante el portal de OMS de la siguiente manera: Configuración -->Orígenes conectados --> Servidores de Windows:

Captura de pantalla de Cloud Connector OMS.

La manera de configurar Cloud Connector para usar OMS depende del escenario:

  • Si va a instalar un nuevo dispositivo de Cloud Connector o desea volver a implementar un dispositivo, siga estos pasos antes de ejecutar Install-CcAppliance:

    1. En la sección archivo CloudConnector.ini [Común], establezca el parámetro OMSEnabled en True.

      Cada vez que cloud connector se implementa o actualiza, intenta instalar el agente OMS automáticamente en las máquinas virtuales. Habilite esta característica para que el agente de OMS pueda sobrevivir a la actualización automática de Cloud Connector.

    2. Para configurar el id. y la clave de OMS, ejecute Set-CcCredential -AccountType OMSWorkspace.

  • Si va a instalar un agente OMS en un dispositivo Cloud Connector existente, siga estos pasos:

    1. En la sección archivo CloudConnector.ini [Común], establezca OMSEnabled=true.

    2. Ejecute Import-CCConfiguration.

    3. Ejecute Install-CcOMSAgent.

      Nota

      Si la credencial de OMSWorkspace nunca se ha establecido, se le solicitará la credencial al ejecutar install-CcOMSAgent.

  • Si desea actualizar la clave o el id. del área de trabajo de OMS en un dispositivo cloud connector que ya haya instalado un agente de OMS:

    1. Para configurar el id. y la clave de OMS, ejecute Set-CcCredential -AccountType OMSWorkspace.

    2. Para aplicar las actualizaciones, ejecute Install-CcOMSAgent.

  • Para todos los escenarios, compruebe que los agentes están conectados de la siguiente manera:

    En el portal de OMS, vaya a Configuración -> Orígenes conectados -> Servidores de Windows. Verá una lista de equipos conectados.

Configurar OMS

A continuación, debe especificar la configuración de OMS mediante el portal de OMS. En concreto, necesita:

  • Especifique información sobre los registros de eventos y los contadores de rendimiento.

  • Crear alertas.

Especificar información sobre los registros de eventos y los contadores de rendimiento

En el portal de OMS, debe especificar la información sobre los registros de eventos y los contadores de rendimiento como se indica a continuación:

  1. Vaya a Registros de eventos de Configuración-Datos-Windows>> y agregue registros de eventos para:

  2. Ve a Configuración-Datos>-> Contadores de rendimiento de Windows y agrega contadores de rendimiento para:

    • Contadores de nivel de SO. Puede agregar contadores de nivel de sistema operativo, como el uso del procesador, el uso de memoria, el uso de red, o puede usar soluciones existentes, como Capacidad y rendimiento, Monitor de rendimiento de red sin agregar contadores explícitamente. Independientemente de cómo decidas supervisarlos, Microsoft recomienda que supervises estos contadores del sistema operativo.

    • Skype Empresarial contadores. Hay numerosos contadores proporcionados por Skype Empresarial. Para encontrar estos contadores, inicie sesión en cualquier servidor de mediación y abra el Monitor de rendimiento. Estos contadores comienzan con "LS:". Microsoft recomienda comenzar con los siguientes contadores de capacidad como mínimo y agregar otros que sean de interés:

      Total de llamadas activas:

      • LS:MediationServer - Llamadas entrantes(_Total)- Current

      • LS:MediationServer - Llamadas salientes(_Total)- Current

      Total de llamadas de omisión de medios activas:

      • LS:MediationServer - Llamadas entrantes(_Total)- Llamadas de omisión de medios activas

      • LS:MediationServer - Llamadas salientes(_Total)- Llamadas de omisión de medios activas

      Nota

      Debe introducir manualmente los contadores de rendimiento en el cuadro de texto. No aparecen como opciones en la lista desplegable.

      Para obtener más información, consulte Orígenes de datos de rendimiento de Windows y Linux en Log Analytics

Crear alertas

Hay dos tipos de alertas en OMS: número de alertas de resultados y alertas de medición métrica. Para obtener más información sobre cómo crear alertas, consulte Trabajar con reglas de alertas en Log Analytics.

Debe tener en cuenta lo siguiente al crear alertas:

  • Asegúrese de que la alerta sea una alerta de número de resultados, que es la selección predeterminada.

  • Las consultas de demostración requieren que "Número de resultados" se establezca en "Mayor que 0".

  • Se recomienda que establezca intervalo de tiempo y Frecuencia de alerta en 5 minutos.

  • Se recomienda no habilitar "Suprimir alertas" para las alertas de demostración.

  • Para escenarios típicos de alertas, Microsoft recomienda crear un par de alertas: una alerta de error y otra de restablecimiento. Para la alerta de error, seleccione nivel de gravedad Crítico; para la alerta de restablecimiento, seleccione Información de nivel de gravedad.

En las siguientes secciones se describe cómo crear alertas de ejemplo.

Cree un par de alertas: "RTCMEDSRV NO se está ejecutando en los servidores de mediación" y "RTCMEDSRV vuelve a ejecutarse en servidores de mediación"

Para crear este par de alertas:

  • La consulta para la alerta de error es:

    Event | where Computer contains "MediationServer" | where EventLog == "Lync Server" and (EventID == 25002 or EventID == 25003)  | summarize arg_max(TimeGenerated, EventID) by Computer | where EventID == 25003
    

    La consulta usa el filtro del equipo en el que el equipo contiene "MediationServer" . El filtro selecciona solo el equipo cuyo nombre contiene la cadena "MediationServer".

    Reemplazaría el filtro por su propio filtro de equipo o lo quitaría. Puede crear filtros de cadena complejos sin expresiones regulares. También puede usar expresiones regulares. Además, puede crear un grupo de equipos guardando una consulta de búsqueda y usando ese grupo como filtro del equipo en la consulta de alertas. Para obtener más información, consulte Grupos de equipos en búsquedas de registro de Log Analytics.

    Para cada equipo, la consulta de errores obtiene el último registro de eventos tanto para el inicio del servicio RTCMEDSRV como para el fin del servicio. Devolverá un registro si el último evento es el evento de parada del servicio; no devolverá nada si el último evento es el evento de inicio del servicio. En resumen, la consulta devolverá una lista de servidores cuyo RTCMEDSRV se detiene en el intervalo de tiempo.

  • La consulta para la alerta de restablecimiento es la siguiente:

    Event | where Computer contains "MediationServer" | where EventLog == "Lync Server" and (EventID == 25002 or EventID == 25003) | summarize arg_max(TimeGenerated, EventID) by Computer  | where EventID == 2500
    

    La consulta de restablecimiento hace exactamente lo contrario de la consulta de errores. Para cada equipo, devolverá uno si el último evento es el evento de inicio del servicio; no devolverá nada si el último evento es el evento de parada del servicio.

Crear un par de alertas: "Demasiadas llamadas simultáneas en los servidores de mediación" y "Las llamadas simultáneas vuelven a la carga normal"

Para crear esta alerta:

  • La consulta para la alerta de error es:

    Perf | where Computer contains "MediationServer" | where (ObjectName == "LS:MediationServer - Outbound Calls" or ObjectName == "LS:MediationServer - Inbound Calls") | summarize arg_max(TimeGenerated, CounterValue) by ObjectName, Computer | summarize  TotalCalls = sum(CounterValue) by Computer| where TotalCalls >= 500
    

    Para cada equipo, la consulta obtendrá los últimos contadores para llamadas entrantes y llamadas salientes y sumará esos dos valores. Devolverá un registro si el valor de la suma supera 500; no devolverá nada si no lo hace. En resumen, la consulta devolverá una lista de servidores cuyas llamadas simultáneas son demasiadas en el intervalo de tiempo.

  • La consulta para la alerta de restablecimiento es la siguiente:

    Perf  | where Computer contains "MediationServer" | where (ObjectName == "LS:MediationServer - Outbound Calls" or ObjectName ==  "LS:MediationServer - Inbound Calls") | summarize arg_max(TimeGenerated, CounterValue) by ObjectName, Computer | summarize  TotalCalls = sum(CounterValue) by Computer| where TotalCalls < 500
    

    La consulta de restablecimiento hace exactamente lo contrario de la consulta de errores. Para cada equipo, la consulta obtendrá los últimos contadores para llamadas entrantes y llamadas salientes y sumará esos dos valores. Devolverá un registro si el valor de suma es menor que 500; no devolverá nada de lo contrario.

Crear una alerta: alerta "CPU usage > 90 or RTCMEDIARELAY stopped in Servers" (Uso de CPU 90 o RTCMEDIARELAY detenido en servidores)

Para crear esta alerta, la consulta es:

search *| where Computer contains "MediationServer" | where (Type == "Perf" or Type == "Event") | where ((ObjectName ==  "Processor" and CounterName == "% Processor Time") or EventLog == "Lync Server") | where (CounterValue > 90 or EventID == 22003)

La consulta obtendrá todo el contador de uso del procesador y el evento de parada del servicio de todos los equipos y devolverá un registro si el uso del procesador supera el 90 % o si el servicio se detiene.

Analizar las alertas en el repositorio de Log Analytics

Para analizar las alertas de su repositorio, use la solución De administración de alertas. Para obtener más información, vea Solución de administración de alertas en Operations Management Suite (OMS)

Para identificar problemas con los registros de eventos y los contadores de rendimiento:

  • Registros de eventos. Para cualquier problema, debe haber un par de eventos, con un conjunto de eventos para indicar que algo está mal, mientras que el otro indica que todo está bien. Para un período de tiempo determinado, es el último evento registrado que indicará si algo no es adecuado para ese período de tiempo.

  • Contadores de rendimiento. Debe haber un umbral para los contadores supervisados.

En la tabla siguiente se enumeran los servicios que Microsoft recomienda supervisar enumerando los identificadores de evento de parada e inicio:

Nombre del servicio
Rol de servidor de destino
Detener id. de evento
Id. de evento de inicio
RTCMEDSRV
Servidor de mediación
25003
25002
RTCSRV
Servidor perimetral
12289
12288
RTCMRAUTH
Servidor perimetral
19003
19002
RTCMEDIARELAY
Servidor perimetral
22003
22002

En la tabla siguiente se enumeran los problemas de red que Microsoft recomienda supervisar:

Nombre del monitor
Rol de servidor de destino
Expresión de id. de evento correcto
Expresión de id. de evento de error
Ejemplo de error
Error de conectividad del servidor de mediación a la puerta de enlace
Servidor de mediación
25062 25002
Error al finalizar la llamada del servidor de mediación a la puerta de enlace
Servidor de mediación
25064 25002
Problemas de red críticos
Servidor perimetral
14353 12288

A continuación se enumeran los contadores de capacidad de llamada que se deben supervisar. Estos números deben ser menores que 500 para la edición estándar de Cloud Connector; menos de 50 para la edición mínima de Cloud Connector.

  • LS:MediationServer - Llamadas entrantes(_Total)- Current

  • LS:MediationServer - Llamadas salientes(_Total)- Current

  • LS:MediationServer - Llamadas entrantes(_Total)- Llamadas de omisión de medios activas

  • LS:MediationServer - Llamadas salientes(_Total)- Llamadas de omisión de medios activas

Vea también

Para obtener más información sobre cómo trabajar con OMS, consulte lo siguiente: