Supervisar Cloud Connector con Operations Management Suite (OMS)

Artículo
07/21/2023

Importante

Cloud Connector Edition se retirará el 31 de julio de 2021 junto con Skype Empresarial Online. Una vez que su organización haya actualizado a Teams, obtenga información sobre cómo conectar su red de telefonía local a Teams mediante enrutamiento directo.

Lea este artículo para obtener información sobre cómo supervisar su implementación de Cloud Connector versión 2.1 y versiones posteriores con Microsoft Operations Management Suite (OMS).

Ahora puede supervisar su implementación de Cloud Connector versión 2.1 y posterior mediante Operations Management Suite (OMS), una solución de administración de TI en la nube de Microsoft. OMS Log Analytics le permite supervisar y analizar la disponibilidad y el rendimiento de los recursos, incluidas las máquinas físicas y virtuales. Para obtener más información sobre OMS y Log Analytics, consulte ¿Qué es Operations Management Suite (OMS)?

Este artículo contiene las siguientes secciones:

Requisitos previos
Configurar el conector de nube para usar OMS
Configurar OMS
Analizar las alertas en el repositorio de Log Analytics
Conjunto de supervisión recomendada

Requisitos previos

Antes de poder usar OMS para supervisar la implementación de Cloud Connector, necesitará lo siguiente:

Una cuenta de Azure y un área de trabajo de OMS. Si aún no tiene una cuenta de Azure, deberá crear una para usar OMS Log Analytics. Para obtener información sobre cómo crear una cuenta de Azure y configurar un área de trabajo de OMS, consulte Introducción a un área de trabajo de Log Analytics.
Cloud Connector versión 2.1 o posterior
Se requiere una nueva búsqueda de registros de Log Analytics para la supervisión de Cloud Connector. Para obtener más información, consulte Actualizar el área de trabajo de Azure Log Analytics a una nueva búsqueda de registros.

Configurar el conector de nube para usar OMS

Tendrá que configurar el entorno local de Cloud Connector para usar OMS. Para ello, necesita su id. y clave del área de trabajo de OMS, que puede encontrar mediante el portal de OMS de la siguiente manera: Configuración -->Orígenes conectados --> Servidores de Windows:

Captura de pantalla de Cloud Connector OMS.

La manera de configurar Cloud Connector para usar OMS depende del escenario:

Si va a instalar un nuevo dispositivo de Cloud Connector o desea volver a implementar un dispositivo, siga estos pasos antes de ejecutar Install-CcAppliance:
1. En la sección archivo CloudConnector.ini [Común], establezca el parámetro OMSEnabled en True.
  
  Cada vez que cloud connector se implementa o actualiza, intenta instalar el agente OMS automáticamente en las máquinas virtuales. Habilite esta característica para que el agente de OMS pueda sobrevivir a la actualización automática de Cloud Connector.
2. Para configurar el id. y la clave de OMS, ejecute Set-CcCredential -AccountType OMSWorkspace.
Si va a instalar un agente OMS en un dispositivo Cloud Connector existente, siga estos pasos:
1. En la sección archivo CloudConnector.ini [Común], establezca OMSEnabled=true.
2. Ejecute Import-CCConfiguration.
3. Ejecute Install-CcOMSAgent.
  
  Nota
  
  Si la credencial de OMSWorkspace nunca se ha establecido, se le solicitará la credencial al ejecutar install-CcOMSAgent.
Si desea actualizar la clave o el id. del área de trabajo de OMS en un dispositivo cloud connector que ya haya instalado un agente de OMS:
1. Para configurar el id. y la clave de OMS, ejecute Set-CcCredential -AccountType OMSWorkspace.
2. Para aplicar las actualizaciones, ejecute Install-CcOMSAgent.
Para todos los escenarios, compruebe que los agentes están conectados de la siguiente manera:

En el portal de OMS, vaya a Configuración -> Orígenes conectados -> Servidores de Windows. Verá una lista de equipos conectados.

Configurar OMS

A continuación, debe especificar la configuración de OMS mediante el portal de OMS. En concreto, necesita:

Especifique información sobre los registros de eventos y los contadores de rendimiento.
Crear alertas.

Especificar información sobre los registros de eventos y los contadores de rendimiento

En el portal de OMS, debe especificar la información sobre los registros de eventos y los contadores de rendimiento como se indica a continuación:

Vaya a Registros de eventos de Configuración-Datos-Windows>> y agregue registros de eventos para:
- Lync Server
- Aplicación
  
  Nota
  
  Debe escribir manualmente Lync Server en el cuadro de texto. No aparece como opción en la lista desplegable.
  
  Para obtener más información, consulte Orígenes de datos de registro de eventos de Windows en Log Analytics
Ve a Configuración-Datos>-> Contadores de rendimiento de Windows y agrega contadores de rendimiento para:
- Contadores de nivel de SO. Puede agregar contadores de nivel de sistema operativo, como el uso del procesador, el uso de memoria, el uso de red, o puede usar soluciones existentes, como Capacidad y rendimiento, Monitor de rendimiento de red sin agregar contadores explícitamente. Independientemente de cómo decidas supervisarlos, Microsoft recomienda que supervises estos contadores del sistema operativo.
- Skype Empresarial contadores. Hay numerosos contadores proporcionados por Skype Empresarial. Para encontrar estos contadores, inicie sesión en cualquier servidor de mediación y abra el Monitor de rendimiento. Estos contadores comienzan con "LS:". Microsoft recomienda comenzar con los siguientes contadores de capacidad como mínimo y agregar otros que sean de interés:
  
  Total de llamadas activas:
  - LS:MediationServer - Llamadas entrantes(_Total)- Current
  - LS:MediationServer - Llamadas salientes(_Total)- Current
  Total de llamadas de omisión de medios activas:
  - LS:MediationServer - Llamadas entrantes(_Total)- Llamadas de omisión de medios activas
  - LS:MediationServer - Llamadas salientes(_Total)- Llamadas de omisión de medios activas
  Nota
  
  Debe introducir manualmente los contadores de rendimiento en el cuadro de texto. No aparecen como opciones en la lista desplegable.
  
  Para obtener más información, consulte Orígenes de datos de rendimiento de Windows y Linux en Log Analytics

Crear alertas

Hay dos tipos de alertas en OMS: número de alertas de resultados y alertas de medición métrica. Para obtener más información sobre cómo crear alertas, consulte Trabajar con reglas de alertas en Log Analytics.

Debe tener en cuenta lo siguiente al crear alertas:

Asegúrese de que la alerta sea una alerta de número de resultados, que es la selección predeterminada.
Las consultas de demostración requieren que "Número de resultados" se establezca en "Mayor que 0".
Se recomienda que establezca intervalo de tiempo y Frecuencia de alerta en 5 minutos.
Se recomienda no habilitar "Suprimir alertas" para las alertas de demostración.
Para escenarios típicos de alertas, Microsoft recomienda crear un par de alertas: una alerta de error y otra de restablecimiento. Para la alerta de error, seleccione nivel de gravedad Crítico; para la alerta de restablecimiento, seleccione Información de nivel de gravedad.

En las siguientes secciones se describe cómo crear alertas de ejemplo.

Cree un par de alertas: "RTCMEDSRV NO se está ejecutando en los servidores de mediación" y "RTCMEDSRV vuelve a ejecutarse en servidores de mediación"

Para crear este par de alertas:

La consulta para la alerta de error es:
```
Event | where Computer contains "MediationServer" | where EventLog == "Lync Server" and (EventID == 25002 or EventID == 25003)  | summarize arg_max(TimeGenerated, EventID) by Computer | where EventID == 25003
```
La consulta usa el filtro del equipo en el que el equipo contiene "MediationServer" . El filtro selecciona solo el equipo cuyo nombre contiene la cadena "MediationServer".

Reemplazaría el filtro por su propio filtro de equipo o lo quitaría. Puede crear filtros de cadena complejos sin expresiones regulares. También puede usar expresiones regulares. Además, puede crear un grupo de equipos guardando una consulta de búsqueda y usando ese grupo como filtro del equipo en la consulta de alertas. Para obtener más información, consulte Grupos de equipos en búsquedas de registro de Log Analytics.

Para cada equipo, la consulta de errores obtiene el último registro de eventos tanto para el inicio del servicio RTCMEDSRV como para el fin del servicio. Devolverá un registro si el último evento es el evento de parada del servicio; no devolverá nada si el último evento es el evento de inicio del servicio. En resumen, la consulta devolverá una lista de servidores cuyo RTCMEDSRV se detiene en el intervalo de tiempo.
La consulta para la alerta de restablecimiento es la siguiente:
```
Event | where Computer contains "MediationServer" | where EventLog == "Lync Server" and (EventID == 25002 or EventID == 25003) | summarize arg_max(TimeGenerated, EventID) by Computer  | where EventID == 2500
```
La consulta de restablecimiento hace exactamente lo contrario de la consulta de errores. Para cada equipo, devolverá uno si el último evento es el evento de inicio del servicio; no devolverá nada si el último evento es el evento de parada del servicio.

Crear un par de alertas: "Demasiadas llamadas simultáneas en los servidores de mediación" y "Las llamadas simultáneas vuelven a la carga normal"

Para crear esta alerta:

La consulta para la alerta de error es:
```
Perf | where Computer contains "MediationServer" | where (ObjectName == "LS:MediationServer - Outbound Calls" or ObjectName == "LS:MediationServer - Inbound Calls") | summarize arg_max(TimeGenerated, CounterValue) by ObjectName, Computer | summarize  TotalCalls = sum(CounterValue) by Computer| where TotalCalls >= 500
```
Para cada equipo, la consulta obtendrá los últimos contadores para llamadas entrantes y llamadas salientes y sumará esos dos valores. Devolverá un registro si el valor de la suma supera 500; no devolverá nada si no lo hace. En resumen, la consulta devolverá una lista de servidores cuyas llamadas simultáneas son demasiadas en el intervalo de tiempo.
La consulta para la alerta de restablecimiento es la siguiente:
```
Perf  | where Computer contains "MediationServer" | where (ObjectName == "LS:MediationServer - Outbound Calls" or ObjectName ==  "LS:MediationServer - Inbound Calls") | summarize arg_max(TimeGenerated, CounterValue) by ObjectName, Computer | summarize  TotalCalls = sum(CounterValue) by Computer| where TotalCalls < 500
```
La consulta de restablecimiento hace exactamente lo contrario de la consulta de errores. Para cada equipo, la consulta obtendrá los últimos contadores para llamadas entrantes y llamadas salientes y sumará esos dos valores. Devolverá un registro si el valor de suma es menor que 500; no devolverá nada de lo contrario.

Crear una alerta: alerta "CPU usage > 90 or RTCMEDIARELAY stopped in Servers" (Uso de CPU 90 o RTCMEDIARELAY detenido en servidores)

Para crear esta alerta, la consulta es:

search *| where Computer contains "MediationServer" | where (Type == "Perf" or Type == "Event") | where ((ObjectName ==  "Processor" and CounterName == "% Processor Time") or EventLog == "Lync Server") | where (CounterValue > 90 or EventID == 22003)

La consulta obtendrá todo el contador de uso del procesador y el evento de parada del servicio de todos los equipos y devolverá un registro si el uso del procesador supera el 90 % o si el servicio se detiene.

Analizar las alertas en el repositorio de Log Analytics

Para analizar las alertas de su repositorio, use la solución De administración de alertas. Para obtener más información, vea Solución de administración de alertas en Operations Management Suite (OMS)

Conjunto mínimo de supervisión recomendado

Para identificar problemas con los registros de eventos y los contadores de rendimiento:

Registros de eventos. Para cualquier problema, debe haber un par de eventos, con un conjunto de eventos para indicar que algo está mal, mientras que el otro indica que todo está bien. Para un período de tiempo determinado, es el último evento registrado que indicará si algo no es adecuado para ese período de tiempo.
Contadores de rendimiento. Debe haber un umbral para los contadores supervisados.

En la tabla siguiente se enumeran los servicios que Microsoft recomienda supervisar enumerando los identificadores de evento de parada e inicio:

Nombre del servicio	Rol de servidor de destino	Detener id. de evento	Id. de evento de inicio
RTCMEDSRV	Servidor de mediación	25003	25002
RTCSRV	Servidor perimetral	12289	12288
RTCMRAUTH	Servidor perimetral	19003	19002
RTCMEDIARELAY	Servidor perimetral	22003	22002

En la tabla siguiente se enumeran los problemas de red que Microsoft recomienda supervisar:

Nombre del monitor	Rol de servidor de destino	Expresión de id. de evento correcto	Ejemplo de error
Error de conectividad del servidor de mediación a la puerta de enlace	Servidor de mediación	25062	25002
Error al finalizar la llamada del servidor de mediación a la puerta de enlace	Servidor de mediación	25064	25002
Problemas de red críticos	Servidor perimetral	14353	12288

A continuación se enumeran los contadores de capacidad de llamada que se deben supervisar. Estos números deben ser menores que 500 para la edición estándar de Cloud Connector; menos de 50 para la edición mínima de Cloud Connector.

LS:MediationServer - Llamadas entrantes(_Total)- Current
LS:MediationServer - Llamadas salientes(_Total)- Current
LS:MediationServer - Llamadas entrantes(_Total)- Llamadas de omisión de medios activas
LS:MediationServer - Llamadas salientes(_Total)- Llamadas de omisión de medios activas

Vea también

Para obtener más información sobre cómo trabajar con OMS, consulte lo siguiente: