EWS 运行状况设置疑难解答

项目
04/04/2023

适用于：Exchange Server 2013

Exchange Web Services (EWS) 运行状况集监视 EWS 服务的整体运行状况。 EWS 运行状况集与以下运行状况集密切相关：

如果收到一条警报，指出 EWS 不正常，则表示存在可能阻止用户与 Exchange 服务器通信的问题。

说明

EWS 通过以下探测器和监视器进行监视。

探针	运行状况设置	相关性	关联监视器
EwsCtpProbe	EWS	信息存储 Active Directory 域服务 (AD DS)	EwsCtpMonitor（EWS 运行状况设置）
EwsSelfTestProbe	EWS。协议	Active Directory 域服务 (AD DS)	EWSSelfTestMonitor
EwsDeepTestProbe	EWS。协议	信息存储	EWSDeepTestMonitor

该探测器使用监视帐户，执行从客户端访问服务器 (CAS) 到邮箱服务器的完整 EWS 登录过程。该探测器调用 EWS 上的 GetFolder 方法。有关探测和监视器的详细信息，请参阅服务器运行状况和性能。

常见问题

探测器运行失败的常见原因可能包括：

探测器使用的身份验证机制和 CAS 虚拟目录上使用的身份验证机制之间存在不匹配的情况。
正在监视的 CAS 中的 EWS 应用程序池未响应。
CAS 在连接到邮箱服务器时遇到网络问题。
CAS 在连接到域控制器时遇到通信问题。
域控制器没有响应。
驻留在一个或多个邮箱服务器上的 EWS 应用程序池未响应。
用户的数据库未装载，或者信息存储对特定邮箱不可用。
一个或多个邮箱服务器上的信息存储遇到问题。

用户操作

发出警报后服务可能会恢复。因此，当您接收到指示运行状况设置不正常的警报时，首先要验证该问题是否仍然存在。若问题确实存在，执行以下部分介绍的相应恢复操作。

验证问题是否仍然存在

识别警报中的运行状况设置名称和服务器名称。

收到来自运行状况设置的警报时，电子邮件将包含以下信息：
1. 产生警报的 CAS 名称
2. 探测器作为目标资源监视的邮箱服务器名称
3. 上一个错误的全部异常跟踪，包括诊断数据和特定 HTTP 头信息
4. 事件发生的时间
5. 所用的身份验证机制，以及凭据信息
异常跟踪信息提供关于探测器运行失败原因的最重要线索。升级邮件也包含以下 HTTP 头：
1. X-FEServer：指示在哪个 CAS 上运行探测
2. X-TargetBEServer：指示将请求路由到的 MBX 服务器
3. X-DiagInfo：指示接收请求的 MBX 服务器
邮件详细信息提供了有关确切警报原因的信息。大部分情况下，邮件详细信息会提供充足的故障排除信息，用于识别根本原因。如果邮件详细信息不明确，请执行以下操作：
1. 打开 Exchange 命令行管理程序，然后运行以下命令，检索发出警报的运行状况集的详细信息：
```
Get-ServerHealth <server name> | ?{$_.HealthSetName -eq "<health set name>"}
```
  例如，若要检索 server1.contoso.com 上 EWS 运行状况设置的详细信息，运行以下命令：
```
Get-ServerHealth server1.contoso.com | ?{$_.HealthSetName -eq "EWS"}
```
2. 检查命令输出，以确定报告错误的监视器。发出警报Unhealthy的监视器的 AlertValue 值为。
3. 为处于不正常状态的监视器重新运行关联的探测。请参阅Explanation部分中的表格，找到关联探测器。为此，请运行下列命令：
```
Invoke-MonitoringProbe <health set name>\<probe name> -Server <server name> | Format-List
```
  对于 EWS 运行状况设置，假定故障监视器为“EWSCtpMonitor”。与该监视器关联的探测器是“EWSCtpProbe”。要在 server1.contoso.com 上运行该探测器，请运行以下命令：
```
Invoke-MonitoringProbe EWS\EWSCtpProbe -Server server1.contoso.com | Format-List
```
4. 在命令输出中，检查探测器的“结果”值。如果值为“成功”，则该问题是暂时性错误，且不再存在。否则，请参阅以下部分列出的恢复步骤。

EwsCtpMonitor 恢复操作

启动 IIS 管理器，然后连接到报告问题的服务器，以确定 MSExchangeServicesAppPool 应用程序池是否同时在 CA 和邮箱服务器上运行。
找到不正常探测器的 MailboxDatabase。然后验证邮箱服务器的邮箱数据库是否可用，以及信息存储是否处于正常状态。
单击“ 应用程序池”，然后运行以下命令回收 MSExchangeServicesAppPool 应用程序池：
```
%SystemRoot%\System32\inetsrv\Appcmd recycle MSExchangeServicesAppPool
```
按照Verifying the issue still exists部分的步骤 2c 所示，重新运行关联探测器。
如果问题仍然存在，使用 IISReset 实用程序对整个 IIS 服务进行再循环。
按照Verifying the issue still exists部分的步骤 2c 所示，重新运行关联探测器。
如果问题仍然存在，请查看 CA 和邮箱服务器上的协议日志文件。 CAS 的协议日志驻留在 %ExchangeInstallPath%Logging\HttpProxy\Ews 文件夹中。在邮箱服务器上，日志驻留在 %ExchangeInstallPath%Logging\Ews 文件夹中。
创建一个测试用户帐户，然后使用此测试用户帐户登录给定的 CAS。例如，使用登录： https://<servername>/ews/exchange.asmx。如果问题仍然存在，则尝试不同的 CAS，以确定问题是否限于 CAS，而不涉及邮箱服务器。如果测试用户名通过，则问题可能会影响监视邮箱所在的特定邮箱数据库或邮箱服务器。使用邮箱数据库中现有的测试帐户尝试重复此步骤。
检查 CA 和邮箱服务器之间的网络连接。
检查 EWS.Proxy 运行状况设置上是否有任何警报可能指示影响特定 CAS 的问题。
检查 EWS.Protocol 运行状况设置上是否有任何警报可能指示影响特定邮箱服务器的问题。
如果问题仍然存在，重新启动服务器。为此，请首先对服务器托管的数据库进行故障转移。为此，请运行下列命令：
```
Set-MailboxServer server1.contoso.com -DatabaseCopyActivationDisabledAndMoveNow $true
```
注意：在此和所有后续代码示例中， 将 server1.contoso.com 替换为实际的服务器名称。
验证是否已将所有数据库从报告问题的服务器上删除。为此，请运行下列命令：
```
Get-MailboxDatabaseCopyStatus -Server server1.contoso.com | Group Status
```
如果命令输出显示服务器中无有效副本，则重新启动服务器。
服务器重新启动后，按照Verifying the issue still exists部分的步骤 2c 所示，重新运行关联探测器。
如果探测器运行成功，则通过以下命令将数据库故障转移回邮箱服务器。
```
Set-MailboxServer server1.contoso.com -DatabaseCopyActivationDisabledAndMoveNow $false
```
如果探测器仍然无法运行，可能需要通过协助来解决此问题。若要解决此问题，请与 Microsoft 技术支持人员联系。若要联系Microsoft 支持部门专业人员，请访问业务支持，然后选择“服务器>Exchange Server”。由于你的组织可能已制定了直接与 Microsoft 产品支持服务联系的特定流程，因此，请务必先查看你组织的准则。

详细信息

Exchange PowerShell

Exchange 2013 最近更新