SharePoint Server でカスタム エンティティ抽出を作成および展開する

適用対象:yes-img-13 2013yes-img-162016 yes-img-192019 yes-img-seSubscription Edition no-img-sopSharePoint in Microsoft 365

カスタム エンティティ抽出機能を検索システムで使用するには、SharePoint Serverにインポートする前に、SharePoint Serverの外部のシステムで、カスタム エンティティ抽出機能ファイルを作成して管理する必要があります。

クラシック検索でカスタム エンティティを絞り込み条件として使用するには、最初にカスタム エンティティ抽出ディクショナリを作成してデプロイします。 次に、カスタム エンティティ抽出機能を使用するように管理プロパティを構成し、フル クロールを実行します。 その後、検索結果ページで絞り込み Web パーツを構成すると、カスタム エンティティを絞り込み条件として使用できます。

開始する前に

この操作を開始する前に、次の準備が必要です。

  • Search service アプリケーション

  • 完全にクロールされた 1 つまたは複数のコンテンツ ソース

  • 検索結果ページ

カスタム エンティティ抽出辞書を作成する

カスタム エンティティ抽出辞書を作成するには

  1. 完全一致、部分一致、完全一致 (大文字小文字区別)、または部分一致 (大文字小文字区別) のうち、作成するカスタム エンティティ抽出辞書の種類を決定します。 詳細については、「カスタム エンティティ抽出機能の種類の概要」を参照してください。

  2. [ キー ] 列と [ Display Form ] 列を持つ .csv ファイルを作成します。 列の区切り文字にはコンマを使用します。 ファイルにアクセント記号のような ASCII 以外の文字が含まれる場合は、UTF-8 でエンコードする必要があります。 このファイルは、Microsoft PowerShell コマンドレットを実行してカスタム エンティティ抽出辞書を展開する際の展開元サーバーからアクセス可能な場所に保存します。

    • [ キー ] 列に、カスタム エンティティとして使用する用語 (単一または複数の単語) を入力します。 各キーに 1 行以上使用できます。 用語の前後にスペースが入らないようにしてください。

    • (オプション) [ Display Form ] 列に、絞り込み条件の名前を入力します。 この列を空にすると、コンテンツから抽出される用語は、コンテンツ内での形式と同じ形式 (大文字と小文字の区別) で絞り込み条件として表示されます。 [ Display Form] 列を使用すると、絞り込み条件の表示形式を制御および正規化できます。

たとえば、Contoso という名前の組織には、Contoso Beginner、Contoso Professional、Contoso Expert という 3 つのレベルの証明書システムがあります。 Contoso 社はこれらのエンティティを抽出し、すべてを絞り込みの対象にすることを希望しています。 また、"Contoso"、"beginner"、"professional" または "expert" という単語の大文字小文字に関係なく、絞り込み条件を [ Contoso Beginner ]、[ Contoso Professional ] および [ Contoso Expert ] と表示することを望んでいます。 この例では、カスタム エンティティ抽出辞書ファイルの入力は次のようになります。

Key,Display form
Contoso Beginner,Contoso Beginner
Contoso B1,Contoso Beginner
Contoso Professional,Contoso Professional
Contoso prof,Contoso Professional
Contoso Expert,Contoso Expert

カスタム エンティティ抽出辞書を展開する

カスタム エンティティ抽出辞書を展開するには、SharePoint Server にインポートする必要があります。

カスタム エンティティ抽出辞書をインポートするには

  1. カスタム エンティティ抽出辞書をインポートしているユーザー アカウントが Search Service アプリケーションの管理者であることを確認してください。

  2. SharePoint 管理シェルを起動します。

  3. Windows PowerShell コマンド プロンプトで、次のコマンドを入力します。

    $searchApp = Get-SPEnterpriseSearchServiceApplication
    Import-SPEnterpriseSearchCustomExtractionDictionary -SearchApplication $searchApp -Filename <Path> -DictionaryName <Dictionary name> 
    
    

    詳細は次のとおりです。

    • <Path> はインポートする .cvs ファイル (カスタム抽出辞書) の完全な UNC パスです。

    • <Dictionary name> はカスタム抽出辞書の種類の名前です。

    インポートする辞書の種類に応じて、以下のいずれかを入力します。

    • Microsoft.UserDictionaries.EntityExtraction.Custom.Word。 n [ここで、n = 1、2、3、4、または 5]

    • Microsoft.UserDictionaries.EntityExtraction.Custom.ExactWord.1

    • Microsoft.UserDictionaries.EntityExtraction.Custom.WordPart。 n [ここで、n = 1、2、3、4、または 5]

    • Microsoft.UserDictionaries.EntityExtraction.Custom.ExactWordPart.1

カスタム エンティティ抽出を使用するように管理プロパティを構成する

次の手順では、カスタム エンティティ抽出ディクショナリを、カスタム エンティティを抽出する既存の管理プロパティに関連付ける方法について説明します。 通常、これは、管理プロパティ TitleBody などのこれらのエンティティを含むマネージド プロパティです。 カスタム エンティティは、関連付けられている管理プロパティの完全な内容から抽出されます。これらのコンテンツ内のセクションにインデックス>が付<けられていない場合でも。

カスタム エンティティの抽出元となる既存の管理プロパティを指定するには、既存の管理プロパティを編集します。 クロールされたプロパティと管理プロパティの管理の詳細については、「SharePoint Server で検索スキーマを管理する」を参照してください。

カスタム エンティティ抽出を使用するように管理プロパティを編集するには

  1. ユーザー アカウントが Search Service アプリケーションの管理者であることを確認します。

  2. サーバーの全体管理の [ アプリケーション構成の管理] セクションで、[ サービス アプリケーションの管理] をクリックします。

  3. Search Service アプリケーションをクリックします。

  4. [検索管理] ページのサイド リンク バーで、[ クエリと結果] の [ 検索スキーマ] をクリックします。

  5. [ 管理プロパティ] ページで、単語または複数語 (または部分一致) を含むカスタム エンティティ抽出辞書と関連付ける管理プロパティを検索します。 [ フィルター] ボックスに検索対象の管理プロパティの名前を入力することもできます。

  6. 管理プロパティをポイントし、矢印をクリックして、[ プロパティの編集/マップ] をクリックします。

  7. [管理プロパティの編集] ページで、[ カスタム エンティティの抽出] の設定を編集します。 インポートしたカスタム エンティティ抽出辞書を選択して、[ OK] をクリックします。

次のフル クロールが完了すると、カスタム エンティティ抽出機能が有効になります。 元の管理プロパティコンテンツは、検索インデックスに変更されずに保存されます。 さらに、有効にしたカスタム エンティティ抽出器の種類に応じて、抽出されたエンティティは次の管理プロパティの 1 つ以上にコピーされます。

  • WordCustomRefiner1
  • WordCustomRefiner2
  • WordCustomRefiner3
  • WordCustomRefiner4
  • WordCustomRefiner5
  • WordExactCustomRefiner
  • WordPartCustomRefiner1
  • WordPartCustomRefiner2
  • WordPartCustomRefiner3
  • WordPartCustomRefiner4
  • WordPartCustomRefiner5
  • WordPartExactCustomRefiner

これらの管理プロパティは、検索可能、クエリ可能、取得可能、並べ替え可能、絞り込み可能に自動的に構成されます。

Web パーツの絞り込み条件を構成する

検索結果ページで、抽出したカスタム エンティティを絞り込み条件として使用できます。 カスタム エンティティに基づく絞り込み条件は、絞り込み Web パーツで使用できます。

カスタム エンティティ抽出機能に基づく絞り込み条件を追加するには

  1. この手順を実行するユーザー アカウントが、エンタープライズ検索センター サイトの編集者 SharePoint グループのメンバーであることを確認します。

  2. 構成する絞り込み Web パーツが含まれているページを参照し、[ 設定] メニューの [ ページの編集] をクリックします。

  3. 絞り込み Web パーツを編集します。 [ 検索結果の絞り込み Web パーツ メニュー] の矢印をクリックし、[ Web パーツの編集] をクリックします。

    • Web パーツ ツール ウィンドウの [ 絞り込み条件のプロパティ] セクションで、[ この Web パーツでの絞り込み条件を選択] が選択されていることを確認します。

    • [ 絞り込み条件の選択] をクリックします。

    • 絞り込み構成ページの [使用できる絞り込み条件] セクションで、ボタンを使用して、絞り込み条件として表示する抽出されたエンティティを含む 1 つ以上の管理プロパティを一覧から選択し、[ 追加] をクリックします。 たとえば、完全一致抽出辞書を展開した場合は、 WordCustomRefiner1 を選択します。

    • [ 構成の対象] セクションで、各絞り込み条件の表示方法を構成します。

  4. [OK] をクリックします。

カスタム エンティティ抽出機能の種類の概要

次の表は、作成できるユーザー設定の抽出ディクショナリの種類と、検索インデックス内のコンテンツと辞書エントリの照合方法、ディクショナリを展開するときに使用する辞書名、抽出されたエンティティを含む管理プロパティを示しています。


カスタム エンティティ抽出機能/カスタム エンティティ抽出機能の辞書 説明 Windows PowerShell で使用する辞書の名前 抽出されたエンティティを含む管理プロパティ
完全一致抽出 大文字小文字は区別しない、辞書のエントリとトークン化されたコンテンツを照合、最大 5 つの辞書。 エントリ「anchor」は、「anchor」と「Anchor」に一致するが、「anchorage」とは一致しない Microsoft.UserDictionaries.EntityExtraction.Custom.Word.n [ここで n = 1,2,3,4 または 5] WordCustomRefiner1 WordCustomRefiner2 WordCustomRefiner3 WordCustomRefiner4 WordCustomRefiner5
部分一致抽出 大文字小文字は区別しない、辞書のエントリとトークン化されていないコンテンツを照合、最大 5 つの辞書。 エントリ「anchor」は、「anchor」、「Anchor」、および「anchorage」に一致する Microsoft.UserDictionaries.EntityExtraction.Custom.WordPart.n [ここで n = 1,2,3,4 または 5] WordPartCustomRefiner1 WordPartCustomRefiner2 WordPartCustomRefiner3 WordPartCustomRefiner4 WordPartCustomRefiner5
完全一致抽出 (大文字小文字区別) 大文字小文字を区別する、辞書のエントリとトークン化されたコンテンツを照合、最大 1 つの辞書。 エントリ「anchor」は「anchor」に一致するが、「Anchor」および「Anchorage」とは一致しない Microsoft.UserDictionaries.EntityExtraction.Custom.ExactWord.1 WordExactCustomRefiner
部分一致抽出 (大文字小文字区別) 大文字小文字を区別する、辞書のエントリとトークン化されていないコンテンツを照合、最大 1 つの辞書。 エントリ「anchor」は「anchor」と「anchorage」に一致するが、「Anchor」とは一致しない Microsoft.UserDictionaries.EntityExtraction.Custom.ExactWordPart.1 WordPartExactCustomRefiner

関連項目

Import-SPEnterpriseSearchCustomExtractionDictionary