關於關鍵字篩選清單語法規則

 

主題上次修改日期: 2010-01-19

以下是關鍵字篩選清單的語法規則。 請小心使用適當的語法,因為 Forefront Protection 2010 for SharePoint 不會執行驗證。 如果篩選結果不是您所預期的,建議您再仔細檢查語法。

  • 每個項目 (文字行) 都視為搜尋查詢。

  • 查詢會使用 OR 運算子。 若有任何項目相符,則將其視為有效的偵測。

  • 查詢是由運算元 (關鍵字) 組成,也就是文字語彙基元或文字語彙基元的字串,例如:

    • apple (表示包含 “apple” 的文字)

    • apple juice (表示包含 “apple juice” 的文字)

    • get rich quick (表示包含 “get rich quick” 的文字)

  • 查詢還能包含運算子,運算子位於運算式中的運算元之前,或者用來區隔運算元。

  • 運算式可以由單一運算元、位於 _NOT_ 或 _HAS[#]OF_ 運算子之後的運算元,或者藉由 _AND_、_ANDNOT_ 或 _WITHIN[#]OF_ 運算子合併的兩個運算元組成。

    運算式中支援的邏輯運算子如下。 運算子與運算元 (或另一個運算子) 之間需要一個空格,在下列範例中以 • 字元表示:

    • _AND_ (邏輯 AND)。 例如,apples•_AND_•oranges。 如果文字包含 “apples” 和 “oranges” 兩者,就符合這類篩選。

    • _NOT_ (否定)。 例如,_NOT_•oranges。 如果文字不含 “oranges”,就符合這類篩選。

    • _ANDNOT_ (邏輯 AND 否定)。 例如,apples•_ANDNOT_•oranges。 如果文字包含 “apples” 但不含 “oranges”,就符合這類篩選。 _ANDNOT_ 的作用與 _AND_•_NOT_ 相等。

    • _HAS[#]OF_ (頻率)。 指定文字必須顯示最少幾次,查詢才為真。 例如,_HAS[4]OF_•get rich quick。 如果片語「get rich quick」在文字中出現 4 次以上,則此查詢為真。 如果未指定此運算子的值,則預設值為 1。

    • _WITHIN[#]OF_ (近似)。 如果兩個詞彙落在彼此之後或之前的特定字元數目之間,即為相符。 例如,free•_WITHIN[10]OF_•offer 如果 "free" 在 "offer" 之前或之後 10 個字元範圍內,則此查詢為真。 _WITHIN[0]OF_ 會忽略關鍵字之間的距離,而且其行為就如同 _AND_ 運算子。 在此情況下,如果這兩個關鍵字都存在,就表示符合篩選。

    單一查詢中允許多個運算子。 運算子的優先順序如下 (最高到最低):

    • _WITHIN[#]OF_

    • _HAS[#]OF_

    • _NOT_、_AND_ 和 _ANDNOT_ (三者的優先順序都相同,因為都是用來與運算式的一部分搭配使用)

    使用括弧並無法覆寫此優先順序。 其他考量如下:

    • 邏輯運算子必須以大寫字母輸入。

    • 片語可以當成關鍵字使用。 例如,apple juice 或 get rich quick。 不使用引號。

    • 多個空格 (空白字元、換行字元、歸位字元、水平定位點及垂直定位點) 都將視為一個空格,以便進行比對。 例如,A••••B 會視為 A•B,並與片語 A•B 相符。

    • 在 HTML 編碼郵件文字中,標點符號 (任何非英數字元) 視為類似空格的文字分隔字元。 因此,透過篩選可正確識別由 HTML 標記包圍的文字。 不過,請注意「<html>」篩選會比對「<html>」,而不是「html」。

範例 (• 字元代表一個空格):

  • apples•_AND_•oranges•_AND_•lemons•_WITHIN[50]OF_•juice

    這個運算式表示 “apples”、“oranges” 和 “lemons” 都至少出現一次,而且 “lemons” 位於 “juice” 之前或之後 50 個字的範圍內。

  • confidential•_WITHIN[10]OF_•project•_AND_•banana•_WITHIN[25]OF_•shake

    這個運算式表示 “confidential” 位於 “project” 之前或之後 10 個字的範圍內,而且 “banana” 位於 “shake” 之前或之後 25 個字的範圍內。

  • _HAS[2]OF_•get rich•_WITHIN[20]OF_•quick

    這個運算式表示 “get rich” 至少出現 2 次,而且位於 “quick” 之前或之後 20 個字的範圍內。

 
顯示: