レッスン 1: Bike Buyer マイニング構造の作成

[アーティクル]
03/04/2017

対象: SQL Server 2016 Preview

このレッスンでは、Adventure Works Cycles の潜在顧客が自転車を購入するかどうかを予測するためのマイニング構造を作成します。マイニング構造とデータマイニングでのロールに慣れていない場合は、次を参照してください。マイニング構造と #40 です。Analysis Services - データマイニング )します。

このレッスンで作成する Bike Buyer マイニング構造に基づく追加のマイニングモデルをサポートしています、 Microsoft クラスタリングアルゴリズム Microsoft デシジョンツリーアルゴリズムします。後のレッスンでは、クラスターマイニングモデルを使用して顧客をグループ化するさまざまな方法を確認し、デシジョンツリーマイニングモデルを使用して潜在顧客が自転車を購入するかどうかを予測します。

CREATE MINING STRUCTURE ステートメント

使用するマイニング構造を作成する、マイニング構造の作成 #40; DMX ) ステートメントです。ステートメントのコードは、次の部分に分割できます。

構造の名前を指定します。
キー列を定義します。
マイニング列の定義
省略可能なテストデータセットの定義

CREATE MINING STRUCTURE ステートメントの汎用例を次に示します。

CREATE MINING STRUCTURE [<mining structure name>]  
(  
    <key column>,  
    <mining structure columns>  
)   
WITH HOLDOUT (<holdout specifier>)

コードの 1 行目では、構造の名前を定義します。

CREATE MINING STRUCTURE [<mining structure name>]

データマイニング拡張機能 (DMX) でオブジェクトを名前付け方法の詳細については、次を参照してください。識別子 #40; DMX )します。

コードの次の行では、マイニング構造のキー列を定義します。キー列は、ソースデータ内のエンティティを一意に識別します。

<key column>,

作成するマイニング構造では、顧客の識別子 CustomerKey でソースデータ内のエンティティが定義されます。

その次の行では、マイニング構造に関連付けられたマイニングモデルで使用される、マイニング列を定義します。

<mining structure columns>

内で DISCRETIZE 関数を使用するを次の構文を使用して、連続列を分離します。

DISCRETIZE(<method>,<number of buckets>)

列の分離の詳細については、次を参照してください。分離メソッド ( データマイニング )します。マイニング構造列に定義できるの種類の詳細については、次を参照してください。マイニング構造列します。

コードの最後の行では、マイニング構造の省略可能なパーティションを定義します。

WITH HOLDOUT (<holdout specifier>)

構造に関連するマイニングモデルのテストに使用するためにデータの一部を指定し、残りのデータはモデルのトレーニングに使用します。既定では、Analysis Services によって、全ケースデータの 30% から成るテストデータセットが作成されます。テストデータセットがケースの 30% になるように指定を追加します (最大 1000 ケース)。ケースの 30% が 1000 より小さい場合、テストデータセットの量はもっと少なくなります。

このレッスンの作業

このレッスンでは、次の作業を行います。

新しい空のクエリを作成します。
マイニング構造を作成するクエリを変更します。
クエリを実行します。

クエリを作成します。

最初の手順では、Analysis Services で、SQL Server Management Studio のインスタンスに接続して新しい DMX クエリを作成します。

SQL Server Management Studio で新しい DMX クエリを作成するには

SQL Server Management Studio を開きます。
サーバーへの接続 ] ダイアログボックスの サーバーの種類, [ Analysis Servicesします。 サーバー名, 、型 LocalHost, のインスタンスの名前を入力または Analysis Services このレッスンで接続します。 **[接続]**をクリックします。
オブジェクトエクスプローラー, のインスタンスを右クリックして Analysis Services, 、] をポイント 新しいクエリ, 、クリックして DMX を開くには、 クエリエディター と新しい空のクエリ。

クエリの変更

次の手順では、上の CREATE MINING STRUCTURE ステートメントを変更し、Bike Buyer マイニング構造を作成します。

CREATE MINING STRUCTURE ステートメントをカスタマイズするには

クエリエディターで、CREATE MINING STRUCTURE ステートメントの汎用例を空のクエリにコピーします。
次の部分を探します。
```
[<mining structure>]   
```
これを次の文字列に置き換えます。
```
[Bike Buyer]  
```
次の部分を探します。
```
<key column>   
```
これを次の文字列に置き換えます。
```
CustomerKey LONG KEY  
```

次の部分を探します。

<mining structure columns>

これを次の文字列に置き換えます。

[Age] LONG DISCRETIZED(Automatic,10),  
[Bike Buyer] LONG DISCRETE,  
[Commute Distance] TEXT DISCRETE,  
[Education] TEXT DISCRETE,  
[Gender] TEXT DISCRETE,  
[House Owner Flag] TEXT DISCRETE,  
[Marital Status] TEXT DISCRETE,  
[Number Cars Owned] LONG DISCRETE,  
[Number Children At Home] LONG DISCRETE,  
[Occupation] TEXT DISCRETE,  
[Region] TEXT DISCRETE,  
[Total Children]LONG DISCRETE,  
[Yearly Income] DOUBLE CONTINUOUS

次の部分を探します。

WITH HOLDOUT (holdout specifier>)

これを次の文字列に置き換えます。

WITH HOLDOUT (30 PERCENT or 1000 CASES)

最終的なマイニング構造のステートメントは次のようになります。

CREATE MINING STRUCTURE [Bike Buyer]  
(  
   [Customer Key] LONG KEY,  
   [Age]LONG DISCRETIZED(Automatic,10),  
   [Bike Buyer] LONG DISCRETE,  
   [Commute Distance] TEXT DISCRETE,  
   [Education] TEXT DISCRETE,  
   [Gender] TEXT DISCRETE,  
   [House Owner Flag] TEXT DISCRETE,  
   [Marital Status] TEXT DISCRETE,  
   [Number Cars Owned]LONG DISCRETE,  
   [Number Children At Home]LONG DISCRETE,  
   [Occupation] TEXT DISCRETE,  
   [Region] TEXT DISCRETE,  
   [Total Children]LONG DISCRETE,  
   [Yearly Income] DOUBLE CONTINUOUS  
)  
WITH HOLDOUT (30 PERCENT or 1000 CASES)

ファイル ] メニューのをクリックして 付けて DMXQuery1.dmx を保存します。
名前を付けて保存 ダイアログボックスで、適切なフォルダーに移動し、ファイル名 Bike Buyer Structure.dmxします。

クエリの実行

最後の手順では、クエリを実行します。クエリを作成して保存したら、そのクエリを実行する必要があります。つまり、サーバーでマイニング構造を作成するには、ステートメントを実行する必要があります。クエリエディターでクエリの実行の詳細については、次を参照してください。データベースエンジンクエリエディターと #40 です。SQL Server Management Studio と #41;します。

クエリを実行するには

クエリエディターで、ツールバーで、クリックして Executeします。

クエリの状態が表示される、 メッセージ ステートメントの実行完了後のクエリエディター下部にあるタブをクリックします。この場合次のメッセージが表示されます。
```
Executing the query   
Execution complete  
```
という名前の新しい構造 Bike Buyer がサーバーに存在するようになりました。

次のレッスンでは、作成した構造にマイニングモデルを追加します。

次のレッスン

レッスン 2: Bike Buyer マイニング構造へのマイニングモデルの追加