レッスン 1: Bike Buyer マイニング構造の作成
対象: SQL Server 2016 Preview
このレッスンでは、Adventure Works Cycles の潜在顧客が自転車を購入するかどうかを予測するためのマイニング構造を作成します。 マイニング構造とデータ マイニングでのロールに慣れていない場合は、次を参照してください。 マイニング構造と #40 です。Analysis Services - データ マイニング )します。
このレッスンで作成する Bike Buyer マイニング構造に基づく追加のマイニング モデルをサポートしています、 Microsoft クラスタ リング アルゴリズムMicrosoft デシジョン ツリー アルゴリズムします。 後のレッスンでは、クラスター マイニング モデルを使用して顧客をグループ化するさまざまな方法を確認し、デシジョン ツリー マイニング モデルを使用して潜在顧客が自転車を購入するかどうかを予測します。
CREATE MINING STRUCTURE ステートメント
使用するマイニング構造を作成する、 マイニング構造の作成 #40; DMX ) ステートメントです。 ステートメントのコードは、次の部分に分割できます。
構造の名前を指定します。
キー列を定義します。
マイニング列の定義
省略可能なテスト データセットの定義
CREATE MINING STRUCTURE ステートメントの汎用例を次に示します。
CREATE MINING STRUCTURE [<mining structure name>]
(
<key column>,
<mining structure columns>
)
WITH HOLDOUT (<holdout specifier>)
コードの 1 行目では、構造の名前を定義します。
CREATE MINING STRUCTURE [<mining structure name>]
データ マイニング拡張機能 (DMX) でオブジェクトを名前付け方法の詳細については、次を参照してください。 識別子 #40; DMX )します。
コードの次の行では、マイニング構造のキー列を定義します。キー列は、ソース データ内のエンティティを一意に識別します。
<key column>,
作成するマイニング構造では、顧客の識別子 CustomerKey
でソース データ内のエンティティが定義されます。
その次の行では、マイニング構造に関連付けられたマイニング モデルで使用される、マイニング列を定義します。
<mining structure columns>
内で DISCRETIZE 関数を使用する を次の構文を使用して、連続列を分離します。
DISCRETIZE(<method>,<number of buckets>)
列の分離の詳細については、次を参照してください。 分離メソッド ( データ マイニング )します。 マイニング構造列に定義できるの種類の詳細については、次を参照してください。 マイニング構造列します。
コードの最後の行では、マイニング構造の省略可能なパーティションを定義します。
WITH HOLDOUT (<holdout specifier>)
構造に関連するマイニング モデルのテストに使用するためにデータの一部を指定し、残りのデータはモデルのトレーニングに使用します。 既定では、Analysis Services によって、全ケース データの 30% から成るテスト データセットが作成されます。 テスト データセットがケースの 30% になるように指定を追加します (最大 1000 ケース)。 ケースの 30% が 1000 より小さい場合、テスト データセットの量はもっと少なくなります。
このレッスンの作業
このレッスンでは、次の作業を行います。
新しい空のクエリを作成します。
マイニング構造を作成するクエリを変更します。
クエリを実行します。
クエリを作成します。
最初の手順では、Analysis Services で、SQL Server Management Studio のインスタンスに接続して新しい DMX クエリを作成します。
SQL Server Management Studio で新しい DMX クエリを作成するには
SQL Server Management Studio を開きます。
サーバーへの接続 ] ダイアログ ボックスの サーバーの種類, [ Analysis Servicesします。 サーバー名, 、型 LocalHost, のインスタンスの名前を入力または Analysis Services このレッスンで接続します。 **[接続]**をクリックします。
オブジェクト エクスプ ローラー, のインスタンスを右クリックして Analysis Services, 、] をポイント 新しいクエリ, 、クリックして DMX を開くには、 クエリ エディター と新しい空のクエリ。
クエリの変更
次の手順では、上の CREATE MINING STRUCTURE ステートメントを変更し、Bike Buyer マイニング構造を作成します。
CREATE MINING STRUCTURE ステートメントをカスタマイズするには
クエリ エディターで、CREATE MINING STRUCTURE ステートメントの汎用例を空のクエリにコピーします。
次の部分を探します。
[<mining structure>]
これを次の文字列に置き換えます。
[Bike Buyer]
次の部分を探します。
<key column>
これを次の文字列に置き換えます。
CustomerKey LONG KEY
次の部分を探します。
<mining structure columns>
これを次の文字列に置き換えます。
[Age] LONG DISCRETIZED(Automatic,10), [Bike Buyer] LONG DISCRETE, [Commute Distance] TEXT DISCRETE, [Education] TEXT DISCRETE, [Gender] TEXT DISCRETE, [House Owner Flag] TEXT DISCRETE, [Marital Status] TEXT DISCRETE, [Number Cars Owned] LONG DISCRETE, [Number Children At Home] LONG DISCRETE, [Occupation] TEXT DISCRETE, [Region] TEXT DISCRETE, [Total Children]LONG DISCRETE, [Yearly Income] DOUBLE CONTINUOUS
次の部分を探します。
WITH HOLDOUT (holdout specifier>)
これを次の文字列に置き換えます。
WITH HOLDOUT (30 PERCENT or 1000 CASES)
最終的なマイニング構造のステートメントは次のようになります。
CREATE MINING STRUCTURE [Bike Buyer] ( [Customer Key] LONG KEY, [Age]LONG DISCRETIZED(Automatic,10), [Bike Buyer] LONG DISCRETE, [Commute Distance] TEXT DISCRETE, [Education] TEXT DISCRETE, [Gender] TEXT DISCRETE, [House Owner Flag] TEXT DISCRETE, [Marital Status] TEXT DISCRETE, [Number Cars Owned]LONG DISCRETE, [Number Children At Home]LONG DISCRETE, [Occupation] TEXT DISCRETE, [Region] TEXT DISCRETE, [Total Children]LONG DISCRETE, [Yearly Income] DOUBLE CONTINUOUS ) WITH HOLDOUT (30 PERCENT or 1000 CASES)
ファイル ] メニューのをクリックして 付けて DMXQuery1.dmx を保存します。
名前を付けて保存 ダイアログ ボックスで、適切なフォルダーに移動し、ファイル名 Bike Buyer Structure.dmxします。
クエリの実行
最後の手順では、クエリを実行します。 クエリを作成して保存したら、そのクエリを実行する必要があります。 つまり、サーバーでマイニング構造を作成するには、ステートメントを実行する必要があります。 クエリ エディターでクエリの実行の詳細については、次を参照してください。 データベース エンジン クエリ エディターと #40 です。SQL Server Management Studio と #41;します。
クエリを実行するには
クエリ エディターで、ツールバーで、クリックして Executeします。
クエリの状態が表示される、 メッセージ ステートメントの実行完了後のクエリ エディター下部にあるタブをクリックします。 この場合次のメッセージが表示されます。
Executing the query Execution complete
という名前の新しい構造 Bike Buyer がサーバーに存在するようになりました。
次のレッスンでは、作成した構造にマイニング モデルを追加します。