ビジネス インテリジェンス

最初に Microsoft BI ソリューションの計画

Stacia Misner

 

概要。

  • BI の概要
  • 企業のデータベースに関する一般的な問題を回避します。
  • Microsoft BI スタックを通じて
  • 単純なソリューションをビルド

内容

BI とは何か
企業内のデータベース クエリの実行に問題が発生しい次のうちどれですか。
判断加えようのサポート
BI の動作
Microsoft BI スタック
ソリューションの開発に、アプローチ
開始
次の手順

ほとんどは、管理者 (DBA) haveencountered を何らかのビジネス インテリジェンス (BI)、組織のデータと Microsoft SQL Server の実装の管理中にデータベースします。 多くの IT 技術者、データベース管理者の責任を持っていない BI の聞いた可能性がありますと直接経験したりしないでくださいでも実際には何を知る。 この記事では、に関するすべての fuss がわかります。 BI テクノロジできます実際の操作を行います、Microsoft BI プラットフォーム上の BI ソリューションの構築方法を参照して、理解すると BI いない DBA の理由がわかります。 なります BI について知るなら、組織をサポートする優れたの位置の BI イニシアチブもらいとにしても実現 BI を使って追跡をジョブを簡単およびそのデータの理解度を deepening、ロールに関連データを分析でく方法。

この資料では、一連の Microsoft BI スタックを紹介した記事の最初です。 初期ここでは、BI を定義するし用語から一般に、BI ソリューションの高度なアーキテクチャを説明します。 洞察によって、BI ソリューションのビルドのプロセス。 この資料に記載された SQL Server BI テクノロジを詳しくお読みのコンパニオン Derek Comingore によってこの問題 (を参照してください"で記述された記事 BI ソリューションのデータの基盤を構築します。") Scot Reagin と今後の問題に表示します。

BI とは何か

数年前、私は驚くで厳密な方法 [ピア disagreed に関するテクノロジ考慮すべき BI のドメイン内で、ブックの範囲内と Business Intelligence: Making Better Decisions Faster (マイクロソフト プレス、2002年、) を coauthoring するが中にします。 BI ツールを検討するどのツールおよびが除外されるに関する BI 担当者間の分岐ような意見を聞くに enlightening、エクスペリエンスでした。 この意見の違いは、IT 業界内がまだ存在し、BI の定義を討議多く続けます。 私には、BI はできるだけビジネス プロセスに関する BI その観点から定義を開始するため、テクノロジの詳細についてです。

ビジネス プロセス、としてと BI は一連活動を収集してより良い決定を下すして、分析の結果を他のユーザーと共有、ビジネスを改善できるようにデータを分析するを実行するのです。 日常的なルーチンを効率化する方法または長期計画、来年度の予算などをサポートする方法を決定する情報が必要かどうかを検索、転送、書式設定およびデータを調査する手順はすべて BI の一部です。 加え、BI を使用してや他のユーザーは、データを調べる後に行った決定の影響を測定できるように、結果を後で参照できるようにするプロセス含まれています。 通常、BI は反復的なプロセスです。 データ分析して、起こった、良い点保持発生させる対処して不正な処理の停止、および確認するし、後でデータを分析かどうか、アクション行わ点より良いまたは悪いおよび外部要因を役立ちましたか、作業を妨害するかを決定します。

BI の広範なこの定義を与え、使用する BI 取るビット情報の下または日中の決定を下すようにリストの作成しているときにもします。 使用して収集するビジネス プロセスの一部またはすべてへのテクノロジの導入、分析行い共有情報できるこれらのプロセスより効率的です。 多くの場合、その特定の問題を解決する一見使用、BI テクノロジを採用するときに始めは小さな組織傾向があります。 、時間の経過と共に BI テクノロジの使用につれて増分情報、組織全体で効率的に地域宣伝などに、強調が移動します。 ごとに、BI 戦略が解決しないと、組織は通常大きい対話とデータの探索を有効にするより高度なツールを取得します。

企業内のデータベース クエリの実行に問題が発生しい次のうちどれですか。

BI の任意の定義のデータは常に、中心点です。 可能性がありますが wondering も要求する必要があるデータを取得する、組織のデータベースの 1 つ以上を照会できるときに、BI ソリューションを作成するようなことが必要な理由です。 ツール、スキルと、企業データベースへのセキュリティ特権がある場合のデータを収集している、唯一コンシューマーいるし、必要なすべてのデータがそのソース場合、おそらく必要はありません、正式な BI ソリューション。 対照的に、定期的に情報を他の技術的なスキルとセキュリティ特権を異なるユーザーと共有する場合作成する、BI ソリューションが簡単に使用および管理します。 こと仲間聞こえてこの便利な BI ソリューションの詳細については、1 回、使用する、すぎるを検討する必要があります。 この要求を予測するには、ソリューションが先頭からスケーラブルなあります。

表面上、良い考えのように思われて、企業のデータベースからデータを取得するレポートを実行する会社ですべてのユーザーを許可はこのアプローチ可能性がありますされません、DBA と非常に人気のあります。 これらがわかる、として、企業のデータベースを直接照会以上、いくつかの問題に取得できます。 ここでは、一部の一般的なものです。

  • さまざまな形式で異なるプラットフォームでの組織のデータは保存される場合は、分析に役立つ一般的な形式にデータを統合する指定難しいできます。 データ ソースのテーブルから直接、共通のターゲット テーブルにコピーできませんが格納の前に何らかの方法で操作します。
  • データ定義の選択] 複数のデータベースを一貫性のあるならないありのように表示されるデータを調整できますづらいがあります。 たとえば、販売データベース内の収益 1 つの一連のビジネス規則に従って計算される可能性がありますが、まったく別の対象に設定する総勘定元帳データベース内のビジネス ルールの。
  • 各データベースは可能性があります構造し、データを挿入または照合を行うために最適化します。 必要 1 つだけデータベースを照会する場合でも、通常、分析クエリを実行な大量のデータ、データベース リソースの面で高価な操作の。 クエリできます実行を可能時間がその結果、かかる他のアプリケーションを実行するとリソースの挿入、更新またはルックアップ操作の競合を作成します。
  • 履歴データは、多くの場合アーカイブなく、企業データベースに無期限に保持しておきます。 時間の経過と共に傾向を確認したい場合など、一般的な BI 活動を-ソリューションを企業データベースに永続化されないデータのリポジトリをしなければならない可能性があります。
  • 分析に必要なデータの一部が、企業データベースにはできません。 かもしれませんフラット ファイル、スプレッドシート、または構造化されていないデータで Microsoft Word ドキュメントと同様の形式。 人が、ローカル コンピューターに格納された情報へのより問題はの取得 (またはそのヘッド。
  • データが利用可能な場合でも品質に関する問題場合があります意味がソースから直接使用することはできません。 データをダウンロードして分析できます前にクリーンアップする必要があります。 アクセスするたびから手動でデータをクリーンアップする必要ソース内のデータをクリーニングできません、限り-毎回同じ規則を適用するようにします。 さらに、クリーニングの同じ規則を次が全員他同じデータを使用することを確認ことができません。

データ アクセス権を持つこれらの問題に対処をするには、BI ソリューションには、含ま分析を使用するデータを格納するだけに作成されたデータベース多くの場合、れます。 活動のデータを生成およびそのデータを消費して活動間、リソース競合の問題を回避できますは意味をデータベースなど) を持ちます。 一歩を移動、することができます再構成データ データを集計クエリが速く実行できるようにします。 複数のデータ ソースからデータを統合する場合は、それを集中管理し、一貫した意味を持つ一般的な形式にデータを配置するビジネス ロジックを適用できます。 この中央の場所に、XML ドキュメントやスプレッドシートなど、データベースから取得していないデータを組み込むこともことができます。 独立したデータベースを作成の別利点は、そのデータがソース データベースから削除された後に必要な限りの履歴データを保持できることです。 最後に、自動化できます浄化およびデータの分析、強化のプロセスと同じ規則は、データにアクセスするたび適用されることを確認します。

判断加えようのサポート

BI ソリューションよりもデータへの優れたアクセス権付与に行います。 具体的には、意思決定作業をサポートする必要があります。 一般に、BI ソリューションをする必要がありますできます評価し、ビジネス条件への応答、組織全体のすべてを含むのビューまたは部門、ワークグループ、または 1 つのチームも狭いの観点を必要とするかどうか。 実際には、集計ビューからデータの詳細ビューにすばやく移動する機能は BI で機能が重要です。

BI ソリューションの目的は、データの分析し質問に対する回答を検索ではなく追跡、統合、再フォーマットおよびデータ自体を調整して時間を費やすことができます。 データを分析するのに十分な品質の時間を持っている場合は、通常、問題を早期発見でき続行から負の値の傾向を停止する手順を実行できます。 一見無関係なデータ要素間の相関関係を検出し、保存ドルに達成額のドル、洞察に戦略を調整して BI を使用することも。 ようにジョブを問題の解決と、将来の計画に毎日を作成するすべての意思決定変換直接的または間接的に、コストや利益に会社のします。

BI の動作

理解 BI、理論上のレベルでは、がアクションに表示その利点を理解するにできます実際。 BI のしくみを示すの 3 つ他文書このシリーズのについて説明架空の会社を想定しあなたは Adventure Works と呼ばれる、BI ソリューションの開発します。 この資料の最後に、Adventure Works は、世界中の製品を販売する架空の自転車メーカーであるため、サンプル データベースの入手方法について説明します。 小さな専門自転車店や大規模ウェアハウス スタイル ショッピング コンセントなどの販売店にその製品を卸売り販売する営業スタッフを維持します。 冒険の動作も、インターネット経由の個々 の顧客に直接製品を販売します。 あなたは Adventure Works のデータは、BI ソリューションにも当てはまる分析機会多数提供します。

BI ソリューションはする意思決定をサポートするためのものを注意してください。 このことに注意してくださいあなたは Adventure Works キー決定する前に応答が必要な質問の種類を考えてみましょう。

  • 販売チャネルより有益なですか。 冒険は追加詳細再販業者との関係を作成したりインターネット販売の存在を展開する複数の営業スタッフへの投資するかどうかを決定する必要があります。 ガイドのためにこの決定は、アナリスト権限が必要、再販業者とそのインターネット サイト間の時間の販売実績を比較します。 アナリストが比較する販売実績データ ポイント (メジャーと呼ばれる) には、販売のドル、注文数量および収益性が含まれます。 収益性の正の傾向は、最も重要なメジャーは高度な販売単位ドルまたは販売単位数これら販売ネットが失われる場合、会社を利用しないためです。
  • オンデマンド特定の製品の拡張または辞退でしょうか。 冒険の動作と一致して販売の要求の生産レベルいなければなりません。 一部の製品の需要が増加すると場合、あなたは Adventure Works 販売できるがあり、したがって売り上げの増加これらの製品の詳細を確認するには、製造プロセスを調整する必要があります。 その他の製品の需要が辞退すると場合、あなたは Adventure Works 必要が、運用を減らすかでこれらの製品が失われるで販売する必要がありますが、oversupply の状況を回避する製品ラインを取り除きます。

お仕事で売上データを分析しない、たとえする勧めに従ってに沿ってあなたは Adventure Works の BI ソリューションを構築します。 同じデザインと開発原理の独自のデータにこのシリーズで説明した適用できます。

Microsoft BI スタック

今すぐみましょうを詳細に見て BI のテクノロジ アーキテクチャ。 Microsoft BI スタックにはビルドして、管理、BI ソリューションを使用して必要のあるツールをすべてがあります。 SQL Server 2008 は、データ マートまたはデータ ウェアハウスをホスト データ プラットフォーム、スタックの基盤です。 データ マートは、件名固有のデータ ストアです。 データ ウェアハウスとは複数のサブジェクトを含むデータの企業全体にわたるコレクションです。 データ マートおよびデータ ウェアハウス間のリンク線が不鮮明、ですの違いを心配する必要がありますしません。 このシリーズでは、用語データ マートを使用します。 (この一連の記事と SQL Server 2008 はも構築できます類似した BI ソリューションを SQL Server 2005 と BI コンポーネントには、ほとんどまたはまったく変更指示を使って。)

SQL Server 2008 には、次の 3 つの BI コンポーネントが含まれています: SSIS (統合サービス)、分析サービス (SSAS)、およびレポート サービス (SSRS)。 これらのコンポーネント、データ プラットフォームを拡張データの統合機能、マルチディメンション データベースのサポートおよびデータのプレゼンテーション層、それぞれ。 図 1 は、BI ソリューションでは互いにこれらのコンポーネントとの関係を示します。

fig01.gif

図 1 BI ソリューションで SQL Server 2008 のコンポーネント

データ マートの物理構造を設計する後 SSIS を使用して、他のデータ ソースから抽出したデータを記入をします。 SSIS データを浄化のプロセスを自動化する必要なツール、分析に適したが複数のソースからデータを統合および構造体にも、データを変換できます。 SQL Server エージェントを使用してこれらのプロセスの定期的な実行をスケジュールすることができます。 彼資料にある SSIS p にします。 31、Derek Comingore 説明 BI ソリューションの開発の抽出、変換および読み込み (ETL) する方法を処理します。

BI ソリューションへの SSAS データベースの追加、高性能のより高度な対話型のクエリをサポートできます。 使用して SSAS をコピーする、リレーショナル データ、キューブと呼ばれる多次元データベース構造にします。 適切に設計されたキューブはアドホック クエリのデータを比較可能なクエリ、リレーショナル データベースをより高速飛躍的に向上できるクエリ結果を返すインデックスおよび機能と同等の概要テーブルの (集計と呼ばれます) を追加して最適化します。 また複雑な計算ロジックを埋め込むを数百リレーショナル データ ソースを使用時にレプリケートすると、Transact-SQL のコードの行を要求それ以外の場合はするクエリを簡単にキューブにこともできます。 キューブ ブラウザーを (多くのフロントエンド ツールを使用して、単一行のコードを記述せずにキューブのクエリできます。 来月の問題で Scot Reagin を示します、BI ソリューションの一部として、キューブを作成する方法。

SQL Server データ マートに SSAS キューブには、データを格納している、かどうか SSRS を追加する、ソリューション アーキテクチャは、データを利用できるようにすることができます。 SSRS はレポートを開発する、セキュリティで保護された集中型管理インフラストラクチャを使用して公開されたレポートを管理してレポートへのユーザー アクセスをサポートするツールを含むレポート作成プラットフォームです。 レポートの表示、電子メールでは、レポートを受信するサブスクリプション機能を使用または、レポートを表示する独自のアプリケーションで SSRS Web サービスを呼び出す SSRS Web アプリケーションまたは Microsoft Office SharePoint Server 2007 (MOSS) を使用することができます。 レポートの既定のビューは、HTML 形式で表示が、PDF 形式または Excel などの他のファイル種類に、レポートをエクスポートすることもできます。 来月、する説明より SSRS BI ソリューションのデータのプレゼンテーション層の使い方についてします。

Microsoft BI スタックするオプションは、データのプレゼンテーション層を展開するいくつかの Microsoft Office テクノロジもします。 Excel 2007 は BI ソリューションでデータ分析をサポートする、一般的な方法です。 SQL Server のデータ マートをアクセスまたは 図 2 のように Excel から直接、SSAS キューブを参照し、データを自由、SSRS レポートを表示することができますよりもはるかに探索できます。

fig02.gif

図 2 の キューブを参照するには Excel 2007 を使用して

Excel を使用してリレーショナルおよび多次元の両方のデータ探索をに加えてには、そのデータ マイニング アルゴリズムを使用する、データ内の情報の非表示のパターンを発見したり (つまり、データ マートを作成する前に問題を解決する)、データ内の異常を検出することができます。 データ マイニングを始めるにたいへん便利ですはマイクロソフトから Excel の無料、アドインをダウンロードし、それを使用してまたはビューの出力データ マイニング モデルの作成し、SSAS サーバーに格納されている任意のソースから Excel にインポートするデータを分析してです。 Visio 2007 用のアドインはも注釈付きのデータ マイニング モデルの共有です。 ダウンロードとこれらのアドインでの使用に関するより詳しい入手できます」 データ マイニング アドイン Office 2007 の."

データを共有するため、ますます一般的な選択肢は Excel Services、MOSS で使用可能です。 Excel 2007 を使用して、最初作成は、そのデータ ソースとして、SSAS キューブを使用するピボット テーブルを含むブックし発行する、データ接続と、ブック Excel Services。 他の種類の SSAS を使用する利点は、の 1 つ、データ ソースからデータを含むブックを発行できますがピボット テーブルと Excel Services 化は、機能、Excel の知識を保持する純粋な HTML インターフェイス内で同じキューブ ブラウザー機能の多くを使用します。 別の利点は、Excel ブックのアクセスと管理を集中管理できることです。 Excel Services についての詳細についてを参照してください" Excel Services の技術概要."

まだ Excel Services を使用してキューブの参照の別の利点はピボット テーブルを埋め込むし、Excel Web Access の Web パーツを使用して MOSS ダッシュボード ページにグラフをピボットできることです。 ダッシュボードは、特別の SharePoint コンテンツ タイプ、さまざまな Web パーツを使用して 1 ページに複数のソースからデータを表示することができますです。 でも、フィルターをダッシュボード ページに追加できにすべてまたは一部を動的にフィルター選択に基づくページの内容を変更する Web パーツの接続します。 図 3 は、サンプル MOSS ダッシュボードを示します。 MOSS も Web パーツを MOSS サーバー (省略可能な SSRS 構成統合モードと呼ばれます) に格納されている SSRS レポートを表示またはレポート サーバー (既定の構成のネイティブ モードと呼ばれる) に格納されたレポートを表示する、SSRS に出荷する Web パーツを使用できます。

fig03.gif

図 3 の 表示のブックをレポートには、MOSS ダッシュボード ページを使用して

さらに多くの機能とダッシュボード、Microsoft Office PerformancePoint Server 2007 (PPS) を使用できます。 スコアカードと MOSS を展開するダッシュボードを作成するには PPS を使います。 スコアカードは、定義済みのターゲットに実際のパフォーマンスを比較し、色分けされたアイコンを使用して結果を表示するレポートです。 特別な型を使用して Web パーツのでは、標準の MOSS ダッシュボードでまたは PPS ダッシュボードの一部として PPS スコアカードを表示できます。 ダッシュボードで PPS レポートを 図 4 のように、同じデータの異なるビューを表示またはさまざまなソースからの関連データを表示、ダッシュボード ゾーンに追加できます。

fig04.gif

図 4 の データの表示を PPS ダッシュボードを使用して

ご覧のように、Microsoft BI スタックには多数のオプションを開発、管理および、BI ソリューションの実装が用意されていますができなくはありませんなりますしたを他のオプションを使用します。 Microsoft BI のスタックを上から下は先接続できる独自のカスタム アプリケーションまたはサード パーティ製のアプリケーション固有の要件をサポートする場合、拡張可能なアーキテクチャです。

ソリューションの開発に、アプローチ

最適な方法は、Microsoft BI スタックについて学習を開始することです、単純なソリューションを構築します。 このシリーズの関連資料 SSIS、SSAS および SSRS を使用して、ソリューションを構築する方法を示します。 データ系列が終了したら、これらの各コンポーネントのしくみをおおまかに把握必要があります。 しない感じる compelled、ただし、すべて BI ソリューションを構築するのスタック内の各コンポーネントを使用します。

BI ソリューションをまとめるとは、ほとんどのデータ準備タスクを実行するような再構築、浄化、時間を費やす計画します。 BI に言えば、この一連のタスクは、抽出と呼ばれます、変換および読み込み (ETL) 処理します。

ETL 開発を開始する前に慎重に、BI ソリューションの設計を計画する必要があります。 私の経験で、BI ソリューションの開発がよりスムーズに、特定のビジネス問題を解決し、最初の検討情報をやり取りする人必要がある方法で、設計のアプローチがある場合。 ユーザー指向のアプローチを使用すること、によって、ビジネス ニーズをサポートする適切なビジネス プロセスが正常に取得するソリューションを設計し、構造体のデータの先頭方向方法操作できます。 この推奨事項がわかりやすいアプローチと思われるが、大勢のユーザーにソリューションを開発して利用可能なデータからドライブおよび取得に使用しないソリューションで最大風速しようとするきた。

思いつく初期設計後、開発を開始する準備ができました。 BI ソリューションには、SSAS と SSRS の SSIS を使用して場合を作成して SSIS を使用して BI ソリューションのデータ構造の作成を開始します。 後、データが適切も引き続きを次の手順、キューブを構築します。 開発が完了した後は、キューブ データと共に読み込みを処理します。 SSRS を使用してキューブでクエリし、レポート、クエリ結果を表示するレポートの開発をします。 この系列内の次の 3 つのアーティクル上のこのプロセスのステップにする方法がわかります。 独自のプロジェクトこのプロセスを段階的アプローチする必要がありますおよび繰り返し確認 1 つのステップの結果は良好で以降の手順。

開始

このシリーズの残り記事で説明した BI ソリューション全体を完了するには SSIS、SSAS SSRS など、SQL Server 2008 のインストールをします。 持っている場合 SQL Server、SSAS サーバー、およびレポート サーバーへのアクセス、ネットワーク上ではコンピューターに開発ツールをのみインストールする必要があります。 について製品のインストール手順は" 方法: SQL Server 2008 (セットアップ) をインストールします。." 行うことができます。 CodePlex からあなたは Adventure Works のソリューションをビルドするには、サンプル データベースをダウンロードします。. 最初データベース、AdventureWorks2008、販売、生産と人事部門でビジネス操作によって生成されたトランザクションをキャプチャする、オンライン トランザクション処理 (OLTP) データベースの代表が。 このデータベースは SSIS を使用して作成するデータ マートのソースとして使用されます。 データ ウェアハウスの設計のベスト プラクティスを表すデータの例を 2 つ目のデータベースを AdventureWorksDW2008 に示します。 SSIS の学習をスキップしてキューブの開発に直接ジャンプする場合は、ソースとしてこのデータベースを SSAS キューブの使用できます。

次の手順

SQL Server BI コンポーネントに精通した後、に関する知識をビルドを続行する独自の単純なプロジェクトを検索する必要があります。 取りかかるには、本格的なデータ マート必要があるしないのに、このシリーズの次の資料に記載の原則を使用して、データを構造化しようとする必要があります。 BI の使用を開始するとしない可能性があります見てみましょうデータと同様非常再度。

Stacia Misner は、BI コンサルタント、教師用と作成者と同様 founder とデータ Inspirations のプリンシパルです。 彼女に 25 年の経験、IT 業界、Microsoft BI スタック焦点 9 年とします。 Stacia BI に関するいくつかの書籍が書き込んだ場合があります。 彼女最新帳、Microsoft SQL Server 2008 Reporting Services Step by Step (マイクロソフト プレス、2009年、) は、この年以前のバージョンをリリースされました。 彼女に到達できます。 smisner@datainspirations.com.