[セミナ受講] SQL Server と Excel を使えばこんなに(ry
セミナタイトルが長いセミナを受講しました。
(大体のスキルは持っていますが、私自身も提案する機会が多いので講師視点で出席)
■タイトル名:マイクロソフト SQL Server と Excel を使えばこんなに簡単。見える化と分析でビジネスにスピードを 〜 SQL Server 2008R2 の標準機能でここまでできるビジネス インテリジェンス 基礎編〜
■会場:日本マイクロソフト 品川31F セミナールームA / 床下の電源使用は係員に確認。(通信環境:WiMAX は中レベルでした)
■講師:日本マイクロソフト(株) サーバプラットフォーム製品部 PM 松澤純さん
■アジェンダ
- なぜ SQL Server 2008 R2
- BI に関する悩みを解決します
- SQL Server 2008 R2 Reporting Services
- BI に必要な機能をオールインワン
- 関連情報
■受講所感
- エバンジェリストによるセミナではなくプロダクトマネージャ自らが提案スタイル。シナリオはコーヒーチェーン企業の売上分析 YOY パフォーマンスがよろしくない店舗を地図情報とともにダッシュボードで見せる展開。在り来たりなので今一つ。
- Reporting Service 3.0 が素晴らしいツールのような説明をしているが、ただの汎用 VIEW ツール。
- 地図情報は ESRI (エスリ)シェイプ・ファイルを使うとのこと。
- 10分休憩を挟んだ後半に、BIDS を使い SSIS プロジェクトを作成。ここで、ようやく ETL (Extract Transform Load) をデータフロータスクで作成。サンプルデータのデータ型変換 (Extract), 売上金額(元データは単価と数量)の列を派生列で追加し赤線は例外処理(今日は省略)、緑線は成功処理(次の処理)する旨を説明。次の処理は半角文字を全角にする文字マップ(変換) Transfrom、最後にデスクトップ上へ出力 Load するまでの手順説明。
- 作成したプロジェクトを実行するとすべてのダイヤグラムボックスが緑色になり、デスクトップ上へ SSIS で出力されたファイルと元データを確認。
- より高度な分析を行う BI を Excel を使用するため、Analysis Services を使う。これは多次元のデータベース(CUBE, OLAP) を開発できる。車の販売台数を分析する時、今月いくら売れたか、曜日によって違うのか等の期間や店舗、都道府県(地域)、購入者特性(男女比、職業、収入などのプロファイル)、カラーリングなど色んな切り口で分析が必要ではないだろうか?これらを多次元のデータベースを用意するには、BIDS で予め作成しておく必要がある。
- 開発ツール BIDS で予め多次元化しておくと、ユーザは Excel , Visio から参照することができる。
- Excel 2010 (2007, 2003)データタブ ⇒ Analysis Services に接続する。ここで、多次元 CUBE へ接続し、Excel Pivot へ出力するフィールドを指定する。行と列に相関性ありそうな項目を指定していくだけで好きなように分析が可能となる。
- Excel を実際に操作するだけで、SQL Server 上のデータを使用することになる。→ SQL Server DB 、 SQL Server Analysis Services で作成した多次元DB (OLAP Cube)に接続。TABLE or Pivot Table としてデータを Excel へ出力。
- データマイニング機能を手軽に利用できるアドインを無償提供。Excel から SQL で処理、そして Excel へ出力(結果表示)。
- Excel 2010 限定になるが、Microsoft SQL Server PowerPivot for Excel 2010 http://www.microsoft.com/downloads/details.aspx?FamilyID=e081c894-e4ab-42df-8c87-4b99c1f3c49b&displayLang=ja 無償アドインを使うと、SQL Server に入ってるデータ、Webにある株価、天候情報、顧客情報を個人で持っているなどの状況を自分自身で Pivot 出来る。前述の Excel / SQL Server Analysys Services は固定データが基本。なので関係性が不明な追加情報
(SQL Server に、Cube を新たに作成するのを社内の情シス担当者に拒否られたりw)
がある場合、自分自身で分析可能にするアドイン。参照するデータは何でも構わない。Web データ Feed、テキスト、Excel、SQL Azure、他社 DB なんでも可能。 - PowerPivot Windowに入れたデータを自由自在に分析可能。分析データは正規化していたり、総額データを SQL DB に持っていない(持たせていないポリシー)がある企業もある。そこで、ユーザ側で PowerPivot 上で新しい列を列名とともに(例:売上金額)作成し、さらに Excel 側へ更新情報を通知することも出来る。 (外部参照先 ⇒ PowerPivot ⇒ Excel )
- 受注日から月のみをグループ化して抽出することも可能(これは、PowerPivot を使わずにExcel でも出来なくはないが)。
- すなわち、Excel のインメモリ上に PowerPivot 多次元 DB を持つことができる。MSKKセミナで使用している環境で RAMは8GB である。
- データ可視化には「スライサー(水平・垂直)ボタン」を使用可能なので、より直感的に操作可能。従来、Office 開発していた UI が開発不要だと感じる。
- Excel 2010 機能のスライサーを工夫し、共通点を自分で「あたり」を探してあげれば「うまく」高速なデータ分析ができる。
- そして、分析した結果(たいていは PowerUsersレベルw)を全社で共有するには、SQL Server PowerPivot for SharePoint 2010 を利用する。PowerPivot ギャラリーにより、ブラウザでチラ見せも出来、Excel 2010 を保有していないユーザ向けとしてブラウザの中でスライサーとともにPowerPivotシート参照ができる。ワークブックをセキュアに共有できることになる。そして、この場合はサーバのメモリを使用するので、管理者向けにサーバメモリ負荷状態を確認できる。
- 今日は「データマイニング説明は器材環境の都合上、、説明なし」。
- 他社BI製品との比較は、価格比較で何か萎える。SA(ソフトウェアアシュアランス)なし。
- Self – Service BI 体験サイトあり。(登録不要・無償) ⇒ http://lob.msbi.jp/
- SQL Server の真実 ⇒ http://www.microsoft.com/japan/sqlserver/2008/r2/fact/default.mspx
以上