2016年1月4日月曜日

【読書メモ】1億人のための統計解析:西内啓 日経BP社

2週に一度図書館にいって本を数冊借りている。
せっかくなので、読書メモを残しておく。

「はじめてデータ分析をする人」には最適な1冊

初めてデータ分析をしてみたい、興味がある人に向けて
  • アウトカム(目的変数)
  • 解析単位(顧客、クライアントなどなど)
  • 説明変数
を適切に設定することを前半で懇々と説明。

単回帰から重回帰・時系列を説明。

重回帰は変数を手元にあるデータからいかに作り出せるかが大事。どんな考え方をすれば既存データから作成できるのかが参考になる。

単純なアウトカムの設定だけでなく、説明変数に実数値だけでなく割合を使ったり、解析の結果、実現できるアクションが取れるか?などなどをわかりやすく説明してあり、実務向けの内容。

解析結果を実現できるアクションにできるか?の点について言及。
実務者にとってはとても大事。


Excelで説明してあるからすぐに実践できる。ただ、説明変数が分析ツールでは変数が15個までしか設定できないから、多数の説明変数がある場合はめっちゃ面倒。

実業務で使えそうな点

時系列データをダミー変数を作って重回帰を使う点。こういうやり方もあるのかと新鮮だった。
(でもきっとARIMAとか使っちゃっうんだろうな)

「報告」の章が他の統計解析書籍には載っていない点。サンプルデータから解析、解釈をして上司やクライントにどのように報告するかまでのサンプルが載っている。
これはいい。

Power Pivot !

Microsoft SQL Serverの機能を利用したデータマイニング機能を紹介。Excelだとどうしても足りないデータマイニング機能をSQL ServerとPower Pivotを使えば利用可能にできる。

PowerPivot for Excel
PowerPivot:Excelで強力なデータ分析とデータモデリング

重回帰・クラスタリング・時系列などを利用可能。

まとめ

  • 「データ分析を始めてみたい」、「データ分析ってどうやるの?」っていう人には参考になる。
  • ある程度データを使って解析・分析をしている人(中級者・上級者)にとっては参考になりそうな情報はほとんど無さそう。
  • Excelで説明をしてあるので、手軽にできそうな反面、関数やピボットなど利用しないていといけないので、結構手間。また、説明変数を多数作りたい場合には関数の適応や、ピボットテーブルの作成等手間かかる。(素直にRを使いましょう。)
  • Power Pivot 慣れ親しんだインターフェイスでデータマイニング機能を利用できるのはイイね。

0 件のコメント: