データ量がこれから莫大に増えていく中で、データをきちんと分析するスキルが必要だな…と思っています。
SASとか、SPSSとか、世の中には統計ソフトがあるのですが、個人だと高額で使いにくかったりします。(主に企業向けに提供してありますので) で、ずっと個人で利用できる統計ソフトはないか探していたのですが、ありました! 「R」というソフトです。
Rとは
Rは統計計算とグラフィックスのための言語・環境です。 RはGNUプロジェクトの一つであり、ベル研究所(かっては AT&T、今は Lucent Technology)で J.Chambersと同僚により開発されたS言語・環境に似ています。 RはSを別個に実装したものと考えられます。両者の仕様および実装には幾つかの重要な違いがありますが、S用に書かれたコードの多くは変更なしでRでも実行できます。
Rは多様な統計手法 (線形・非線形モデル、古典的統計検定、時系列解析、判別分析、クラスタリング、その他) とグラフィックスを提供し、広汎な拡張が可能です。 Sはしばしば統計的手法による研究の手段の選択肢となりますが、R を使えばそうした活動にオープンソースの道から参加できるようになります。
Rの強みの一つは、うまくデザインされた出版物並みのプロットを容易に作成できる点であり、これには必要なら数学記号や式を含めることもできます。グラフィックスにおける細かなデザインの標準設定に、これまで周到な配慮が払われてきていますが、ユーザーが完全に制御することもできます。
RはFree Software FoundationのGNU General Public License の条項*1の下で、ソースコードの形で入手できます。様々な Unix プラットフォームや、類似のシステム(FreeBSDやLinuxを含む)では、ダウンロードすればそのままでコンパイルでき、稼働します。また、Windows 9x/NT/2000やMacOSでもコンパイルでき、稼働します。
--引用 Rとは
このソフトで、統計解析を行ったり、高度なグラフを書いたりできます。
ちょっと触ってみたのですが、MS-Excelでは難しいような処理をしたり、統計解析をしてくれたり、グラフ(3次元とか!)を書いてくれたりします。
Excelとはまた違う高機能さを持っているソフトウェアです。
また、フリーで配布されているため、個人の方も自由に利用できます。
統計解析を個人で勉強したい!(私ですが)、大学の研究に利用したりして、結構活発に利用されてきているらしいです。
Rで何ができる?
- データを効率的に操作し、保管する機能
- 配列、とくに行列の計算のための演算子のセット
- データ解析の媒介に使う道具の大規模で一貫した集り
- データ解析のためのグラフィカルな機能と、画面または印刷物への出力
- 条件分岐、ループ、ユーザー定義の再帰的関数や入出力機能を含む、開発の進んだ、簡潔で効率的なプログラミング言語
-- 引用 Rとは
要は、「データ解析に必要なアクション(データ取り込み、入力、アウトプット)はすべて、この環境でできる」ということです。特にやっぱり注目したいのは、「グラフィカルな機能」。
3Dグラフや、3次元にグラフを書いて、グリグリマウスでデータを見たり… ビジュアル的にデータを表示できるので、データの意味をとらえやすくなります。
勉強していく中で、グラフの機能については、追ってこのブログで紹介します。
Rでやりたいことは?
まずはやっぱり、「統計解析を学ぶ」ということです。PCの普及で、一般的な処理を行うExcelやAccessを利用できる人は非常に多くなりました。
これからその中で一歩先に出るためには、他のスキルがあったほうがよい。
で、自分がこれまで「おもしろい!」と思ったのは、データ集計と解析。
高度な技術を学びたい、仕事に生かしたいと思っています。
(できるかどうかわかりませんが…)
新たなスキルを獲得するために、勉強して、このブログにアップしていきます。
関連リンク
取り急ぎ、Rでちょっと検索して見つけたリンクを紹介。とかとか。
結構ドキュメント類がネットに公開されているので、それを元に進めたいと思います。
0 件のコメント:
コメントを投稿