ラベル Rユーザー会 の投稿を表示しています。 すべての投稿を表示
ラベル Rユーザー会 の投稿を表示しています。 すべての投稿を表示

2019年11月24日日曜日

Dataikuを使ってみよう #0 : Projectを作成


前回Dataikuの概要をまとめました。
今回はDataikuでデータ分析を始めるための、一番最初のステップ、これがないと分析が始まらない、
「Dataiku上でのProject作成」について、まとめています。

まずはProjectを作る

Dataikuでは、「Project」単位で分析フローを管理します。そのため、一番最初にやることはProjectの作成です。
ログイン後のTOPページ右上あたりに 「+New Project」ボタンがあり、クリックをすると、どんなタイプのProjectを作成するか選べます。
今回は「Blank project」を選んでみましょう。












適当なプロジェクト名を入力しましょう。名前を入力し終わったら、CREATEをクリック。









Projectのトップページが作成できました。


Project名称・簡単な説明






作成したProjectの名称になります。Project名の下には簡単な説明を追加することができます。マウスをポイントすると、鉛筆マークが表示されます。そのアイコンが出てきたら、編集することができます。
左上の「Watch」や「STAR」をクリックすることで、このProjectに対して何か変更があった際に通知を受け取ることができます。

Flow








TOPページの真ん中あたり、ここがProjectの中心機能となる、「Flow」です。(Flowについては近いうちに説明します)。Flow中にどのオブジェクトがどれだけあるかを表示しています。一つ一つクリックすると、このProject内のオブジェクトリストが表示されます。
下部に「IMPORT YOUR FIRST DATASET」と表示されますが、データセットをUploadした後は、「GO TO FLOW」と表示が切り替わります。

プロジェクト詳細説明とTask







TOPページの下部は作成したProjectの説明と、Taskリストになります。
左側のProjectの説明はMarkdownが記述でき、箇条書きや順序、太字などが記載できます。また、DataikuのProjectへのダイレクトリンクも作成できます。

右側のTaskは簡単に追記できます。Dataikuの大きな特徴として、「コラボレーション」が挙げられます。ここに自分が行う予定ややってほしいタスク等を書くことで、メールやSlackなどに書くお願い事項・確認事項を集約させることができます。

ツールバー






最後にTOPページのツール類です。
上の黒い部分のツールはこの後順次使っていきますので、その際にご紹介します。
それぞれをクリックすることで、Flowを通ることなく、該当オブジェクトにアクセスできます。ショートカット的に利用すると楽です。

□が9つあるアイコンはセッティング関連です。ここでは各種Projectの設定やAPI関連(Enterpriseのみ)、Wikiの設定やPluginのインストールなどができます。また、RやPythonの環境設定やデータソースへのコネクション作成等を行えます。

右から2番めのアイコンはユーザー情報になります。通知や自身の情報を編集することができます。

TOPページはProjectの情報を集約する便利なページです。
TOPページで何がどこにあるのかを知ることで、分析のスピードアップが図れるかと思います。

さっそくはじめてみる

今回はまだDataiku利用の入口に立っただけです。
興味を持たれた方は、ぜひ以下のリンクを見ていただき使ってみてください!

[フリーエディション]

2010年11月29日月曜日

Rユーザー会&Japan.Rに参加してきました(その1)



11月25日(木)〜11月27日(土)にかけて、「Rユーザー会」、「Japan.R」が統計数理研究所で開かれ、参加をしてきました。

■Rユーザー会はこちら
http://jasp.ism.ac.jp/~nakanoj/workshop10/2010Rmeeting.htm

■Japan.Rはこちら
午前の部:http://atnd.org/events/9223
午後の部:http://atnd.org/events/9806

■統計数理研究所はこちら

大きな地図で見る

今回は、
1.ゲストスピーカーで、ggplot2 のパッケージ作成者であるWickhamさんが講演に来られる。
2.Japan.RでRExcelのブースを担当する。
という2つの目的で両方ともに参加してきました。

ここでは、1.のWickhamさんの話をまとめたいと思います。

ggplot2とは?

Rではデフォルトで作図ができるPlot関数や、グラフ関係のパッケージを導入することで、グラフの作成ができますが、デフォルトで作成される図などはちょっと物足りない…。(という声が多いです)
で、その問題点を解消するために、"ggplot2"というパッケージが作成されています。(美麗だけというわけではありませんが)

詳しく知りたい方はこちら。
ggplot2 - http://had.co.nz/ggplot2/

Excelでは作成が難しいようなグラフもこのパッケージを利用すると、少ないコードで、きれいなグラフを作成することができます。



このグラフを作成するRのコードはこちら
d <- ggplot(diamonds, aes(carat, price, fill = ..density..)) + xlim(0, 2) + stat_binhex(na.rm = TRUE) + opts(aspect.ratio = 1) > d + facet_wrap(~ color)


このggplot2を作られた方がちょうど講演されるとのことで、「一生に一回あるかないかのチャンス!」と思い、参加をしてきました。

使われた資料

使われた資料は、すでにネットで公開されている資料をベースに進んでいきました。実はすでに以前SlideshareでPDFで取得してiPadにいれて閲覧をしていたので、特に大きな変更等はなかったように思われます。

■資料はこちら
http://had.co.nz/courses/10-tokyo/
>Slideのところ

利用したggplotのコードなどは、スライド資料の中に記載してあるため、ここでは割愛します。

■Toggeter:Rユーザー会初日


参加してみての感想

対象としては、ggplotを利用初めて利用される方を対象としているようで、過去に使ったことがあるような人や、現状バリバリに使われている人にはちょっと物足りなかったかもしれません。
しかし、「このグラフから何を読み取れるか?」や、「このグラフをどのようにすれば見やすいか?」などの課題(資料中のTutorialやYourTurnなど)で実際に作業をしなければいけなかったのが結構大変でした。
講義全体を通して、ggplotの構文をどう書くか?というよりも、「そのデータをどのように料理(グラフ作成)するか?」に力点をおいているように感じられました。

それと、残念な点が1点。これは、どの講演とかでもそうだと思うのですが、(私も含めて)議論があまり活発ではなかった点です。
インタラクティブに話が進んでいるのですが、
・「このグラフを見て何があるか、隣の人と2分ほど話してください」
・「なにか質問ありますか?」
などがあったのですが、(私も含めて)あまり発言が出ず…。
私が講師の立場だったら、がっかりくるなー。と思いました。
全体を通して英語でのプレゼンテーションでしたし、元々あまり発言をしない環境で育っている私たちですので、ある程度はしょうがないとはおもいますが、次のチャンスがあったら、質問してみよう思います。
せっかく何時間もかけて日本にきていただいているので、もうちょっと質問や議論が活発になっていればと思いました。

残念な点は来年改善(個人的)にするとして、普段お世話になっているPackageの作成者の方にお会いできる機会はなかなかなかったので、とても勉強になりました。
参加者もけっこうな人数(30人ほど)がいらっしゃったので、Rもだんだん注目が集まっていきているのではないかと思いました。

ということで、その1はこれで終わりです。