2019年11月24日日曜日

Dataikuを使ってみよう #0 : Projectを作成


前回Dataikuの概要をまとめました。
今回はDataikuでデータ分析を始めるための、一番最初のステップ、これがないと分析が始まらない、
「Dataiku上でのProject作成」について、まとめています。

まずはProjectを作る

Dataikuでは、「Project」単位で分析フローを管理します。そのため、一番最初にやることはProjectの作成です。
ログイン後のTOPページ右上あたりに 「+New Project」ボタンがあり、クリックをすると、どんなタイプのProjectを作成するか選べます。
今回は「Blank project」を選んでみましょう。












適当なプロジェクト名を入力しましょう。名前を入力し終わったら、CREATEをクリック。









Projectのトップページが作成できました。


Project名称・簡単な説明






作成したProjectの名称になります。Project名の下には簡単な説明を追加することができます。マウスをポイントすると、鉛筆マークが表示されます。そのアイコンが出てきたら、編集することができます。
左上の「Watch」や「STAR」をクリックすることで、このProjectに対して何か変更があった際に通知を受け取ることができます。

Flow








TOPページの真ん中あたり、ここがProjectの中心機能となる、「Flow」です。(Flowについては近いうちに説明します)。Flow中にどのオブジェクトがどれだけあるかを表示しています。一つ一つクリックすると、このProject内のオブジェクトリストが表示されます。
下部に「IMPORT YOUR FIRST DATASET」と表示されますが、データセットをUploadした後は、「GO TO FLOW」と表示が切り替わります。

プロジェクト詳細説明とTask







TOPページの下部は作成したProjectの説明と、Taskリストになります。
左側のProjectの説明はMarkdownが記述でき、箇条書きや順序、太字などが記載できます。また、DataikuのProjectへのダイレクトリンクも作成できます。

右側のTaskは簡単に追記できます。Dataikuの大きな特徴として、「コラボレーション」が挙げられます。ここに自分が行う予定ややってほしいタスク等を書くことで、メールやSlackなどに書くお願い事項・確認事項を集約させることができます。

ツールバー






最後にTOPページのツール類です。
上の黒い部分のツールはこの後順次使っていきますので、その際にご紹介します。
それぞれをクリックすることで、Flowを通ることなく、該当オブジェクトにアクセスできます。ショートカット的に利用すると楽です。

□が9つあるアイコンはセッティング関連です。ここでは各種Projectの設定やAPI関連(Enterpriseのみ)、Wikiの設定やPluginのインストールなどができます。また、RやPythonの環境設定やデータソースへのコネクション作成等を行えます。

右から2番めのアイコンはユーザー情報になります。通知や自身の情報を編集することができます。

TOPページはProjectの情報を集約する便利なページです。
TOPページで何がどこにあるのかを知ることで、分析のスピードアップが図れるかと思います。

さっそくはじめてみる

今回はまだDataiku利用の入口に立っただけです。
興味を持たれた方は、ぜひ以下のリンクを見ていただき使ってみてください!

[フリーエディション]