Dataiku DSS ver9 がリリース
- 機械学習モデルをサポートする機能(Visual ML Diagnostics、Model Assersion)
- データハンドリングをより簡単にする機能(Smart Pattern Builder、Fuzzy Join、Interactive Date Preparation and Filtering
- シミュレーション機能(What-If Analysis)
Ver8からVer9へのアップグレードの仕方
- クラウドサーバー: AWS EC2
- インスタンス:t3a.xlarge
- OS: Amazon Linux2
全体的なアップグレードの手順としては以下のURLにあります。
https://doc.dataiku.com/dss/latest/installation/custom/upgrade.html#post-upgrade-tasks-after-startup
事前準備
前述でも書いた通り、また上記ドキュメントにもあるように、既存環境のバックアップをきちん取っておくようにしてください。Dataiku DSSは「DATA_DIR」というディレクトリに設定情報等が保存されるので、こちらのフォルダを事前にバックアップしておいてください。
また、実際にアップグレードをする際に、新しいインスタンスを作って、そこにDSSのProjectやFlowなどの部品をエクスポート/インポートしたら良いじゃないかと考えられる方がいらっしゃるかと思いますが、これはDataikuではオススメしていません。
なぜなら、DSS Projectのエクスポート/インポートは重要な部品はエクスポートできますが、Flowの状態やJupyterに書き込まれたファイル、SQLノートブックの結果などが含まれないため、新しいインスタンスに移した後に再計算しなければいけないためです。
ですので、Dataikuでは、同じインスタンスにアップグレードをかける方法を推奨しています。
Dataiku DSSの停止
DATA_DIR/bin/dss stop
Ver9 ファイルのダウンロードと解凍
wget https://cdn.downloads.dataiku.com/public/dss/9.0.1/dataiku-dss-9.0.1.tar.gz
解凍は以下のコマンドでできます。
cd SOMEDIR (ダウンロードしたディレクトリ)
tar xzf /PATH/TO/dataiku-dss-9.0.1.tar.gz (解凍先のディレクトリ)
インストールとエラー
dataiku-dss-9.0.1/installer.sh -d DATA_DIR -u
*********************************************************
Data Science Studio installer: 2021/04/10-01:35:50
Command line: dataiku-dss-9.0.1/installer.sh -d DATA_DIR -u
Version: {"product_version" : "9.0.1", "product_commitid" : ""}
DIP_HOME: /home/ec2-user/DATA_DIR
[!] SELinux is installed but not enforcing
[+] Using Java at /usr/bin/java : openjdk version "1.8.0_252"
[+] Checking required dependencies
+ Detected OS distribution : amazonlinux 2
+ Checking required packages...
*** Error: package python3 not found
[-] Dependency check failed
[-] You can install required dependencies with:
[-] sudo -i "/home/ec2-user/dataiku-dss-9.0.1/scripts/install/install-deps.sh" -without-java
[-] You can also disable this check with the -n installer flag
そこで、この中に書いてあるコマンドを使って再度インストールを行ってみます。
sudo -i "/home/ec2-user/dataiku-dss-9.0.1/scripts/install/install-deps.sh" -without-java
そうすると、インストールログが表示され、問題なくインストールできたようです。
***************************************************************
* Installation complete (DSS node type: design)
* Next, start DSS using:
* '/home/ec2-user/DATA_DIR/bin/dss start'
***************************************************************
R環境のUpdate
DATA_DIR/bin/dssadmin install-R-integrationログが表示されますが、Rのパッケージをインストールしていますので、Rをよく使われている方は見慣れたログが表示されます。
Dataiku DSSのスタート
DATA_DIR/bin/dss start
バージョンアップできたかどうかの確認
(左下にCommunity Editionのダウンロードリンクがあります)
0 件のコメント:
コメントを投稿