
強化学習を、クラウドのサーバを使って実行する手順です。
関連
- ◯
- クラウドのコンテナでGPUを使う:GPC, Docker, nvidia-driver, cuda-toolkit
- ◯
- 物理ベースのキャラを、強化学習で自律的に歩かせる:Unity (ML-Agents (Walker)), UnityChan, VRM (VRoid) , DAZ
手順:クラウドでの強化学習
強化学習をビデオモニタがない(ヘッドレスの)サーバで行うときは、次の手順で実行します:[※1]
- ・
- サーバのOSに合わせた、ゲームの実行ファイルを作成(ビルド)
- ・
- サーバに、実行ファイル群をコピー
- ・
- サーバのターミナルからコマンドを打ち、学習を開始
コマンドは、ゲーム画面を表示しないので、引数「--no-graphics 」をつけて実行します:
$ cd ${DIR_ML_AGNETS}/ml-agents
$ mlagents-learn config/imitation/${FILE_YAML}.yaml --run-id=${ID_RUN} --env=${DIR_PLAYER}/${FILE_PLAYER}.x86_64 --no-graphics --num-envs=${NUMBER_OF_ENVS}
- ※1
- ここではGPUを搭載したサーバを使っていますが、ただ<歩かせる>ことが目的の学習なら、GPUはほとんど使いません。じっさい、次のような使用率になります:
$ nvidia-smi
Fri Nov 5 13:34:01 2021
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 495.29.05 Driver Version: 495.29.05 CUDA Version: 11.5 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 Tesla T4 On | 00000000:00:04.0 Off | 0 |
| N/A 53C P0 27W / 70W | 1182MiB / 15109MiB | 5% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=============================================================================|
| 0 N/A N/A 3185 C /usr/bin/python3 1179MiB |
+-----------------------------------------------------------------------------+
$ nvidia-smi --query-gpu=timestamp,name,utilization.gpu,utilization.memory,memory.used,memory.free,memory.used --format=csv -l 1
...
2021/11/05 13:27:00.900, Tesla T4, 5 %, 0 %, 1182 MiB, 13927 MiB, 1182 MiB
2021/11/05 13:27:01.901, Tesla T4, 5 %, 0 %, 1182 MiB, 13927 MiB, 1182 MiB
...
