[ML Study Jams Vol.4] Baseline: Data, ML, AI / 強化学習 Reinforcement Learning: Qwik Start 受講メモ

斉藤之雄 (Yukio Saito)

5年 ago

Categories: Baseline: Data, ML, AIML Study Jams Vol.4

[ML Study Jams Vol.4] Baseline: Data, ML, AI / 強化学習 Reinforcement Learning: Qwik Start 受講メモ

GSP691　Baseline: Data, ML, AI の 1コマ「Reinforcement Learning: Qwik Start」
https://google.qwiklabs.com/focuses/10285

概要 (Google 翻訳から転記）

機械学習研究の他の多くの領域と同様に、強化学習（RL）は、画期的な速度で進化しています。他の研究分野で行ったように、研究者たちはディープラーニングを活用して最先端の結果を達成しています。

特に、強化学習はゲームプレイで以前のMLテクニックを大幅に上回り、Atariで人間レベル、さらには世界最高のパフォーマンスを達成し、人間のGoチャンピオンを破り、Starcraft IIなどのより難しいゲームで有望な結果を示しています。

このラボでは、OpenAI Gymが提供するサンプルからモデル化された単純なゲームを作成して、強化学習の基本を学びます。
（qwiklabs から引用）

ハンズオンの内容メモ

■目的：

強化学習の基本的な概念を理解する。
AI Platform Tensorflow 2.1 Notebookを作成します。
Githubにあるトレーニングデータアナリストのリポジトリからサンプルリポジトリのクローンを作成します。
ノートブックにある手順を読み、理解し、実行します。

Deep Q-network (DQN) の概要紹介が Qwiklabs あるので、味わって読むといいと思います。賢明な方には不要でしょうが【DQN は not ドキュソ】です。

筆者の都合により、ダッシュボードは日本語で操作します。

■Create an AI Platform Notebook

us-west1-b リージョンに 4vCPUs, 15GB RAM / TensorFlow 2.1 without GPU 環境を無償で作ります。Tesla T4 を無償体験してみたいが、我慢。

■JuputerLab Notebook の Terminal 操作でgit clone を実施します。

■git clone 実施。

■新しいタブで、training-data-analyst> quests> rl > early_rl > early_rl.ipynb. を開きます。

ラボ終了

blog メモ（スクリーンショット撮影）を作成しなければ、概ね 10分程度で完了すると思います。

Baseline: Data, ML, AI クエスト完了

このクエストは完了。次はどのクエストか、コースへ進もうかな。

ご覧いただき有難うございました。

以上

[学習計画] ML Study Jams Vol.4 （2020年5月連休中） »

« [ML Study Jams Vol.4] Baseline: Data, ML, AI / Video Intelligence: Qwik Start 受講メモ

斉藤之雄 (Yukio Saito): Global Information and Communication Technology OTAKU / Sports volunteer / Social Services / Master of Technology in Innovation for Design and Engineering, AIIT / BA, Social Welfare, NFU / twitter@yukio_saitoh