[ML Study Jams Vol.4] GSP075 Cloud ML API を使用して画像内のテキストの抽出、分析、翻訳を行う学習メモ
GSP075 Cloud ML API を使用して画像内のテキストの抽出、分析、翻訳を行う
https://www.qwiklabs.com/focuses/1836
概要
このラボでは、複数の機械学習 API を組み合わせて使用し、機械学習によってできることを体験します。最初に Cloud Vision API のテキスト検出メソッドを使用し、光学式文字認識(OCR)を利用して画像からテキストを抽出します。次に、そのテキストを Translation API で翻訳する方法と、Natural Language API で分析する方法を学びます。
(qwiklabs から引用)
ハンズオンの内容メモ
■SIGN ボード画像からテキストを OCR するための準備から、ハンズオンは始まります。
—
■ CloudVision API では見慣れた結果ですね。
—
■分析のために “content”:”your_text_here” を Natural Language API へ渡した後のエンティティ結果。
—
■Natural Language API により見つかったエンティティ結果。
闇雲に遊んでみる
SIGN画像は変更せず日本語を Translation API へ渡す(絶対失敗する時のエラーを知りたい)
■結果は、Translation API に使用する API Key が有効ではないので bad request として無効でした。
■順序が前後しますが、Translation API https://cloud.google.com/translate/docs/reference/rest/v2/translate の引数は次の条件があります。
string
Required The input text to translate. Provide an array of strings to translate multiple phrases. The maximum number of strings is 128.
必須翻訳する入力テキスト。 複数のフレーズを翻訳する文字列の配列を提供します。 文字列の最大数は128です。
—
■そのため、文字列を英文にするとスルー(そのまま)出力されます。
ちなみに “Where do you want to go today?” はマイクロソフト・グローバルキャンペーン文言(かなり前)です。
学習した内容
- 複数の機械学習 API を組み合わせたユースケース
- Vision API の OCR リクエストを作成し、curl を使用して API を呼び出す方法
- Translation API を使用してテキストを翻訳する方法
- Natural Language API を使用してテキストからエンティティを抽出する方法
ラボ終了
このコマ終了に要した時間は 14 分ほど。
ご覧いただき有難うございました。
以上