近年AIのサービスが急激に広がりを見せています。機械学習はデータの収集や事前処理、チューニングなどが難しく敷居の高い部分も多くありましたが、それらの厄介な部分も機械学習で自動化してしまおうというAutoMLという試みが行われています。
今回はAutoMLのツール提供されているNanonetsというサービスを使ってみます。
NanonetsはブラウザでアクセスできるWebサービスとして公開されており、プログラミングが不要、少ないデータ数でも試せる、手間のかかる作業が自動化できるなどの特徴があり、すでに学習済みのモデルを使うことも、モデルを作ることもできます。
まずはwebサイト(https://www.tdi.co.jp/miso/automl-nanonets)にアクセスしてアカウントを作成します。サイトのトップページにある「GET STARTED FOR FREE」をクリックします。
ログイン画面が表示されます。初回なのでSign upも選べますが、Googleアカウントがあるので今回はそちらでログインします。
ログインするとダッシュボードが表示されます。
ダッシュボードを見るとOCRや画像認識、類似性検出などができそうです。
請求書に特化した学習済みのOCRが用意されているので、今回はまず試しに画像化した請求書をOCRで読み込ませてみます。
ダッシュボードの「OCR」メニューにある「Invoices」をクリックします。
ファイル一覧が表示されるので読み込ませたいファイルをアップロードします。
「+ ADD FILES」をクリックするとファイルが選択できます。
今回はインターネットで探してきた適当な請求書を読み込ませました。
読み込ませると一覧にファイルが表示されますので、表示されたファイルを選択します。
画像から読み込んだ内容が右側のLIST VIEWに表示されています。読み込んだ内容から何の項目かを自動で判断し、ラベルと紐づけをしてくれます。jsonデータとして出力することも可能です。
OCRだけでも使い方がいろいろありそうです。次回はOCRの機能をさらに深堀したいと思います。
株式会社 パブリックリレーションズ 〒064-0807 北海道札幌市中央区南7条西1丁目13番地 弘安ビル5階 011-520-1800 011-520-1802