人間のように理解や説明ができるAI！？

Googleとスタンフォードの研究者は、画像から情報を理解し、意思決定もできるAIの開発で大きな一歩を踏み出した。
新しい機械学習モデルを用い、人間に意味のある視覚的概念を自動的に抽出することに成功した。

このアルゴリズムはトレーニングされた画像分類器と、さまざまなクラスの情報を取得し、画像のクラスと画像内の特徴の関連付けを識別することができるものだ。
その結果、人間のような直感的な感覚で、重要と判断した概念に対してフラグを立てることに成功した。
ある実験では、警察を検出するために法執行機関のロゴが重要であると識別することに成功したという。

AIの説明可能性については、機械学習の開発における重要な課題である。
人間生活のコントロールをアルゴリズムに委ねるには意思決定が行われる理由とAIが人々によい結果をもたらすよう誘導する方法を導かなくてはならない。

現在のところ、ほとんどのディープラーニングモデルはブラックボックスである。
つまり、データが出入りして予測が出るだけで、それが何であるのかの説明はできないのだ。
今回のGoogleとの共同研究はAIの可能性を進歩させた。

Google Cloud ではすでに業界トップクラスの予測精度で画像認識ができる、機械学習を活用した画像処理プロダクトを提供している。
クラウド内やエッジにある画像から有用な情報を引き出すことができる。
それを事前にトレーニングされたモデルを活用して感情を検知し、テキストを理解できるという機能だ。

この機能は独自のカスタム機械学習モデルのトレーニングを自動化してくれる。
画像をアップロードするだけで、使いやすいグラフィカルインターフェースでカスタム画像モデルの学習ができるという便利なアイテムだ。
モデルの精度、レイテンシ、サイズを最適化することができ、クラウド内のアプリケーションやエッジのさまざまなデバイスにエクスポートすることもできる。

事前トレーニング済みの機械学習モデルを使って画像にラベルを割り当てることで、画像を事前定義済みの数百万のカテゴリに高速で分類することができる利便性もある。
オブジェクトや顔を検出することや印刷テキストをはじめ、手書き入力された文字なども読み取ることができ、有用なメタデータで画像カタログの制作がなされるのが便利だ。
テキストの抽出には50 以上の言語にも対応しており、何百万件ものドキュメントを高速で処理して業務ワークフローを自動化することにも役立つ。

この機能を活用できれば、たとえば、小売業者は顧客が商品の画像をアップロードするだけで、希望に合う商品や類似商品のリストをすぐに確認できるようになるなど、販売促進につなげることもできるのだ。
Googleでは10年以上にわたって機械学習やAIの研究開発に取り組んでおり、研究技術を結実したプロダクトの開発や提供に余念がない。
世界シェアを持つGoogleによって、今後もますますのAIの進化が期待される。

参考：Google’s AI explains how image classifiers made their decisions.