GoogleのAIでもヒトとゴリラを見間違える。その理由とは?

GoogleのAIでもヒトとゴリラを見間違える。その理由とは?


人工知能の機械学習に飽くなく挑戦を続けるGoogle

画像認識のシステムに、若干の陰りが見えている。



過去に起こった Google Photo の画像認識問題

2015年にソフトウェア開発者であるジャッキー・アルシネが、自身のTwitterに、

”Google Photos, y’all fucked up. My friend’s not a gorilla.”

というツイートを投稿した。

Googleのネットサービスのひとつである「Google Photo」が、自動画像認識により、彼と友人の女性の写真を「ゴリラ」としてタグ付けしたのだ。

投稿には彼の所有するGoogle Photoの画像も貼り付けられており、黒人男性と黒人女性が逆光気味に撮影された写真であった。

常識と良識があるのであれば、誰が見ても、これをゴリラであるとは思わない。

自動画像認識は、ユーザーが大量にある写真を手作業ではなく、自動で行ってくれるサービスである。

大幅な時間の節約を出来る、たいへん有意義なサービスなのであるが、このツイートでGoogleは大きく挫折することとなった。

Googleの広報担当であるヨナタン・ズンガーは、ジャッキー・アルシネに対し、Twitter上で彼にキチンと謝罪し、今後の対策について誓った。

2015年6月の出来事である。

Googleが行った解決策

結局のところ、ジャッキー・アルシネのツイートから1年と7ヶ月経った現在でも、Google Photoの画像認識は、それ以上の正確性や精度を上げていないようである。

仕方なく、Googleが行った解決策は、Google Photoの「タグ一覧」から、「ゴリラ」「チンパンジー」「猿」といった単語を消すことであった。

ゴリラの写真をGoogle Photoに検索をかけても、「検索結果はありません」と返って来る。

ただし、ヒトに近い霊長類の全てを削除したわけではなく「オラウータン」や「マーモセット」という特定のものには対応している。

何故、このような解決策しか行なえなかったのか?

理由としては、

・画像分析の技術はまだ新しく完璧から程遠い

・ビッグデータからの統計的な深層学習のため、イレギュラーに対応しきれない

ということが挙げられる。

実際のところ、Google Photoは、人間の性別こそ判断は出来るが、人種を判断するまでは至っていないレベルなのだ。

最先端の画像認識を体感してみよう

紹介するのはGoogleが開発した「Cloud Vision API」

Googleが企業や団体へ向けて有料で提供している「Google Cloud Platform(GCP)」のサービスのひとつだ。

下部のリンクから、無料トライアルを体験できるので是非とも試していただきたい。

操作は簡単で、画像をアップロードし、分析してもらうだけである。

それにより、Google Photoをはじめ、人工知能が画像認識において、なにを「見ているのか?」ということが見えてくる。

人間の顔についての認識が「喜怒哀楽」の感情のうちのどれなのか? を探っているのも興味深い。

このデータは、サービス業において大きくパフォーマンスを発揮してくるだろう。

また、当ブログの主役である「古瀬あい」を画像分析してみたところ、ズバリ彼女が「人工知能」であり、チャットボットであることを言い当てた。




関連付けによる深層学習が鍵

Cloud Vision APIを触ってみればわかるように、画像認識というものはかなり進んでいるにも関わらず、未だに霊長類のヒトとゴリラとチンパンジーの見分けがつかなかったり、人種がわからなかったりする。

また、古代の壁画に描かれている抽象的な人物像も「ヒト」とは認識しない。

しかし、人間は漢字の「大」という字を見て、手を広げ、両足を開いている人間のように見たりする。

そして、ビルが立ち並ぶ街中で自撮りしている黒人をゴリラだと思ったりはしない。

今後の画像認識についての人工知能に行う機械学習には、このような「抽象的なものの解釈」や「画像内の物事の関連付け」がテーマになってくる。