技術特異点:翻訳デバイスで「言葉の壁」を人類は破壊した

技術特異点:翻訳デバイスで「言葉の壁」を人類は破壊した




Singurarity(シンギュラリティ)

「技術特異点」

人工知能(AI)の技術成長により、人間文明に計り知れない変化をもたらす瞬間。

人間文明が計り知れない変化を迎える。

その息吹は、我々のすぐそばで「既に」起こっている。

5番めの「芽」として、国家や人種の壁を崩してくれる「翻訳AI」について紹介したい。



翻訳機の歴史

ソフトバンク創業者 孫正義からはじまる

翻訳機のルーツは、そもそも電子辞書からはじまった。

家電メーカーであるシャープが1979年に「ポケット電訳機IQ-3000」という電子単語帳を発売。

開発の発端には、ソフトバンク創業者である孫正義が、学生時代に発明した自動翻訳機が元になっているといわれる。

英和単語を約2,800語、和英単語を約5,000語、収録していた。

8年後の1987年には三洋電機が「電字林PD−1」を発売。

紙製の英和辞書に匹敵する単語数を収録していたが、あくまで単語帳としての使い道しかないシロモノであった。

言語翻訳ソフトの開発

機械による翻訳の歴史は古く、最古は1947年にアメリカの科学者「ウォーレン・ウィーバー」が、英語からフランス語への翻訳実験を行っている。

1954年にはGeorgetown大学とIBM社による機械翻訳の人類初の実験が行われた。この成果から,アメリカ政府は、実用システムを目指し多額の研究予算を投じたりもした。

一方、日本では・・・?

電子辞書としての翻訳機が開発されるのと同時に、1985年頃、電気機器メーカーである富士通の子会社「富士通研究所」が、翻訳ソフトとして「ATLAS」を開発。

1985年に、茨城県で開催された「つくば科学万博」で、デモンストレーションが行われた。

余談だが、つくば科学万博でのパビリオン「富士通パビリオン」は、万博内で最も人気のあった施設のひとつ。

人気の理由は、当時は画期的であったコンピューターグラフィックス(CG)による3D映像の上映にあった。

ATLASの説明は、3D映像の上映前に行われていたが、お目当ての映像の前の余計な時間として、来場者にはあまり印象には残らなかった。

AIによる自然言語の理解

1950年代より始まっていた人工知能の開発のなかで、我々人間が話す「言葉」や「文章」といった自然言語処理、いわゆる「機械翻訳」は、特に注力されていた。

50年以上も、研究と開発を続けられていた機械翻訳が、本格的に花開くのは2000年代に入ってからである。

ひとつめの理由としては、コンピューターの処理速度の画期的な向上。

ふたつめは、インターネットの普及による、ビッグデータの収集からのディープラーニングの提唱によるものであった。

そして、もうひとつ。自然言語の曖昧さを解消するための「統計翻訳」というアイデアが生まれ、AIのアルゴリズムに取り入れられたことにある。

これらにより、2010年代、機械翻訳は躍進的な発展を遂げ、ひとつの完成形を作り上げた。

以下の項目では、それらを紹介していこう。

Google翻訳はココまできている

リアルタイムにテキストを翻訳

 

翻訳アプリの最先端ともいえる「Google翻訳」を紹介する。

Google翻訳は、日本語、英語、中国語、フランス語などをはじめとした103言語間での翻訳が可能。

入力方法は、テキスト入力、音声入力だけでなく、カメラ撮影によるリアルタイム翻訳も可能。

例えば外国で、レストランのメニューをカメラにかざせば、その場で翻訳をしてくれるわけだ。

恋人が着ているTシャツに書かれた、わけのわからない英単語の意味も、すぐに教えてくれる。

統計翻訳が真価を発揮する

前項目でも触れた「統計翻訳」について、少しだけ詳しく紹介する。

「Google翻訳」の精度と速度が上がったのは、全て統計翻訳のおかげといっても過言ではない。

元来、前述したような電子辞書型の翻訳機などは「ルールベース」と呼ばれる方法で、単語や文章の翻訳を行っていた。

「この単語はこう訳す」という決まったルールが組み込まれており、入力された単語に対して、ルール通りの翻訳の答えを示すのであるが、我々が使用する自然言語は、曖昧な表現や、多岐にわたる文法や方言があるため、このルールに乗っ取らない場合が多々ある。

それを解消するために作られた「統計翻訳」

多量の対訳データを解析し、その統計結果から、入力された文章に最適な翻訳を割り出すのである。

「リンゴです」「これはリンゴ」「リンゴだよーん」「リンゴっす」も、総じて「an apple」に類似した英訳となる。

また、翻訳が意にそぐわない場合は、フィードバックを送信することで、翻訳の精度に加担をすることもできる。

使えば使うほど、Google翻訳は進化をしていくのだ。

Google 翻訳

「辞書/辞典/その他」

無料

App Store iPhone「Google 翻訳」

Google Play Andoroid「Google 翻訳」

「イリー」スマフォの次にバッグに入れられる必須アイテム

旅行だけでなく外国人観光客との交流にも

次に紹介するのは、株式会社ログバーが商品化した、世界初のウェアラブル音声翻訳デバイス「ili(イリー)」だ。

2017年初頭に発表されたiliは、スティック型の翻訳機で、ストラップをつけて首から下げることも、ポケットやバッグに入れて持ち歩くことができる。

操作はいたって簡単、ボタンを押して話す(放す)だけ。

吹き込んだ日本語を、0.2秒という超スピードで、他の言語に翻訳し、スピーカーから発してくれる。

翻訳できる言語は、英語、中国語、韓国語の3種類だが、今後も増えていく予定。

ビジネスの方面を考えるのであれば、ポルトガル語や、インドネシア語が優先されるだろう

正直なところ、機能としては前述した「Google 翻訳」の方が、大きく勝っている。

が、iliの良さは、なによりもシンプルさにある。

Google 翻訳を、いざ使うとなると、スマフォの電源を立ち上げ、アプリを立ち上げ、使用言語を選び、マイクアイコンをタップし・・・と、なにかと手数が多い。

iliならば、これを電源ボタン⇒話すボタンの2ステップで完了できる。しかも、そこまでの到達時間は3秒にも満たない。

また、形状も翻訳機として最高、最適なデザインだ。

iliを知らない相手でも、蓄積された過去の経験から、マイクのようでもあり、ボイスレコーダーのようでもあるスティック状のデバイスが、声を吹き込むもの、声が発せられるもの、というのが容易に理解できる。

2020年の東京五輪に向けて

iliの良さは簡単操作やコンパクトさだけではない。

商品名や企業名といった単語を登録することで、商売やプレゼンの場で有効活用できる。

更には、インターネット環境を必要としないので、面倒な接続などが省け、高齢者でも容易に扱える。

また、マイクの集音性が高く、雑踏の中や、うるさい居酒屋のなかでも、しっかりと使用できる。

そもそもの開発コンセプトは、海外旅行に特化したものであったが、迎える2020年の東京オリンピック開催では、更なる活躍が期待できる。

現在でもそうだが、今や日本は中国人を中心とした観光大国になりつつある。

大阪の道頓堀は、国内観光客よりも多く、外国人観光客が割合を占め、東京ディズニーランドのみやげ屋には、中国人が長い列を作っている。

外国人観光客の足は、繁華街やテーマパークにとどまらず、パチンコ店や、古びた温泉宿にまで進出している状態。

それを解消できるチカラがiliにはある。

間もなく、日本には東京五輪という世界的イベントに合わせ、総人口の10%に近い外国人観光客の来日が予想されている。

2020年に向けて、iliは、日本人のマストアイテムとなっていくであろう。

もちろん残念なものもある

Googleが発売した翻訳イヤホン「Pixel Buds」

これを端に発し、いくつかのメーカーが翻訳イヤホンを発売しているが、軒並み低評価である。

理由としてのトップは、翻訳イヤホン単体で全てが完了するわけではなく、間にスマートフォンを介さなければいけないということだ。

前述した「ili(イリー)」の登場後だったので、あたかもユーザーは、

「イヤホンに集音された言葉を、リアルタイムに翻訳してくれる」と解釈していたようだが、そうはいかなかった。

実際は、スマートフォンのマイクに言葉を吹き込んでもらい、それが翻訳されてイヤホンから聴こえるというもの。

更には、そのタイミングを「聞く側」が、イヤホンのボタンをタップすることで起動させるということにも、使用感としての困惑があった。

iliのように、デバイスに言葉を吹き込み⇒相手に聞かせる、という、動作的にシンプルでかつ、あたかも「言葉のバトンを渡す」ようなシステムの方が、現在のところはユーザーの需要に適していたようだ。

翻訳イヤホンの目指すところは・・・?

正直なところ、Googleの発表するデバイス機器に、あまり評価の高いものはないので、今回の「Pixel Buds」も、致し方無いといったところであろう。

しかし、Googleが目指すところは、遥か高みにあることは確実だ。

将来的に、翻訳イヤホンが目指すところは・・・?

・ON/OFFの切り替えなし(断続的に翻訳を行う)

・文節が終了した段階でのシームレス翻訳

・集音された言語すべてをユーザー言語に翻訳

・複数人の声も聞き分け、酷似した声色で同時に発生される

・イヤホンから聴こえる声を、本来の声が邪魔しないノイズキャンセリング

これらが全てクリアすることで、人類は「翻訳イヤホン」をつけてさえいれば、国境、言語の境なく、気軽に会話ができるようになるのだ。

Googleは確実に、これらを目指している。

再びバベルを建てられるのか?

旧約聖書の「創世記」に登場する、巨大な塔「バベル」

世界を覆い尽くした大洪水から、人類と動物たちの種を残したノア。

その息子たちは、いつしか文明と技術の発展により、天まで届く巨大な塔を作り始めた。

塔の巨大さに、地上に生ける、全ての民が、バベルに集まった。

それを見た神は、人々を各地へ散らせるため、彼らの言葉を乱した。

旧約聖書上では、我々人類に国境があり、言語の差があるのは、バベルの塔を建築した戒めとされている。

人類は、技術特異点、シンギュラリティに向けて、言葉の壁を崩そうとしている。

その崩れた壁の瓦礫から、新たなバベルが生まれるのだろうか?

バベルは果たして、人間の作り上げるものになるのか?

人工知能が作り上げたものになるのか・・・?

全ては2045年にわかることである。