スマートスピーカー「Amazon Echo」がもたらす、音声ユーザーインターフェース(UI)による新たな世界。そんな世界は現実に広がっていくのだろうか。専門家らの意見から未来を読むと、GUI(グラフィカルUI)からVUI(ボイスUI)へ普及の潮流は確かなものではあるが、大きな課題が残っていることが分かった。

 20年前、デジタル世界の情報を入手するにはパソコンが基本だった。キーボードとマウスを使って、ディスプレイを操作する時代だ。その後、携帯電話が普及し、10年前の2008年には国内でも「iPhone」が登場して、スマートフォンの時代が始まった。タッチパネル画面に直接タッチ操作するユーザーインターフェース(UI)による、「スクリーンファースト」が市場を席巻した。ここまでのUIは、目と指による操作が必要な、いわゆるGUI(グラフィカルUI)だ。

 「Amazon Echo」やその後ろで動く音声AIアシスタント「Amazon Alexa」の登場は、デジタル世界を操作する道具を「音声」に変えた。GUIからVUI(ボイスUI)へのシフトが起こり始めている。それではVUIが第一のインターフェースになる「ボイスファースト」の時代は本当にやってくるのか。変化が起こるとしたらどのような形で進むのか。

音声は人間にとって最も自然

 音声をインターフェースとして利用するVUIは、誰でも自然に使えるという利点がある。アクセンチュア デジタル コンサルティング本部 マネジング・ディレクターの保科学世氏はVUIへの変化を「自然な流れ」だとみる。同社は、複数のAIサービスを組み合わせて効果的に活用できるようにする「AI Hubプラットフォーム」を提供し、世界中で200社以上のAIを評価している。保科氏のコメントは、そこから得た知見である。

 「これまでのテクノロジーは、人間がテクノロジーに合わせる歴史の繰り返しだったが、VUIでようやくテクノロジーが人間に合わせる時代が到来する。対話をするのは人間にとって当たり前で自然なこと。より自然で当たり前だから、普及は進んでいくと考えている」(保科氏)。

人間の負荷が少ない自然なUIに向かう流れ

 音声認識・音声対話プラットフォームを開発・提供するフェアリーデバイセズ(東京・文京) 代表取締役の藤野真人氏も、VUIへとUIが移行する可能性を示す。

 「スマートフォン時代のスクリーンファーストの波に乗った企業が大きく成長した一方で、パソコンや携帯電話からの転換に遅れた企業は業績が落ち込んだ。同じように、スクリーンファーストで成長した企業が、ボイスファーストで居場所を失う可能性は高い。LINEがスマートスピーカーに注力するのは、そうした危機感の表れではないか」

 音声という新しいUIを手に入れたことで、人間は人間同士のやり取りと同じように、機械とやり取りが可能になる。大きな流れとして、VUIが自然なインターフェースとして受け入れられていく可能性は高そうだ。アマゾンがEchoとAlexaで提示している体験は、人間にとって自然なやり取りで情報を扱える世界の先取りでもある。とはいえ、「すぐに」「すべてが」、VUIに移行していくとは言いにくい。

普及へ課題は「頑固さ」の克服

 その1つが、自然対話技術の課題だ。藤野氏は、「声を文字に変換する音声認識の技術は、ディープラーニング(深層学習)によって大きな進化と成功が得られた。しかし、認識した文字列から意図や意味を理解する自然対話の技術は1980年代から大きなブレークスルーがない」と指摘する。しゃべった音は認識して正しく文字になっても、その意味を理解する力が現段階では不足しているというのだ。

 一問一答形式で、求められるように話さないと理解してくれないスマートスピーカーの「頑固さ」を実感している利用者も多いだろう。「Amazon Echoをはじめとしたスマートスピーカーの今の盛り上がりは、第一次のブーム。ブームはいったん沈静化するだろう。これを乗り越えるには、一問一答の壁を越えるような自然対話技術が必要。技術が使い勝手に追いついたときには、第二次の本格的なブームが到来する」(藤野氏)。

VUI(音声UI)が本格化するには、「一問一答の壁」を越える必要がある
[画像のクリックで拡大表示]

 またアクセンチュアの保科氏も、「何でも音声インターフェースがいいのか? というと疑問がある。機密情報を伝えるようなときは、VUIは適さない。文章を推敲しながら書いたり、編集したりといった、ビジネスで多い利用も音声だけだと難しい」とみる。適材適所を見極めることも、ボイスファーストのアプリケーション開発には重要な視点になる。

B to B市場も見逃せない

 ボイスファーストの動きは、リアルの世界でさまざまなサービスを提供する企業や、自社のビジネスの作業効率向上を目指す企業にとっても見逃せない。

 ボイスファーストが進むと、消費者が接する企業の顔がAIになるという指摘もある。アクセンチュアの保科氏は、「アクセンチュアでは『TECHNOLOGY VISION 2017』で、『AIは新しいユーザーインターフェース(AI IS THE NEW UI)』になるというトレンドを予測している。スマートスピーカーなどのVUIの裏側で自然な対話ができるAIが動くようになると、AIが最前線で消費者の対応をする時代が来る。これは、企業の第一印象を決める顧客担当者や広報担当者が、人間からAIに代わることを意味する。AIを企業の代表として考える必要がある」と語る。

 TECHNOLOGY VISION 2017は世界31カ国、5400人以上の企業幹部の話からトレンドをまとめたレポートである。

 顧客への対応だけでなく、対従業員という側面でも、AIとスマートスピーカーがサービスを提供するようになる。総務部門や人事部門などへの問い合わせは、スマートスピーカーが対応すれば業務の効率化につながる。店内コンシェルジュの代役を期待してEchoを導入しようとするパルコや、在庫検索などでの利用を検討するローソンなどは、VUIとAIの価値をいち早く実践する企業だ(関連記事)。

 トランスコスモス 理事 デジタルマーケティング・EC・コンタクトセンター統括デジタルエクスペリエンス本部⻑の所年雄氏も、スマートスピーカーのビジネス用途に期待を寄せる一人だ。同社は、企業と顧客のチャットボットなどを通じたコミュニケーションを管理するプラットフォーム「DEC Connect(デック コネクト)」をAlexaにも対応させた。この取り組みへの顧客の反響は大きいという。

 「顧客からは、2017年末にアマゾンが発表した『Alexa for Business』への期待の声は非常に大きい。日本のビジネスでは、会議参加者の予定調整や会議室予約、議事録の作成やアクションリストの作成など、オフィス業務は効率化できる余地が大きい。これをVUIで実現したいと考えている」(所氏)。

 一方で、ビジネス用途のB to Bや従業員向けのB to EのVUI活用は、アマゾンやグーグル以外の音声認識エンジンやスマートスピーカーが生き残る道になり得るとの見立てもある。

 フェアリーデバイセズの藤野氏は、「Amazon AlexaやGoogle Homeは基本的には家庭に入るB to Cのツール。Alexaでできることは多いが、企業がビジネスで利用するVUIとしてきめ細かい対応を求めると汎用的なAlexaではできないことも多い。B to BやB to Eで利用するには、技術レベルが高いだけでなく開発の自由度が高いことも求められる。アマゾンやグーグル以外の音声認識技術やスマートスピーカーの開発企業にとって、ここが狙い目になる」と語る。

 ボイスファースト時代は、生活から仕事の場までさまざまな場面で到来する可能性が高い。アマゾンがお座敷を用意するAlexa経済圏の中での成長を期待するか、自社の顔としてのAIやスマートスピーカーには「自前のおもてなし技術」を用意するか──。ボイスファースト時代への移行への悩みは、まだ尽きることはない。

 そして数々のプラットフォーマーの中でアマゾンがどれだけのポジションを占めるのか。それを占うために次回は、アマゾンウェブサービスが社外に提供するAIサービスや、活用事例を見ていきたい。

第5回
米国で普及率2割、毎日利用6割 「話しかける時代」はもうすぐ
第7回
アマゾンの画像認識AIは100人の顔を識別 写真販売の千が活用