私たちは人と話すとき、言葉を省略したり、2人だからこそ分かる言葉を用いたりするなど、相手との関係に合わせた(空気をよんだ)コミュニケーションを意識することなくとっています。つまり、言葉の使い方が「あいまい」であっても相手の関係次第で意図が伝わったり、伝わらなかったりするのが人間らしい言語コミュニケーションの特徴の一つです。
人工知能(AI)技術の急速な進歩により、ウェブサイトで使える外国語の翻訳機能の性能が日々向上しています。しかし各個人が発する「あいまい」な言葉を、相手の意図をよんで正確に翻訳できるまでには至っていません。将来的にそこをクリアしたとき、誰もが国や言語を越えてコミュニケーションをとることができ、さらには人間とロボットが言葉による円滑なコミュニケーションをとることも可能になると考えられます。
今回は「言語コミュニケーション」、中でも「自然言語処理」が専門の井佐原均心理学部教授による、人間らしい言語コミュニケーションのカギを握る「あいまいさ」の解説です。
INDEX
言語コミュニケーションとは何か
近年、急速に進化した自然言語処理の技術
(編集部)まず「言語コミュニケーション」の定義をお聞かせください。
(井佐原)言葉を使うやり取りすべてを意味します。日常的な雑談から文章を書いたり読んだりすることなど、「読む、聞く、話す、書く」ことを通じて外部とコミュニケーションを図ることです。
人間が発する「言葉」とコンピューターのプログラムを書く「プログラミング言語」を区別するために、前者を「自然言語」と呼んでいます。自然言語は大きく2つにわかれ、音声という音響信号を文字に変換したり、文字から音声に変換したりするスピーチ(音声)。もう一つはテキスト(文字)です。人工知能(AI)が前後の文脈を読みながら意味や意図を正しく理解することを目指す「自然言語処理」で、私の研究分野はこのテキストのほうです。自然言語処理の技術は近年、ニューラルネットワークやディープラーニングの進展に伴って急速に進化を遂げています。
コンピューターの黎明期からあった研究
(編集部)自然言語処理とはつまり、AIが人間の言葉を理解するための技術ということでしょうか。
(井佐原)というよりも、AIが自然言語処理の技術を活用しているイメージです。ですので、AIの要素技術と言ったほうがわかりやすいでしょう。自然言語処理という分野はAIよりも歴史があり、コンピューターの黎明期から存在していました。第2次世界大戦時に暗号解読のためにコンピューターが利用されていたと言われていますが、暗号とは文章を記号に置き換えて、それをさらに文章に戻す作業です。ロシア語をまったく理解しない人にとっては、ロシア語で書かれた文章は暗号と同じです。しかしこの技術によって、日本語からロシア語、ロシア語から日本語に置き換えられると立派な翻訳システムになります。
AIによる自然言語処理技術の現在地
機械翻訳の「流暢度」は完璧に近いが多くの課題も
(編集部)機械翻訳はとても身近な存在になっていますが、現状の技術レベルはどうなっていますか。
(井佐原)機械翻訳はウェブサイト上の外国語翻訳機能にも搭載されており、一度は使ったことがある人も多いでしょう。現状の機械翻訳は、与えられた文章を一文ごとに意味が通るように処理していて、一つの文を一つの文に置き換えることはかなりうまく行くようになっています。機械翻訳は流暢度(fluency)と忠実度(adequacy)で評価されます。流暢度は完璧に近いと言われている一方、忠実度はまだ怪しく、人間と同じか、人間よりもやや良い程度だとされています。
(編集部)人間と同じか、やや良い。凄いレベルに達していると感じますが。
(井佐原)あくまで一つの文から一つの文に翻訳する能力の話であって、文の集まりである文章についてではありません。日本語の場合、主語省略が可能ですが、一つの文しか見ないので主語を補うことは難しいですし、まだまだ文脈や社会常識が使えるレベルには達していません。
対応が一文ずつなので、最初の文でこう訳したらならば次の文も同じように訳すべきだと思われる場合でもそうならなかったり、日本語にしかない表現をどう英語に置き換えるかであったり、いろんな課題があります。
AIによって進展を遂げた対話型システム
(編集部)自然言語処理の技術を活用した事例は他にもありますか。
(井佐原)機械翻訳のほかには、チャットボットなどの対話システムにも同じ技術が使われています。チャットボットは多くのWebページや官公庁の問い合わせシステムに組み込まれています。いずれも人間が入力した内容に対して、どの程度正しく対応した答えが見つけられるかが重要です。チャットボットのしくみは単純で、質問と回答のペアが塊としてあり、ユーザーが入力した問い合わせ内容との距離(類似性)計算をして、一番近いと判断したものを表示する構造です。昔であれば、合致する単語が3つと2つの場合、多いほうの3つを選ぶという簡単なシステムでしたが、今はニューラルネットワークによって文と文の意味的な距離計算が可能になって、これまで以上にうまく照合ができるようになっています。この点は最近の大きな進歩です。
「あいまい」な問いにどう対処しているか
(編集部)検索結果のリストからユーザーに答えを選ばせる単純なFAQ検索システムと違って、対話型であるチャットボットには、あいまいな入力も多いのではないでしょうか。
(井佐原)私が実際に関わっている自治体でも、やり取りを見ていると、あいまいな問いかけが結構あります。例えば「印鑑証明できますか?」という問い方では、印鑑を登録したいのか、印鑑登録証明書を発行してほしいのか、よくわかりません。印鑑登録に関係する業務に登録、証明書発行、廃止があるとすれば、「これらのうちどれですか?」と聞き返す。これによって、あいまいな状況を具体的にしていきます。
観光情報の問い合わせの場合でも、具体的な場所ではなく「景色のよい高いところ」とか「大阪の名物が安くてたくさん食べられるところ」など「あいまい」であることが多いのですが、こうしたキーワードでも今、期待に応えられるような回答を導き出せるようになってきています。
対話機能を搭載したロボットの研究
(編集部)実際に形を持ったロボットとの言語コミュニケーションの研究も進んでいるのではないかと思います。
(井佐原)「知の拠点あいち」というプロジェクトで実際に企業と組んで、その研究を進めています。企業が開発したロボットに対話機能を搭載し、介護施設に導入する実験です。「くるみ」と名付けられた巡回型ロボットで、夜間に介護施設内を動いて、入居者が歩き回ったり、倒れていたりしていないか見回ります。夜間はフロアが一人体制になるので、職員の方が何かの対応をしている時でも、もう一人が見回ってくれている状態にできます。
「くるみ」には対話機能を入れていますので、昼間は入居者さんとのコミュニケーションを担わせようとしています。仮に入居者さんから何度も同じ話を聞かされたとすると職員さんにはストレスになりますので、そこをロボットが引き受けたり、職員さんが多忙な時に話し相手になったりという形で介入する一方、健康に関することなど本当に大事なやり取りは職員さんが行う。こういう形でロボットを導入することで、全体として介護の品質が上がると考えています。完全に人をなくすことは想定しておらず、ルーティン的な仕事はロボットが引き受け、重要な業務は引き続き人間が担うという共存を目指します。
今後は介護施設だけではなく、巡回型ロボットという形をとるかどうかわかりませんが、病院への導入も考えています。
介護施設におけるコミュニケーションのパターンを学習
(編集部)「くるみ」の言語コミュニケーション能力はどの程度でしょうか。
(井佐原)今のプロジェクトを通じて、対話機能を段々と足している段階で、まだ不十分ですが少しは喋ります。学習していくことで雑談を引き受けてくれるまでになればと考えています。
そのためには、介護施設の会話パターンに対応させることも大切です。今、介護施設で数名の方にICレコーダーをつけていただき、職員さんと入居者さんとの普段の会話を録音する作業を進めています。何らかのパターンを見いだして、このような入力にはこういう出力で返すという型を入れていくようにします。これを蓄積することで、入居者さんの話しかけに対して職員さんと同じような対応ができるようになることを目指しています。
ただし、会話の録音だけではデータの蓄積としては量的な限界があります。現在は新聞が電子化していますので何十年分にわたる新聞記事の情報を活用することができるし、ウィキペディアだけでも相当な量です。このような大量のデータを集めて一般的な知識を数多く学習させます。それに加えて我々のケースですと、介護施設で集めた少量のデータで付加価値をつける。こうしたAIの強化学習を通じて、特定の目的に沿ったものをつくっていきます。
「あいまい」表現の会得に向けて
ロボットに「人間味」のあるコミュニケーションは可能か
(編集部)大量にデータを集めることは、機械が一般常識を学習するということにつながるのだと思います。その先に、コミュニケーションにとって大切である「人間味」や「あいまい性」まで盛り込むことはできるのでしょうか。
(井佐原)そこが一番大きな問題で、どの程度相手の意図に沿った答えを返してあげられるのか。同じ発言であっても違う意図を持つことがある、「あいまい性」がコミュニケーションの特徴で、毎回の発言の意図を汲めるかどうかが難しい部分です。単純な例ですと「暑いですね」という言葉に対して「あなたが暑いということを理解した」と返してもコミュニケーションにはなりません。「エアコンをつけましょうか」や「窓を開けましょうか」と言うべきでしょうし、雑談でも相手の満足度が高まるようなやり取りをしないといけない。難しいことですが、チャレジングな研究であり、ぜひやってみたいことです。
ロボットが自然なコミュニケーションを図れるようになるには、AIの中核技術であるディープラーニングを用いて、大量のテキストデータから単語の意味を学習させていくことが必要です。例えば、「ご飯を食べる」「パンを食べる」という言葉を集めていくと、「食べる」という表現の前、「〜を」の目的語の部分には、「食べ物に関する言葉が来る可能性が高い」という推測ができるようになります。日常会話の中にある共通項をいかに集め、推測する精度を高めることが不可欠であり、それにはデータの蓄積がカギとなります。
人間らしいコミュニケーションの実現のために
AIが個人ごとの好みなどに対応できるか
(編集部)介護施設でロボットが、自然な言語コミュニケーションを含めて、思い通りの働きをしてくれるのはいつ頃になりそうですか。
(井佐原)今は5年後がどうなっているかわからない時代。求める程度にもよりますが、3年後などのスパンになるのではないでしょうか。
今後の研究課題は、個人ごとの対応です。この人は「ご飯が好き」で「パンが嫌い」という知識を蓄積するとともに、「ご飯が好き」なら「和食」も好きという風に変換するなど、直接的に表現していない部分をどう判断するか。声の掛け方も人によって変わります。パンしか用意がない時、「きのうはご飯だったから、パンで気分が変わっていいですね」なのか、「申し訳ないけどきょうはパンしか出ないんです」と言うべきか、まったく同じ状況でも人によって変えないといけませんし、これは普段我々が自然に行っている言語コミュニケーションです。
人間はスーパーコンピューターより計算力、記憶力ともに劣るのに、なぜここまでの複雑な処理ができるのか。それは脳があるからです。だからスーパーコンピューターを発展させることではなく、人間の脳と同じようなものをつくれるかどうかがカギ。それには本学のように「人工知能領域」と「認知科学領域」が共同で研究を進めていくことが重要です。
まとめ
日常のコミュニケーションにおいて、何気ない会話の裏にある「あいまいさ」を意識することはほとんどありませんが、研究内容を聞く中でハッと気づかされる場面が多々ありました。「あいまいさ」が人間らしいコミュニケーションを特徴づけるものであり、また人工知能(AI)にとってクリアすることが難しい課題ということもよく理解できました。
将来的に人間と円滑なコミュニケーションのできるロボットが実現されれば、個人秘書のような形で連れて歩くだけで世界中の人とコミュニケーションをとることができる可能性もあり、自分の視野や見える世界がぐっと広がるでしょう。人手不足解消の観点から介護・医療の分野での早期実用化が望まれますが、特定の分野の話ではなく私たち一般についてもとても身近なテーマだと認識を新たにしました。