トピックス

ユーザー疑問の構造化に関する研究 第1回
人の言葉をコンピュータは理解できるのか

デジタルコミュニケーション

1.「機械学習」の大きな影響力

皆さんは「Google翻訳」を利用されたことがあるでしょうか。多数の言語間の翻訳を行ってくれるとても有用なサービスです。2021年5月現在、この「Google翻訳」はニューラルネットワーク(※)という機械学習の手法によって高精度の翻訳を実現しています。これは、原文を単語ごとに翻訳するのではなく、「翻訳文」を予測し表示する、という手法です。この予測の精度の高さが、正確性の高い翻訳を可能にしています。

ニューラルネットワーク:人間の神経回路を真似して、入力層→1つ以上の隠れ層(中間層)→出力層という多層ネットワークを構成する手法を指す。

引用:atmarkit https://www.atmarkit.co.jp/ait/articles/1901/06/news046.htmlより

同じ技術をカスタマーサポートに応用することを考えてみましょう。「Google翻訳」では原文に対して「翻訳文」を 予測 していましたが、同じ技術で「お客様の問い合わせ内容」を原文として「回答内容」を 予測 すれば、理論上はカスタマーサポートに応用できるような気がしますよね。

2.プラグマティクス(※)の高い壁

しかし、このような 予測 がそのままカスタマーサポートに使えるかと言えば、実はそうではありません。というのも、人間の発する言葉には「言外の意味(Implication)」が含まれていて、TPOによって同じ言葉が別の意味を表すことも少なくないからです。つまり、書き下せば同じ文字列となる日本語でも、人によって言いたいことが異なるケースがある、ということです。実例で見てみましょう。

プラグマティクス:語用論。表現と意図との関係の研究。人は必ずしもことばの意味どおりに意図を伝えるわけではない。

引用:imidas(イミダス) https://imidas.jp/genre/detail/L-105-0012.htmlより

例文)「昨日買ったばかりのエアコンなのに、冷風が出ないのです」

この例文が表す事実は、「エアコンを昨日買った」「そのエアコンから冷風が出ない」という2つです。カスタマーサポートとしては「冷風が出ない」が問い合わせであるため、それに対するアンサーを出すことになります。案内するべき内容は「原因」「修理窓口」「保証期間」が浮かびます。しかし、日本語の難しいところは、こうやっていくら考えたところで、実際にお客様が言いたいことはお客様にしか分からない点にあります。お客様が言外に忍ばせた意味は「貴社の製品は信用できないから返品したい」かもしれないですし、「自分の店が本日営業できなくなったから休業補償をしてほしい」かもしれないのです。

このように、「言いたいこと」と「発する言葉」に一対一の関係がなく、「言葉どおり解釈するだけでは言いたいことが捉えられない」ことを前提として、その関係を研究する学問をプラグマティクスと言います。
プラグマティクスは、下図1のイメージをご覧ください。

図1 プラグマティクスのイメージ(発言と意図の違い)

「Google翻訳」の場合とは異なり、カスタマーサポートではこのプラグマティクスが問題となります。翻訳の場合、原文以外の意味は言外に置いておくことができますが、カスタマーサポートにおいてはむしろ言外の意味こそがサポートすべきポイントであり、これを特定して適切なアンサーを返すことが至上命題となるからです。

このプラグマティクス問題を解決するために、「国立情報学研究所(National Institute of Informatics:NII)」より学術指導を受けながら、当社独自の研究を開始しました。以下、本件に関する国立情報学研究所・相澤彰子教授に見解を伺いました。

言語処理の世界でも、異なるコミュニティやドメイン(分野)を橋渡しすることの難しさは広く知られています。ここでは円滑なコミュニケーションを妨げる「言葉の壁」の問題を、文体の違い、意味の違い、解釈の違いに分けて考えてみましょう。

文体の違いとは言い回しの違いです。たとえばSNS上の若者言葉と新聞記事の文章とは、ずいぶん違っています。このような文体の違いを埋めるために、言語処理では機械翻訳の技術を使います。同じ言語同士なら文法は同じとはいえ、耳慣れない言い回しはコンピュータにとっても外国語と同然ということですね。機械翻訳の進歩は目覚ましく、大量の例文を準備することができれば、かなりの結果が期待できます。

しかし機械翻訳では、文体には対応できても意味の違いまで埋めることはできません。文をそのまま翻訳しても、知らない言葉はわからないままです。また言葉の意味は、人それぞれの知識や経験によっても変わってきます。同じ言葉を聞いても違う受け止め方をしている場合もあります。アツモリはゲームでしょうか? 信長が好んだ演目でしょうか? 近年では深層学習を用いて文脈から意味を予測する方法が広く用いられるようになり、コンピュータはときとして、人間以上に言葉の予測が得意であることがわかってきました。

解釈の問題は、「言葉はその文字通りの意味を表していない」ことにあります。「サイズがあわないんですが」に「返品されますか?」と返答できるのはどうしてでしょうか? 対話における発話は、それを通して相手に何らかの意図を伝達する機能を果たしています。このような意図の解釈は、機械翻訳や意味予測の手法では対応することができず、対話システム研究の難問となっています。その解決に向けた一歩として注目されるのが、話者の間で共通の理解基盤を構築する「コモン・グラウンディング」の技術です。「コモン・グラウンディング」は、たとえば部屋の中で「上の方の大きなカップ」の指示先を「赤い花柄のカップですか?」「いえ、その右の無地の青です」「あ、ポットの隣りですね」などの対話を経て互いに了解するプロセスです。

相手が思い描いている世界を予測して、その予測が正しいかどうか対話を通して確認しながら、自分の世界と対応づけて行く……。そうした対話戦略は円滑なコミュニケーションに欠かせないものといえるでしょう。

図2 コモン・グラウンディングのイメージ(話者の間で理解基盤を構築する)

「ユーザー疑問の構造化に関する研究」では、こうして始まった学術指導から得られた成果を我々がどのようにチャットボットやFAQの改善に応用していったか、事例をご紹介していきます。ご期待ください。

さて、本稿タイトルにある「人の言葉をコンピュータは理解できるのか」ですが、上記に基づくと「できない」が回答になります。人の言葉をインプットとして翻訳したり加工したりはできるものの、人間のようにその言葉が表す意味を理解して適切な反応を返すというのは、非常に難しいと言えます。ここでご紹介したいのが、相澤先生の見解の中にある「グラウンディング」です。グラウンディングとは、言葉や文に、「意味」をヒモづけることを言います。次回の記事では人工知能(AI)にグラウンディングをさせる試みについてご紹介します。

研究者

相澤彰子 氏
国立情報学研究所:コンテンツ科学研究系教授
専門分野:自然言語処理・情報検索

研究紹介

言語テキストから"知"を生み出す
人間にとって、言葉は不可欠な道具です。たがいに意思を伝え合うコミュニケーションの手段として、また記録を伝えるためにも必要です。逆にいえば、言葉の使われ方を解析すると人間の活動を垣間見ることができます。私の興味は、実にその点にあります。
言語は人間の知的な活動の基盤であり、コンピュータによる言語処理は、知能システムの欠かせない構成要素となっています。言語処理により人間の情報収集・発信や意思決定を支援するためには、単にコンピュータでテキストの意味を解析するだけではなく、テキストの読み手・書き手である人間が、どのように言語を処理しているかを想定して、システムを構築する必要があります。本研究では、深層学習を含む機械学習、コーパス分析、アノテーションなどを用いて、コンピュータによるテキストの意味解析と人の言語活動のモデル化、および両者をつなぐ手法の開発に取り組んでいます。

ご意見・アドバイス

  • 「モノ・コト」の構造化はオントロジーと呼ばれる学術領域があるが、ゼロからオントロジーを構築するのは非常にコストがかかる
  • 今回の取り組みでは、オントロジーの概念を活用し、ラベルやタグ、アノテーションの組み合わせで実現できるかもしれない
  • 言葉と言葉の繋がりの研究は自分の経験が活かせる領域であり、構築している分析資産を活かせる可能性も高い

担当者

斎藤弘光
SCSKサービスウェア株式会社
デジタルサービス推進部 デジタルコミュニケーション課

経歴

2000年旧サービスウェア・コーポレーション(現SCSKサービスウェア)に入社
主に流通サービス系の受託業務、新規プロジェクトのプロジェクトマネージャーおよび立上業務に従事
2010年営業および業務支援部門に配属
流通サービス・金融・情報通信・製造の新規業務委託案件の案件醸成および
案件獲得後の立ち上げ支援業務に従事
2016年デジタルサービス推進部に配属
チャットボットシステムの調査・検証・販売支援、流通サービス・金融における導入支援業務に従事
2018年「ユーザー疑問の構造化研究」に参画

本取り組みに向けた抱負

  • 現在市場に流通するチャットボットやWebFAQシステムなどのシステムを導入するだけでは、ユーザーの自己解決率向上には繋がらない
  • 本研究を通じて、ユーザーの自己解決に繋がるユーザーにとっての“分かりやすさ”の向上や、QAデータの運用管理における企業サイドの負担軽減に取り組んでいきたい

関連コンテンツ

この記事をシェアする

一覧に戻る