【会話型AI】Amazon Lexが日本語に対応

2021年4月2日、Amazonによる会話型AIサービス「Amazon Lex」が日本語に対応したことが発表されました。

そもそも、Amazon Lexとは何なのか?という内容も含めて、ニュースの概要をまとめてみたいと思います。

Amazon Lex

Amazon Lexとは、Amazonが提供している会話型AIサービスの名称です。自動音声認識自然言語理解機能を持っています。自動音声認識の機能によって、私たちが発する音声を認識してテキストに変換することができます。変換されたテキストの内容から、自然言語理解機能によって意図を理解することができるのです。

例えば、会議を行っているときの出席者の発言内容をテキストに変換する、いわば文字起こしのようなことができるわけですね。さらに、そこから重要ワードを抜き出すこともできると。

最近だと、Abemaで記者会見を中継しているときなんかに人工知能による文字起こしが使われていたりします(ただし、結構間違っていたりするのでまだまだ改善の余地はあると思います笑)。このAbemaで使っているものがAmazon Lexなのかどうかは分かりませんが。

Amazon Polly

本題とは少しずれるのですが、AmazonはAmazon Lexの他に、Amazon Pollyというサービスも提供しています。これは、Amazon Lexとは少し違って、テキストの内容を音声に変換するサービスです。

多数の言語での読み上げに対応しており、もちろん日本語も対応しています。ちなみに、日本語では女性の読み上げボイスをMizuki、男性をTakumiとして配信しています。従来の機械音声に比べるとかなり自然になっており人間の声に近づいています。Amazonの公式サイトでサンプル音声を聞くことができます。下のリンクからどうぞ。

Alexaとの違い

AmazonのAIサービスといえばAlexaがありますよね。Amazon LexAlexaはどのような違いがあるのでしょうか。

一言で説明するならば、Alexaは商品Amazon Pollyは環境といったところでしょうか。

Alexaというのは、スマホのアプリとして配信されており、スマホにインストールすればアラームの設定や音楽再生などあらゆる場面で活用できます。Alexaを使って何かをする、という風に既に商品として使えるものです。

一方、Amazon LexというのはAlexaなどのサービスを構築するための環境を準備したものです。プログラミングをするための開発環境というイメージに近いと思います。私はそういう風に理解しています。

Amazon Lexの使用例

例えば、ホテルの予約を行うためのサービスを作るとしましょう。

まず、ユーザが発する音声を認識する必要があります。ホテル予約に関するフレーズを設定しておきます。Alexaの場合は「Alexa」、Siriだったら「Hey, Siri」というワードで起動しますよね。このように、システムが起動するためのフレーズを設定するのがこのステップです。

次に、予約に必要な情報を聞き出します。チェックイン予定日、ホテル名、泊数など必要な情報をそろえないとホテルの予約はできませんからね。この情報を聞き出すための質問をシステム側に準備する必要があります。「どこのホテルを予約しますか?」「何泊しますか?」「何日にチェックインしますか?」「何名で利用しますか?」などの質問文を設定します。

ユーザが想定している内容とシステムが聞き取った内容が一致していないと後でトラブルが発生しますので、それを避けるために、予約内容の確認が必要です。「〇〇ホテルに〇名、〇〇日の〇〇時にチェックイン予定でお間違いないですか?」のような確認の文章を想定しておくといいかもしれません。

予約内容が確認出来たら、Amazon Lexから実際にホテルを予約するためのAPIなどを呼び出して情報を渡せば予約が実現できます。APIとは、Application Programming Interfaceの略であり、ソフトウェアからOSの機能を利用するための仕様・インタフェースのことを言います。詳しく知りたい方は、下にWikipediaのリンクを載せておくので、参考にしてみてください。

最後に

人工知能の研究もすごく進んでいますね。Pepper君のようなロボットを家に準備するのは大変ですが、今はAlexaやSiriなどで同じようなサービスを利用することは可能です。

ホテルの予約くらいだったら自分でやってもいいですけど、記者会見の文字起こしのような内容を人工知能で行えるようになると、マスコミの必要性が減ってしまいますよね…コロナ対策にもなるしマスコミを嫌う人たちも大勢いるので良いことなんでしょうけど(笑)。

個人的には、車をよく使うので、近くのガソリンスタンドの中で安い場所はどこか?というのを運転中に調べれる音声サービスなどがあると便利だなーと思いますね。運転中はスマホ操作なんて出来ませんからね。


ということで、今回はここで終わりです。最後までお読みいただき、ありがとうございました。