ここから本文です

「OK、Google」が認識しやすい話し方は…

R25 6/27(月) 7:01配信

端末、アプリなど、音声認識に対応したスマホサービスが増えている。しかし、CMでは呼びかけにスムーズかつスマートに反応しているものの、実際には正確に聞き取ってくれないことも…。ひょっとして、自分の声は認識されにくい? 音声認識が“苦手”とする声のトーン、話し方はあるのだろうか。「OK、Google」でおなじみのGoogle社を直撃した。

「たとえば声が低かったり、早口だったりという理由で認識しないということはありません。人間が聞き取りやすいスピードで、アナウンサーのように滑舌よく話せば判別しやすくなるのは確かですが、とりあえずは気にせずに話しかけてみてください。徐々に認識精度が上がっていきますよ」(Google・プロダクトマネージャー 徳生裕人さん、以下同)

Googleは2009年から日本語での音声検索サービスを開始。「機械学習」という手法が取り入れられ、過去に検索された音声データを基にして、音声認識システムが自ら学習していくという。データの蓄積に応じて精度が上がるため、開始当初より随分進化している。しかし、苦手とするケースも一部あるようだ。

「データが少ない方言などは比較的苦手です。また、文脈がある場合は別ですが、『はし(橋・箸・端)』や『あめ(雨・飴)』などの同音異義語は、単語のみで検索しようとすると認識しない可能性があります。さらに、複数の声を聞き分けることはまだ難しいので、2、3人が一気に話しかけると全ての声を拾ってしまい、結果としてエラーになってしまう可能性があります」

しかし、これらの苦手分野も“機械が賢く”なっていくことによって克服され、よりスムーズに認識するようになるとか。

「今話題の『ディープラーニング』を取り入れたことで、音声と雑音を上手に切り分けることができるようになり、さらに精度が上がりました。ぜひ一度、雑踏の中などで試してみてください。また、機械に言葉を理解させるための『自然言語処理』技術が向上したことで、『渋谷駅周辺のイタリアン』のように助詞や語句を省略したようなざっくりとした文章を吹き込んでも、渋谷駅近くのイタリアンレストランを検索して表示するなど、理解力は向上しつつあります」

技術の向上により、“聞き取る力”と“理解する力”を着実に兼ね備えてきているようだ。認識されないとお悩みの方は、まずははっきりと、わかりやすい声で、言葉を吹き込んでみよう。それでももし、正確に認識されなかったとしても、新しいデータとして蓄積されることになる。諦めずにスマホに話しかけていれば、いつか認識してくれるようになるかも?

(末吉陽子/やじろべえ)


記事提供/『R25スマホ情報局』
(R25編集部)

※コラムの内容は、フリーマガジンR25およびR25から一部抜粋したものです
※一部のコラムを除き、R25では図・表・写真付きのコラムを掲載しております

最終更新:6/27(月) 7:01

R25

記事提供社からのご案内(外部サイト)

R25[アールニジュウゴ]

リクルートホールディングス

特別号は随時発行。編集部の
お知らせなどで告知予定

0円

[特集テーマ]更新中!
・会社では学べない!ビジネスマン処世術
・お得に、スマートに、マネー得々大学院
・恰好いいパパに!オトコの子育て道場