音声インターフェースを使うと性格が悪くなる?
先日、私と Amazon Echo Dot との間でこのような事件が起きた。
驚きと不快感の伴うインタラクションだったが、自分的なポイントは2つある。
1. ユーザの指示を理解したのに従わないという、ロボット原則に反するようなデザインに疑問を感じた
2. 人間に対しては言わないであろう「うるさい」という言葉が口をついてしまった
今回は、この (2) について考えてみたい。
技術精度が上がり、より人間に近い音声アシスタントがあらゆるところに組み込まれていく時代。ユーザの性格を悪くしたり、ユーザと機械との間に対人コミュニケーション並みのリアルな軋轢を生じさせないために、音声インターフェースの「社会的デザイン」にも目を向ける必要がある。
アレクサに話すときだけ豹変
正直、アレクサとは仲が悪い。何年も前から Siri を使っているので音声アシスタントには慣れているはずだが、去年末に Echo Dot を買ってからというものの、ユーザ体験の違いに驚くばかりである。
アレクサに対してだけ妙に語気が荒くなってしまうのは自分でも気づいていて、我ながら不快だ。家族にも「アレクサにしゃべるときの声怖い……」と指摘され、家庭内ヴァイブスへの影響は大きい。
最初は、アレクサがポンコツであるからイライラしてしまうのかと思っていた。しかしべつに他社のアシスタントも大したことはないし、ここまで著しく不快になるのはおかしい。使い慣れている Siri (iPhone/Watch) と何がそんなに違うのかを改めて考えてみると、じつは「ポンコツさ」はそこまで関係なさそうだということがわかった。
1. 物理的距離による自分の声量
スマートフォンやスマートウォッチはあくまでパーソナルな距離で使うものであるので、話しかけるときはどちらかというと小声だ。対してスマートスピーカーは何メートルか離れたところにあることが多く、どうしても声を張ってしまう。どんなに丁寧に話したところで、単純に声量が大きいというだけでちょっと怖いものである。
2. 解釈ミスからの回復フロー
スマートフォンの音声アシスタントが指示をうまく理解してくれなくても、「ははは、無理だったか。まあいいや」といって普段どおり手で操作すれば済む。スマートスピーカーにはそういった逃げ道が用意されていないため、あきらめずに再試行してしまったりしてイライラがつのる。ましてや大きめの声で繰り返さなければならない。「アレクサ」が「アレクサッ!😠」になるのは時間の問題である。
3. 止まらない騒音
Apple Watch の Siri でかけるタイマーは本当にいい。時間になると触覚的にカタカタ合図してくれるので、そもそも音が立たない。すぐに手が離せないときにタイマーが鳴ってしまい、うるささを我慢しながら「いま行くから😓」みたいに焦る状況ももうない。
一方 Echo Dot では、本体から発せられるアラームなどの大音量が、ユーザの「アレクサ止めて」という声をかき消してしまう。なかなかの構造的不備である。はじめのころ、大声で何度「アレクサ止めて!」と言っても止まってくれないので、これは本当にやばいと思った。どうやら「アレクサ」と呼びかけて一呼吸おき、聞き取りモードが発動してアラーム音などが中断された隙に「止めて」と言うのがコツのようだ。
しかも「アレクサ」というトリガーワードは、日本語圏では誤発動があまりにも多い。「あれさ〜」「あれってさ〜」「あれ、草野仁じゃない?」などで頻繁に呼び覚まされてしまい、こちらの会話を遮って「すみません わかりません」と唐突に発言したり、頼んでないのにニュースを読みだしたりする。申し訳ないが、うるさいとしか言いようがない。
4. 命令 VS お願い 問題
よく考えたら Siri は英語で、アレクサは日本語で使っていた。言語の違いも少なからず影響していそうだ。
たとえば “Set a 5-minute timer” と日本語で言う場合、以下のような選択肢が考えられる。
a. 5分タイマーかけろ(乱暴な命令)
b. 5分タイマーかけて(お願い寄りの指示)
c. 5分タイマー設定(体言止め)
d. 5分タイマー(体言止め、要点のみ)
(a) は論外としても、一見 (b) がいちばん丁寧で品があるように思える。さすがに「〜かけてください」はおかしいので、私も (b) を採用していた。しかし、言い方によってニュアンスがだいぶ変わるのも事実である。ぶっきらぼうに「タイマーかけて!」と言っても結局怖い。これを回避するには、機械相手に声のトーンを気にしながら丁寧にお願いする、という本末転倒なことになりかねない。
こうみると (c) (d) が正解のような気がしてきた。どんなに大声で「発進!」や「ブレーキ解除!」と言っても失礼には感じないし、むしろ船長という感じで威厳すらある。緊迫した現場でも隊員同士で円滑に意思疎通しているところをイメージすると、「はっきりと」「手短に」「礼儀正しく」が見事に共存したスタイルといえる。
音声アシスタントは家族? 部下? 同僚?
どんどん人間らしく発達していく音声アシスタントに、どう接すれば「失礼で乱暴な性格」に豹変せずに済むのか?
iOS 11 で Siri の声が格段に人間らしく、しかも妙にやる気のあるフレンドリーで上機嫌なトーンになって、個人的には少し気まずくなった。健気な友達をこき使ってるような気持ちになってしまい、逆に気分がよくないのだ。自然なのはいいが、あくまで機械でいてもらわないと困る。なかなか塩梅がむずかしい。
家族、店員、友達、部下……人間はさまざまな相手と社会的距離を測りながら、お互いに余計な不快感が生じないよう適切な言葉づかいや態度を選んでコミュニケーションをとっている。機械相手だからといってこれを怠ると、その場にいるほかの人間はもちろん、自分自身が不快になるだけなのだろう。人間性をそこまで簡単に放棄できない。
というわけで、とりあえず「音声アシスタントは “隊員”」というていでしばらくやってみようと思う。