
現在JavaScriptが無効になっています
Yahoo!ニュースのすべての機能を利用するためには、JavaScriptの設定を有効にしてください。
JavaScriptの設定を変更する方法はこちら
配信
AICX協会の小澤健祐代表理事と、Verbex森下将憲CEO
ChatGPTの登場以降、テキストベースのAI活用は日常化しました。そして今「テキストの次」、すなわち「リアルタイム音声対話AI」へのシフトが加速しています。一方で、実際にビジネス現場へ導入しようとすると、そこには「精度の壁」「感情表現の壁」といった技術的・実務的な課題が立ちはだかります。 【写真を見る】音声AIエージェントの市場規模など 音声AIは単なるインターフェースを超え、自律的に動くAIエージェントとして社会インフラになり得るのでしょうか? AICX協会代表理事の小澤健祐氏に「声をインターフェースにした顧客体験」の現在地と、今後の展望を聞きました。聞き手は音声AIスタートアップのVerbex(東京都渋谷区)代表の森下将憲氏。前後編でお届けします。
森下: 音声AIが求められる背景や現状をどう見ていますか? 小澤: ChatGPTにも音声で対話する機能はありますが、音声を一旦文字にして処理をするという変換でした。それがGPT-4oの時から、音声をそのまま処理できるようになっています。そして、今まで欠けていた感情や抑揚、話すスピードといったテキスト以外のニュアンスまで取り込み、処理できるように進化してきています。 リアルタイムの音声処理はスマートスピーカーの時代からありましたが、当時はほとんどがルールベースと辞書処理で実現されていたので、”対話”というには少し違和感がありました。ただ今はAIの盛り上がりもあり、2026年はリアルタイム音声AIが起爆剤になる1年になっていくのではと思っています。 森下: LLM(大規模言語モデル)の技術が改善し、気持ちのいい対話ができる音声AIが出てきています。それとは別に、人間にとって音声が“楽”という潜在的ニーズがずっとあると思っています。 メッセージアプリだと、テキストを打つのは結構大変なので、スタンプを多用するなど、インターネット上の情報からテキストが減っています。よりイージーなコミュニケーション手法に移ってきています。音声が楽、という背景は非常に大きい要素だと思っており、技術の進歩と合わせて「爆発的に普及する」状況になってくるように思っています。 小澤: 実際、最近はタイピングが苦手になってきている気がしますね。イヤホンを使えば、周囲のノイズをカットして私の声しか拾わないので、駅のホームでもどんなところでも、恥ずかしがらずに音声入力を利用しています。 例えば製造現場でも、作業をしている人が全員イヤホンマイクをつけていて「目の前でこの部品がこうなっているんだけどどうしたらいいですか?」と問い合わせると。AIが「それはこうしてください」と回答する。こんな状況も近い将来ありうるかなと感じています。
1/2ページ
通勤手当で購入した「定期券」を休日遊びに行くときにも使っています。会社には黙っていますが、あとでバレたら返還を求められることはあるのでしょうか…?
65歳以上「貯蓄4000万円以上ある世帯」の割合とは【老後の生活費の平均】うちは赤字か、それとも黒字か
ホルムズ海峡混乱による供給ショック、需要急減につながる瀬戸際に
F-2戦闘機を“世界最強レベル”にしませんか!? 退役目前のはず…米企業が「F-35並み」能力向上策を提案していることが判明
月給5年連続引き上げの公算 国家公務員、ボーナス焦点
《従業員がレジ内で大乱闘》新宿・歌舞伎町のローソン店内で“ガチ喧嘩”…店舗は「ケガはありませんでした」と認める
「非課税世帯になんてならなければよかった」狙って勝ち取った〈住民税0円〉、役所から届く“ピンク色の封筒”に歓喜していたが…89歳母の老人ホーム入居時、制度の隙間を突いた66歳息子が大後悔したワケ
桐谷広人さんの「NISA活用術」と「高配当で優待ももらえる2銘柄」を紹介! 配当利回り4%超で「QUOカード」がもらえる「日産東京販売HD」と「ダイコク電機」に注目
36歳、36年落ちのロータスを買う! 福岡〜東京自走引き取りで気づいた意外過ぎる居住性とは?
金利6%でもインフレは止まらない? 世界が「石器時代」に逆戻りする衝撃のシナリオ
Copyright © 2026 ITmedia Inc. 無断転載を禁じます。