ブロックチェーンニュース

IBMが革新的なWatson Large Speech Modelを発表、顧客サービスのAI対話を飛躍的に向上

IBMが新しいWatson LSMを開発し、顧客サービス向けのAI通話対話を強化。英語と日本語で利用可能なこのモデルは、高精度で音声認識を行い、現在クローズドベータ版で提供中です。

Published

on

from IBM’s new watson large speech model brings generative AI to the phone .

IBMは、新しいWatson Large Speech Model(LSM)を開発し、電話を通じたAIとの対話を可能にしました。このモデルは、特に顧客サービスの分野での自動音声応答(IVR)システムを進化させ、リアルタイムの通話文字起こしや自己サービス型電話アシスタントなどに利用されます。LSMは、トランスフォーマー技術を基にしており、大量のトレーニングデータとモデルパラメータを使用して、音声認識の精度を高めています。IBMは英語と日本語のLSMを開発し、現在クローズドベータ版としてWatson Speech to Textおよびwatsonx Assistantの電話顧客に提供しています。内部ベンチマークによると、IBMのLSMは短い英語の音声データにおいて、OpenAIのWhisperモデルよりも高い精度を示し、誤語率(WER)が42%低いと評価されています。また、Whisperモデルよりも5倍小さく、同じハードウェア上で10倍速く処理が可能です。クローズドベータプログラムへの申し込みを通じて、IBMの製品管理チームが連絡を取り、LSMの利用を開始できます。ただし、LSMはまだ開発中の機能もあり、IBMの計画や意図は予告なく変更される可能性があることに注意が必要です。

Trending

モバイルバージョンを終了