OpenAIは、ChatGPTの新機能「Read Aloud」を発表しました。この機能は、ChatGPTがユーザーに対してその回答を声で読み上げることを可能にします。Web版およびiOSとAndroidのChatGPTアプリで利用可能となっています。
Read Aloud機能は37言語に対応しており、読み上げるテキストの言語を自動で検出します。この機能は、GPT-4とGPT-3.5の両方で使用できます。ユーザーは、ChatGPTに書かれた回答を声で読み上げさせることができ、プロンプトに対して常に声で応答するように設定することも可能です。モバイルアプリでは、テキストを長押ししてRead Aloudプレイヤーを開き、読み上げを再生、一時停止、または巻き戻すことができます。Web版では、テキストの下にスピーカーアイコンが表示されます。
この機能は、ユーザーが移動中などに便利であり、OpenAIがマルチモーダル機能(複数の媒体を通じて読み取りと応答を行う能力)を活用する例として注目されています。これは、競合他社のAnthropicが類似の機能をAIモデルに追加した直後に発表されました。また、2023年9月には、ユーザーがタイピングせずにチャットボットに直接プロンプトを尋ねることができる声のチャット機能がChatGPTに導入されています。
【ニュース解説】
OpenAIがChatGPTの新機能「Read Aloud」を発表しました。この機能により、ChatGPTはユーザーの入力に対する回答を声で読み上げることが可能になります。この機能はWeb版とiOS、Androidのアプリ版のChatGPTで利用でき、37言語に対応しており、テキストの言語を自動で検出します。ユーザーは、ChatGPTによる回答を声で読み上げさせることができ、また、プロンプトに対して常に声で応答するように設定することも可能です。
この技術の導入は、特に移動中や手が塞がっている時など、ユーザーが画面を見ることが難しい状況での利用を想定しています。また、視覚障害を持つユーザーにとっても、情報へのアクセスが容易になるという大きなメリットがあります。さらに、多言語対応により、世界中の多様なユーザーが自分の母国語でサービスを利用できるようになります。
しかし、この技術の導入には潜在的なリスクも伴います。例えば、プライバシーの問題が挙げられます。声での応答が周囲に聞かれることで、個人情報が漏洩する可能性があります。また、技術の誤用による偽情報の拡散や、悪意ある目的での利用も考えられます。
規制に関しては、この技術がもたらす影響を考慮し、個人情報保護やデータの安全性に関する規制が強化される可能性があります。また、AI技術の発展に伴い、その使用に関する倫理的なガイドラインの策定も求められるでしょう。
将来的には、この技術の進化により、より自然な会話体験や、ユーザーのニーズに合わせたカスタマイズされた情報提供が可能になると期待されます。また、教育や医療、ビジネスなど、さまざまな分野での応用が期待され、人々の生活や働き方に大きな変化をもたらす可能性があります。
from ChatGPT can read its answers out loud.