OpenAIは「12 Days of OpenAI(12日連続でのプレスリリース)」の6日目にChatGPTのAdvanced Voiceモードにビデオおよび画面共有機能を追加したことを発表しました。また、10日目には電話やWhatsAppを通じたChatGPTへの接続機能を導入したことを発表しました。いずれも音声や画像、動画といったマルチモダリティを前提とした、新たな生成AI体験を提案したものとなっています。
Advanced Voiceでのビデオ機能
OpenAIは「12 Days of OpenAI」の6日目に、ChatGPTのAdvanced Voiceモードにビデオおよび画面共有機能を追加しました。この新機能により、ユーザーはChatGPTとリアルタイムでビデオを通じた対話が可能となり、会話がよりダイナミックで魅力的なものになります。ユーザーはタスクを視覚的に示したり、画面を共有して共同作業を行ったり、50以上の言語で自然な音声対話を楽しむことができます。例えば、コーヒーの淹れ方について、自分のセットアップをカメラで見せてリアルタイムでガイドを受けることができます。
この機能を利用するには、対応するデバイスでChatGPTアプリのAdvanced Voiceモードを有効にする必要があります。この機能はPlusおよびProユーザーを対象に1週間かけて順次展開され、企業および教育機関のユーザーには来年初めに提供される予定です。
ChatGPTの電話アクセス
「12 Days of OpenAI」の10日目には、OpenAIがChatGPTに電話やWhatsAppを通じた接続機能を導入しました。この新しい機能により、最新のデバイスを持っていないユーザーや、データ接続が不安定な地域でもChatGPTを利用できるようになります。
アメリカでは、1-800-CHAT-GPT(1-800-242-8478)に電話することで音声でChatGPTと対話できます。世界中のユーザーは、WhatsAppを使用してテキストベースでAIアシスタントとやり取りが可能です。電話サービスは、古いデバイスでも機能する柔軟性を備えています。たとえば、折りたたみ式の携帯電話や回転式電話を使用しても、ChatGPTにアクセスすることが可能です。
利用を促すために、アメリカのユーザーには毎月15分の無料通話時間が提供されます。追加の通話時間が必要な場合は、ChatGPTアプリを通じてアカウントを作成することで、さらなる機能と時間を利用できます。この新しいアクセス方法により、OpenAIはChatGPTの高度な機能をより幅広い層のユーザーに提供し、技術環境に関係なくAI支援を享受できる環境を整えています。
「ChatGPTの会話体験革新」について一言
Advanced Voice自体にも衝撃を受けましたが、画像や動画を用いた会話ができるようになった、ということも凄まじいですね。言葉で表現することが難しい場合など画像を見せるだけでアドバイスを受けることができます(逆に画像も交えた最適なコミュニケーションに習熟する必要がありますが)。また、ChatGPTへの電話アクセスというのは、「ChatGPTさん」の電話番号が決められていて、そこに電話するとChatGPTとやりとりしてくれる、というもので、インターネットの品質が十分でない環境下でとても重宝されるでしょう。
Advanced Voice含めたリアルタイム音声会話機能、とてもすごいことはわかりますが、なぜか春頃にリリースされてから使っていません。理由を考えてみると、パブリックスペースにいるのであまり電話習慣がない、またはGUIベースのUIに慣れきってしまっており情報伝達を目的としたやり取りにおいて音声会話は逆に非効率であると感じているため、ということがある気がします。テクノロジーを使いこなすという意味ではトライすべきなのでしょうが、この辺りデジタルデバイスへの習熟度合いによって、即メリットを感じるかどうかは変わって来そうです。