米オープンAIが新モデル「GPT-4o」を発表　文章・音声・動画の同時処理が可能に

TBS NEWS DIG Powered by JNN

2024-05-14 04:41

米オープンAIが新モデル「GPT-4o」を発表　文章・音声・動画の同時処理が可能に

対話型AI「チャットGPT」を手掛けるアメリカのオープンAIは、文章や音声、それに画像・動画を同時に処理できる新たなモデルを発表しました。

13日に発表された新たなモデル「GPT-4o」では、AIが文章や音声、それに画像・動画を同時に理解・処理することが可能になったほか、処理速度が改善され、質問に対し平均0.3秒で回答できるといいます。

人の会話の中で相手の言葉に反応する速度とほぼ同じだといい、より自然な会話が可能です。

オープンAIがこの日公開したデモンストレーションでは、紙に書いた一次方程式をカメラで映しながら、解答方法を示すよう音声で指示すると、AIが会話ベースで答える様子が紹介されました。

「GPT-4o」は、きょうから一部機能が無料で使用できるほか、今後、新機能も追加される予定です。

グーグルもあす、AIに関する発表を行うとみられていて、開発競争が加速しています。

最終更新 2024-05-14 04:41

キューブ・ソフトからのお知らせ