AMSはインボイス制度適格請求書発行事業者です

【速報】OpenAIが新モデルGPT-4oを発表!人工知能が会話のスピードで応答!

🔻内容を動画で見る

画像をクリック(タップ)するとYouTubeが開きます

こんにちは、皆さん!今回は、2024年5月14日にOpenAIが発表した最新モデル、GPT-4oについてお話しします。結論から言うと、GPT-4oは音声対話が人間の会話スピードでできる画期的なAIモデルで、なんと無料で試せるんです!では、その詳細に入っていきましょう。

🔻内容を音声で聞く

目次

最新モデル「GPT-4o」の登場!「omni」の名を持つ、AIの革命児!

まず、最新モデル「GPT-4o」についてです。

GPT-4o(フォー・オー)は’o’は’Omni’(すべて)を意味し、音声、視覚、テキストをリアルタイムで処理できるという意味を持っています。その名の通り、全てのモダリティをカバーするこのモデルは、より自然でスムーズな対話を実現します。

GPT-4oの主な特徴は以下の通りです。

  • マルチモーダル対応: テキスト、音声、画像の組み合わせを入力として受け取り、同様に多様な形式の出力を生成可能。
  • 高速応答: 音声入力に対して232ミリ秒、平均320ミリ秒で応答し、人間の会話とほぼ同等のスピード。
  • 多言語対応: GPT-4 Turboと同等の英語およびコード処理能力を持ち、非英語テキストでも大幅に改善、50か国語以上の言語をサポート。
  • コスト効率: APIではGPT-4 Turboよりも2倍高速で、価格は半分、レート制限は5倍に。

まさに、AIの進化を象徴するモデルと言えるでしょう。

音声認識、多言語対応、セキュリティ…全てがパワーアップ!

以前のモデルでは、音声をテキストに変換し、そのテキストを処理して再度音声に変換するために遅延が生じていました。しかし、GPT-4oではこれが一つのモデルで処理されるため、遅延が大幅に削減されました。

さらに、背景のノイズや複数の話者を区別できる機能も搭載されています。特に驚きなのは、人間らしい抑揚をつけた会話が可能な点です。

例えば、『抑揚をつけて』と指示すると、まるで演劇のような大げさな口調で返事をしてくれるんです。この進化により、リアルタイムの音声翻訳やインタビュー準備など、さまざまな場面でその効果を発揮します。」
また、フィルタリングやポストトレーニングも強化されているようで、つまりバイアスやセキュリティー面も対策されているんです。

リアルタイム翻訳から数学学習まで、可能性は無限大!

GPT-4oはリアルタイム翻訳から数学学習まで、可能性は無限大!

無料ユーザーへのGPT-4oの解放

最も衝撃的な発表が、無料ユーザーへのGPT-4oの解放です。これにより、無料ユーザーもGPT-4レベルのAIが使えるようになります

無料ユーザーが利用できる機能としては、写真の解析、PDFやCSVファイルのアップロードと内容の要約・分析、GPTストアの利用、そしてGPT-4とGPT-4oへのアクセスです。

ただし、無料ユーザーにはメッセージ制限があり、利用制限に達するとGPT-3.5に自動で切り替わります。また、新しいGPTsを作成することはできませんが、既存のGPTsを利用することは可能とのことです。

まとめ

今回のOpenAIのイベントは、AIの進化を象徴する内容でした。OpenAIの最高技術責任者であるムラティ氏は、

ここ数年はモデルの知能強化に取り組んできたが、今回は使いやすさを追求する第一歩

と話しています。
最新モデルGPT-4oの登場と無料ユーザーへの解放により、AIはより多くの人にとって身近なものになるでしょう。
今後のAIの進化がますます楽しみですね!

AIの便利な機能や最新情報を発信中!つねちゃんのAI未来クリエイターズ公式LINE
友だち追加
シェアよろしくお願いします
  • URLをコピーしました!
目次