\AI人材の採用で企業成長を加速/
AI人材を獲得できるサービスが知りたい方は以下の記事がおすすめ!
ChatGPTの最新モデル「GPT-4o」とは
生成AIツール「ChatGPT」は、2024年5月13日に最新モデルとなる「GPT-4o」を発表しました。
「o」は「オムニ(omni)」の略で、読み方は「ジーピーティーフォーオムニ」です。
オムニ(omni)という言葉は、ラテン語で「すべての」という意味を持つ「omnis」に由来しています。
従来のモデルと比較して高性能なGPT-4oは、今後さまざまなシーンでの活用が期待されています。
過去のモデルとの違い
ChatGPTの新モデルであるGPT-4oは、過去のモデルと比較すると非常に高性能であると謳われています。
ChatGPTがリリースされた当初は、ユーザーからのテキストによる問いかけに、テキストでChatGPTが回答する形式でした。しかし、GPT-4oはテキストだけでなく音声・画像・動画を1つのモデル内で扱える構造になりました。それにより、音声モードの応答スピードや、英語以外の言語のパフォーマンス向上など、処理の精度・速度ともに格段に改善されています。
具体的には、以下のような特徴があります。
GPT-4oの特徴
多様な入力・出力チャネルへの対応
「すべての」という意味を表す「omni」というだけあって、テキストだけでなく音声・画像・動画というオムニチャネルに対応できるようになったのは大きな改善ポイントでしょう。
GPT-4oでは、テキスト・音声・画像・動画での入力に対応しており、テキスト・音声・画像での出力に対応しています。そのため、「動画の内容の要約文を出力してもらう」「箇条書きした要望に沿った画像を作成してもらう」といった複数チャネルを組み合わせた使い方が可能です。
処理速度の向上
前バージョン(GPT-3.5)と比較して処理速度が2倍になりました。また、トークンの最適化により、少ないトークン数で処理が可能に。トークン効率が1.4倍向上したため、体感的には3倍近く文章生成速度が上がっています。
音声入力の応答スピード向上
音声入力の性能も向上し、人間の応答時間に近い応答が可能になりました。具体的には、最短232ミリ秒、平均320ミリ秒です。遅延が発生しないため、人間同士でのやり取りに限りなく近い形でストレスなくChatGPTと対話ができるでしょう。
英語以外の言語のパフォーマンス向上
ChatGPTは米国のOpenAI社が開発しているため、どうしても英語以外の言語の精度はそれほど高くありませんでした。しかしGPT-4oでは、英語以外の言語のパフォーマンスが向上しています。
もちろん日本語のパフォーマンスも向上し、画像に含まれる日本語の認識性能も格段に上がっています。「今までは英語でプロンプトを入力していた」という人でも、安心して日本語で利用できるようになるでしょう。
ChatGPT「GPT-4o」の利用料金
ChatGPTのGPT-4oは、有料プラン・無料プランどちらでも利用可能です。ただし条件などが異なります。
有料版「Plus」で利用可能
ChatGPTの有料プランである「Plus」では、GPT-4oを標準利用できます。Plusは月額20ドル(2024年7月時点)で提供されています。すでに搭載されている「GPT-3.5」と「GPT-4」のほか、「GPT-4o」も選択できるため、必要に応じて使い分けると良いでしょう。3時間あたり80回まで利用でき、制限に達した場合は他モデルを選択すればChatGPTを使えます。
無料版では制限付きで利用可能
GPT-4oは無料版でも利用できますが、利用制限が設けられています。大きな違いは、メッセージ数です。有料版では3時間あたり80回まで利用できるのが、無料版だと5時間あたり10回と、極めて少なくなります。また、画像生成や音声入力には対応していないため注意が必要です。
\AI人材の採用で企業成長を加速/
AI人材を獲得できるサービスが知りたい方は以下の記事がおすすめ!
GPT-4oの特性を活かした活用シーン7例
GPT-4oはどのようなシーンで活用できるのか、例をご紹介します。
なお、Plusユーザーであることを前提としている内容となっています。
シーン1:アイデアの壁打ち
アイデアの壁打ちについて精度が向上しています。
より幅広い文脈や複雑な質問への理解が深まり、それに基づいた答えを提供する能力が強化されました。また、長い会話や複数の問い合わせにわたって文脈を維持し続ける能力が向上したため、ユーザーとの対話がよりスムーズになり、必要な情報を逃さずに対応できるようになっています。GPT-4oとやりとりを重ねることで、新たな気づきが得られるでしょう。
シーン2:文章の添削
文章の添削についても精度が向上しました。
例えば、ビジネス文書や学術論文の校正において、文法の誤りや表現の改善点を正確に指摘し、流暢で洗練された文章に仕上げます。また、多言語対応が強化されているため、翻訳だけでなく翻訳の添削精度も上がっています。
シーン3:手書きメモから図解案を作成
資料やWebサイトなどに図解を入れたくても、デザインのスキルがなくて自分で作成できないという人も多いはず。
GPT-4oに手書きのメモを読み込ませると、自動で図解案を提案してくれます。もちろん、テキストで指示を出して図解を作成してもらうこともできるため、自分が使いやすい方法を選びましょう。
シーン4:データの分析・グラフ化
表や箇条書きなどでデータを送り、どのような分析をしてほしいか指示を出すだけで、データを基に複雑な分析ができます。
分析結果のグラフ化や図解などもしてくれるため、分析作業や資料作成が効率化するでしょう。また、GPT-4oはOneDriveやGoogle Driveと連携できるため、ドライブ内に保管しているデータを参照元として提示することも可能です。
シーン5:会議内容の文字起こし
会議をしながら、メモや議事録を記録するのは大変、多くの人にとって大変手間のかかる作業ではないでしょうか。
GPT-4oの音声入力機能を使えば、会議などの文字起こしが即座に完了します。また、要約や要点の箇条書きなども作成できるため、後から確認することやメンバーへの共有もスムーズです。会議自体にに集中でき、時間を有効に活用することができます。
【文字起こしの手順】
- マイクボタンを押して会議等の内容を録音する、もしくは、録音データを準備する。
※音声入力・音声会話機能は公式スマートフォンアプリで標準搭載、
Webブラウザ版ではChrome拡張機能「Voice Control for ChatGPT」が必要。 - プロンプトで文字起こしを依頼する。
- ChatGPTからの回答を確認・適宜修正する。
シーン6:リアルタイムでの翻訳
音声入力機能を使うと、リアルタイムで同時翻訳することも可能です。
今までは海外の人と英語でやり取りしていた方も、これからはお互いに母国語でコミュニケーションを取ることができるようになります。
シーン7:スポーツやゲームのルール説明
スポーツを観戦したりゲームをプレイしたりするときに便利なのが、スポーツやゲームの動画を読み込ませると、GPT-4oがルールを説明してくれる使い方。
ルールだけでなく簡単なポイントや注意点などもまとめてくれるため、1から調べる必要がありません。
他にも、精度が向上している点が多くあります。ぜひ実際に触れてその違いを実感してください。
実務ですぐに活用できるプロンプトを多数ご紹介!
生成AIを使いこなそう
ChatGPTのGPT-4oは、生成AIを使っている人にとって大きなトピックです。テキストだけでなく音声・画像・動画に対応しているため、今よりも活用の幅が広がるでしょう。
ChatGPT以外にも、テキストや画像などに対応している生成AIは複数あります。目的や業務内容などに合わせて、自分に合う生成AIを活用してみてください。
AI人材を獲得できるサービスが知りたい方は以下の記事がおすすめ!
AI人材の研修ならこちらのサービスがおすすめ!
生成AI活用による業務効率化のサポートを受けたい方はこちらのサービスがおすすめ!
執筆:西 並子
編集:平山 理沙