1️⃣ はじめに
2024年9月12日よりChatGPTの最新モデルとしてOpenAI o1の提供が開始されました!
2️⃣ OpenAI o1とは?
OpenAI o1モデルの主な特徴は以下の通りです。
深い思考能力
OpenAI o1は、応答する前により多くの時間をかけて思考するように設計されています。人間のように問題を解決する際に時間をかけて考え、思考プロセスを洗練し、異なる戦略を試みる能力を持っています。
高度な推論能力
以前のモデルよりも複雑なタスクを推論し、特に科学、コーディング、数学の分野でより難しい問題を解決することができます。
横軸:GPT-4oに対する勝率(%)
縦軸:上から順番に文章作成、文章編集、プログラミング、データ分析、数学的計算
優れた学術性能
OpenAI o1は、物理学、化学、生物学の難しいベンチマークタスクで博士課程の学生と同等の成績を達成しています。また、国際数学オリンピック(IMO)の予選試験では56%の正答率を記録し、GPT-4oの13%を大きく上回りました。
※左から順に数学コンテスト、コーディングコンテスト、博士課程の科学分野の問題
「o1」は今後公開予定の最終版のモデルです。
安全性の向上
OpenAI o1は新しい安全性学習手法を採用しており、従来のモデルよりも安全ルールを厳密に守ることができるようになっています。
※GPT-4oモデルでは、ジェイルブレイク(ChatGPTのガイドラインを回避して回答を生成させる行為)の耐性が22%であったのに対して、o1-previewモデルでは、84%と大幅に向上しています。
不正なプロンプトが実行されてもジェイルブレイクが行われる可能性は低くなりました。
2つのモデル
OpenAI o1シリーズには、高性能な「o1-preview」と、よりコストパフォーマンスに優れた「o1-mini」の2つのバージョンがあります。o1-miniは処理速度が約3~5倍高速で、コストも80%削減されています。
ChatGPT PlusまたはTeamユーザーは、ChatGPTのインターフェースでモデルを選択して利用できます。ただし、使用回数に制限があり、o1-previewは週50メッセージ、o1-miniは1日50メッセージまでとなっています。
特徴 | o1-preview | o1-mini |
---|---|---|
推論能力 | より高度 | o1-previewよりやや劣る |
処理速度 | 標準 | より高速 |
コスト | 高い | o1-previewの約20% |
週間利用制限 | 週50メッセージ | 1日50メッセージ |
最大出力トークン数 | 32,768トークン | 65,536トークン |
主な用途 | 高度な技術開発、研究プロジェクト | 小規模プロジェクト、基本的な自動化タスク |
コーディング能力 | 非常に高い | o1-previewと同等 |
リソース消費 | 多い | 少ない(軽量) |
複雑なタスク処理 | 優れている | やや劣る |
「o1-preview」は、ベースモデルであり、数学・科学・コーディング分野の問題を解決するための能力が優れています。
「o1-mini」は、「o1-preview」の高速モデルで、特にSTEM分野に強いという特徴があります。
※STEM:Science(科学)・Technology(技術)・Engineering(工学)・Mathematics(数学)の頭文字をとった言葉です。
このように、OpenAI o1は特に複雑な推論や学術的な問題解決において優れた性能を発揮する新世代のAIモデルとして注目されています。
3️⃣ OpenAI o1の使用方法
現在、OpenAI o1を利用するためにはChatGPTの有料プランに加入する必要があります。
- 有料プランを契約した状態で、ChatGPTのトップページにアクセス。
- 左上のモデル名をクリックすると、モデルを選択する画面が出てくるので、「o1-preview」か「o1-mini」を選択してください。
- 他のモデル同様にChatGPTにメッセージを送信してください。
※リリース直後のためWeb参照やファイルのアップロードなどの機能は実装されていません。
4️⃣ GPT-4oで漫才してみた
漫才を書かせて比較してみました。テーマは「スターバックス」です。
まずは従来のモデルGPT-4oで漫才を生成してみました。
うーん、60点?
スターバックス特有のメニューや注文方法、トールやグランデなどの用語に対する戸惑いをテーマにしたネタであるのはわかるのですが、
- 『コーヒー、トールで』とか言ったら、『僕も背伸びしてる感じで』って言いたくなるよ!
- 『僕も背伸びしている気分になるよ』が自然でしょうか?
- 『タナカサン』と呼ばれたがぼーっとして気づかず、3回も呼ばれて照れくさかった。
- 『タナカサン』はありきたりなので、もう少し面白い名前にしたいですね。また、ぼーっとしていた理由もほしいところです。
もう少し工夫がほしいところですね!
(漫才評論家!?笑)
5️⃣ OpenAI o1で漫才してみた
続いて、最新モデルのOpenAI o1で漫才を生成してみました。
テーマは同じ「スターバックス」です!
おー、こ…これは!80点!
中々考えられている気がしますね!
- 最初と最後の「水」を使ったオチ
- Wi-Fiのパスワードは企業秘密、さらに「神様」ならわかるでしょというお客からのツッコミ
ネタのフリとオチがごく自然で違和感なく読めますね!
単純なプロンプトを与えただけでしたが、応答前に「思考時間」を取るよう訓練されている効果でしょうか?
比較すると確かにOpenAI o1の方がよく作り込まれている気がします…笑
ぜひ皆様もお試しください!
6️⃣ さいごに
- 最後までお読みいただきありがとうございます!
- この記事へのご質問やアドバイスがありましたら、ぜひコメントもお待ちしております。
- X(Twitter)でもVBA、Python、AIに関するアウトプットをしていますので、フォローいただけますと嬉しいです😆