gpt-4-1

GPT-4.1 モデル のさまざまなバリエーション

OpenAIがChatGPTをリリースしてから2年以上が経ち、一貫した新機能とモデルが次々と提供されてきました。o3やo4-miniといったモデルから、AIエージェントや新機能まで、ChatGPTはさらに進化を遂げています。

OpenAIは、開発者向けの新モデルファミリー「GPT-4.1」をリリースしました。3つのバリエーションで提供され、それぞれが独自の利点を持つGPT-4.1は、以前のモデルと比較してパフォーマンス、速度、コスト効率において大幅な改善を実現しています。

APIラインアップにおけるGPT-4oとGPT-4o Miniの後継モデルとして設計されたGPT-4.1とGPT-4.1 Miniは、大きな進化を遂げています。このブログでは、GPT-4.1とは何か、バリエーション間の違い、以前のモデルとの比較、主要なベンチマーク、特徴的な機能、実際の活用事例などについて解説します。

GPT-4.1とは何ですか?

2025年4月14日、OpenAIはGPT-4シリーズの最新進化として、初のナノモデルを導入しました。GPT-4.1のリリースでは、以前のバージョンと比較して、コーディング能力、指示に従う能力、長文処理能力において大幅な向上を実現しました。

APIを通じて最初にリリースされたGPT-4.1ファミリー(GPT-4.1、GPT-4.1 mini、GPT-4.1 nano)は、後にChatGPTインターフェースに統合されました。これらのモデルは、すべてのベンチマークにおいてGPT-4oとGPT-4o miniを凌駕する性能を示しています。また、長文文脈の理解が強化され、知識のカットオフが2024年6月に更新されています。

GPT-4.1のバリエーション

OpenAIのGPT-4.1シリーズは、コスト、アーキテクチャ、計算効率が異なり、異なるユースケース向けに最適化された3つのイテレーションから構成されています。以下で各モデルを詳細に解説します:

GPT-4.1

コーディング、指示に従ったタスク、長文処理において最高の性能を誇るフラッグシップモデルです。GPT-4.1のアーキテクチャは、複雑なコーディングワークフローや単一のプロンプトで大規模な文書を処理するように設計されています。100万トークンのコンテキストウィンドウをサポートし、他のバージョンと比べてo3-miniと同等の最高性能を発揮します。

GPT-4.1は中程度の遅延を有し、エンタープライズアプリケーション、複雑なコーディングタスク、法的文書分析に最適です。GPT-4oと比較して、GPT-4.1はフロントエンドコーディングにおいて、不要な編集を大幅に削減したクリーンなコードを生成し、より高いパフォーマンスを発揮します。特に、大規模なファイルを扱うAPI開発者向けに、多様なフォーマットに対応した信頼性の高いコード差分を提供します。

GPT-4.1 Mini

中位クラスのオプションであるGPT-4.1 miniは、GPT-4.1とほぼ同等の機能を提供しつつ、遅延とコストを低減しています。GPT-4.1 miniは、インタラクティブなツールでの高速処理、詳細な指示の正確な実行、GPT-4.1よりも低コストな点が特徴で、これらの要件を満たすユースケースに最適です。

教育プラットフォーム、SaaSツール、AIを活用したアプリケーションに焦点を当てたスタートアップに最適です。100万トークンのコンテキストウィンドウをサポートし、より高速で高度な知能を備えています。テキストと画像の両方を入力として受け入れ、APIではテキストのみの出力に対応していますが、ChatGPTインターフェースではビジョン機能も利用可能です。

GPT-4.1 Nano

GPT-4.1のNanoバージョンは、最も小型で高速かつ低コストで、100万トークンのコンテキストウィンドウを完全にサポートします。大規模な文書からの情報抽出、オートコンプリートタスク、分類などに向いています。GPT-4.1 Nanoは軽量で低コストかつコスト効果に優れています。GPT-4.1と比較すると、このモデルは知能面で平均的です。

モデルバリアント入力(Input)キャッシュ済み入力(Cached Input)出力(Output)
GPT-4.1$2.00 / 100万トークン$0.50 / 100万トークン$8.00 / 100万トークン
GPT-4.1 Mini$0.40 / 100万トークン$0.10 / 100万トークン$1.60 / 100万トークン
GPT-4.1 Nano$0.10 / 100万トークン$0.025 / 100万トークン$0.40 / 100万トークン

GPT-4.1の主な特徴

GPT-4.1は開発者向けのモデルで、コーディング、指示に従う能力、および大規模な文脈理解において改善を実現しています。マルチモーダルな構造を備え、信頼性が高くスケーラブルなAI搭載ツールの構築に最適なアーキテクチャを採用しています。以下にその主な特徴を挙げます。

  • プログラミングタスクにおいて最上位の性能を発揮し、SWE-bench Verifiedで54.6%のスコアを記録し、GPT-4.5比で26%向上しています。これにより、現実世界のコード生成やデバッグに最適なツールとなります。
  • GPT-4.1は、よりクリーンで正確なコードを記述でき、コードベースを正しく修正し、不要な編集を2%まで削減します。
  • 複雑な多段階指示、フォーマット規則、負の制約の遵守において優れています。
  • IFEvalやCOLLIEなどの内部ベンチマークで~49–87%の準拠率を達成し、優れた性能を示しています。
  • 大規模なコンテキストウィンドウにより、長文タスクの処理が可能です。特に「針の穴を通す」ようなテストで優れた性能を発揮します。
  • Video-MMEで72%の精度を達成し、動画の字幕、ログ、マルチドキュメントワークフローを正確に処理します。これはGPT-4oと比較して、字幕付きの長動画タスクで6.7ポイント以上の向上です。

GPT-4.1 の活用事例

GPT-4.1 は、ChatGPT モデルにおける速度、精度、効率の優れた例です。GPT-4o と同様のマルチモーダル機能を備え、全体的に明確な改善を実現しています。GPT-4.1 の改善された指示遵守機能は、複数の活用事例において価値あるモデルとなっています。

法務・財務文書レビュー

GPT-4.1は巨大なコンテキストウィンドウをサポートし、単一のプロンプトで法的文書や長大な財務報告書を丸ごと処理できます。弁護士が条項の抽出、不一致の検出、複雑な項目の要約を支援します。多文書法務文書のレビュー精度では、財務・データ抽出タスクで50%の改善を達成しています。

ビジネスオートメーションアーキテクト

構造化されたプロンプトを使用し、GPT-4.1は「ビジネスプロセスオートメーションアーキテクト」として機能し、ワークフローを分析、最適化ポイントを特定、RPA、IaC、またはマクロベースの自動化戦略を提案し、ROIや実装の複雑さをマッピングします。

データ分析と洞察抽出

データ量の多いワークフローにおいて、GPT-4.1は大規模なデータセットや文書を処理し、自動的に洞察を抽出、比較を生成し、競合他社や四半期データの要約を高い精度で作成します。

: GPT-4.1は巨大な文書やPDFを処理できるため、ChatGPTにハリー・ポッターの1冊を提供し、「失ったものは、必ずしも期待する形では戻ってこないが、最終的には戻ってくる」という引用文を探させました。私たちは、その引用文が掲載されているページを特定し、そのページ番号を回答するように求めました。GPT-4.1はPDFを読み込み、引用文の正確な位置と周囲の文脈をPDF内に示しました。

GPT-4.1 PDF 処理

ハリー・ポッターの英語版では、この引用は『ハリー・ポッターと不死鳥の騎士団』の913ページにあります。GPT-4.1は、書籍、文脈、およびPDFのページ番号を含む要約も提供しました。

GPT-4.1 PDF 処理と要約

STEM教育におけるインテリジェント・チュータリング

GPT-4.1はSTEM分野のチューターとして優れた性能を発揮します:文脈に応じたヒントを自動的に生成し、生徒のよくある誤解を特定し、数学の問題解決を適応的に支援します。ある研究では、GPT-4が以前のモデルよりも人間らしい、教育的に適切なヒントを生成し、生徒の自己修正を効果的に支援することが示されました。これらのツールは学習効果とエンゲージメントを向上させます。

例 : GPT-4.1は難しい質問にも賢い回答を返すため、寒冷地でのハイブリッド車の燃費効率を改善する方法について尋ねました。ChatGPTは、燃費効率を最適化するステップバイステップの戦略を提示しました。

複雑な質問に対する GPT-4.1

GPT-4.1は、参照元を明示した引用を提供し、情報の確認を容易にしました。GPT-4oと比べて、回答はより詳細で、散在するアドバイスを整理し、読者が最も重要な点を理解できるように優先順位を付けています。ただし、GPT-4.1のように引用を明示的には表示しません。

参照を含む複雑な質問に対する GPT-4.1

プロンプトキャッシュによる効率化

反復処理やバッチ処理において、GPT-4.1はプロンプトキャッシュをサポートしています。これは、システム指示や例示などの静的入力セクションを複数の呼び出し間で再利用する機能です。これにより、変更のないコンテンツの再処理を回避し、速度向上とコスト削減を実現します。ユーザーは、プロンプトに静的プレフィックスとユーザー固有のデータを末尾に配置することで、80~90%のコスト削減を報告しています。

信頼性の高い指示解析とタスク自動化

GPT-4.1は、多段階の指示を高い精度で実行する能力が大幅に向上しました。構造化されたコマンドを信頼性高く解釈し、例えば「まずこのフィールドを抽出、次にそのセクションを要約、最後にチャートを生成」といった指示を正確に実行します。

これにより、以前のChatGPTモデルでみられた誤解が大幅に減少します。エージェント型ワークフローでは、ユーザーはGPT-4.1にアクション(クエリ、処理、応答)を自動的に連鎖させるようにプログラムでき、タスクをエンドツーエンドで実行する自律型エージェントの信頼できる基盤となります。

GPT-4.1へのアクセス方法

当初、OpenAIはAPIのみでGPT-4.1の3つのバリエーションをリリースしました。5月、ユーザーはChatGPT内で直接GPT-4.1とGPT-4.1 miniにアクセスできるようになりました。無料プランのユーザーは、GPT-4oの制限に達するとGPT-4.1 miniを使用する必要があります。一方、ChatGPT Plus、Pro、Teamのユーザーはモデル選択画面からGPT-4.1を手動で選択できます。ChatGPT EnterpriseとEducationのユーザーは近日中にアクセス可能になります。

開発者はAPI経由でGPT-4.1のバリエーションにアクセスでき、Azure OpenAIでもサポートされており、微調整機能も利用可能です。OpenAI APIコンソールでは、APIキーを使用してGPT-4.1とインタラクションできます。プレイグラウンドでは、完了テスト、温度設定、トークン数、その他のパラメーターを調整してテストできます。

GPT-4.1 vs GPT-4o

新しいGPT-4.1モデルファミリーは、コーディングタスクに特化して設計されています。このモデルはGPT-4oの機能を向上させつつ、遅延をほぼ同じ範囲に維持しています。開発者は応答速度を犠牲にすることなく、より高いパフォーマンスを得られます。

大規模なコードベース、正確な差分編集、包括的な文書推論を含むプロジェクトに携わる開発者は、GPT-4.1を利用できます。以下はGPT-4.1がGPT-4oよりも優れている理由の一部です。

  • GPT-4.1は、GPT-4oの2023年10月までのデータに対し、2024年6月までのデータで訓練されており、より最新の知識ベースを備えています。
  • GPT-4.1は100万トークンに対応しており、GPT-4oのコンテキストウィンドウは128Kトークンです。
  • GPT-4.1はSWE-bench検証で54.6%のスコアを記録したのに対し、GPT-4oは33%に留まっています。
  • GPT-4.1はAiderの多言語差分タスクでほぼ2倍の精度を達成し、不要なコード編集を約9%から約2%に削減しています。
GPT-4.1 モデル比較
  • MultiChallengeにおいて、GPT-4.1は11%のスコアを記録し、内部指示遵守率は29%から49%に上昇しました。
  • GPT-4.1のMMLUスコアは90%で、GPT-4oは86%です。
  • APIコストの削減:入力+出力のコストが約26~30%安価で、100万トークンあたり$2/$8に対し、GPT-4oは$2.50/$10です。GPT-4o miniはGPT-4oよりも50%低い遅延時間を実現し、さらに83%安価です。

GPT-4.1 vs GPT-4.5: GPT-4.5プレビューのAPIにおける性能低下

OpenAIは2025年4月14日にAPIでGPT-4.1をリリースしました。その後、5月にChatGPTインターフェースにも追加されました。GPT-4oと比較して、コーディング、指示の遵守、知能の面で複数の改善が施されています。

研究プレビューとして、OpenAIは計算リソースを大量に消費するモデルの実験のため、GPT-4.5もリリースしました。開発者は移行対象となり、2025年7月15日よりAPIでのサポートが終了します。GPT-4.1はテスト済みで、より優れ、コスト効率が高く、遅延が低いことが確認されています。

項目GPT-4.1GPT-4.5
リリース日2025年4月14日 2025年2月27日 
知識カットオフ2024年6月 2023年10月 
入力コンテキスト100万トークン 12.8万トークン 
最大出力トークン32,768トークン 約16,384トークン 
SWE-Bench Verified(コーディング)54.6 % 38 % 
Aider’s Polyglot(Diff)約52.9 % 44.9 % 
Instruction Following(OpenAI内部評価)約49.1 % 約54 % 
Multi-Challenge(長文理解)38.3 % — (未記載)
ビジョン(Video-MME)72.0 % — (未公開)
入力トークン単価$2 / 百万トークン $75 / 百万トークン 
出力トークン単価$8 / 百万トークン $150 / 百万トークン 
コスト比GPT-4.5 の約22.5倍安価 
API 廃止予定非該当2025年7月14日にAPIでの提供終了予定 

GPT-4.1 へのプロンプト作成のベストプラクティス

  • 明確に指示する: GPT-4.1 は指示を文字通りに従うため、曖昧さを避けてください
  • プロンプトの構造化: 明確なセクションを使用(例: 役割 → 指示 → 理由 → 出力形式 → 例)
  • 長いコンテキストにおけるプロンプトの配置: コンテキストの前後両方に指示を含める(「サンドイッチ方式」)
  • エージェント型ワークフロー: 計画と継続性を促す(例: 「完全に解決されるまで続ける」)
  • ツール使用のガイドライン: APIのツールフィールドでツールを定義し、詳細な説明と使用例を明記する

結論

GPT-4.1は、より信頼性の高いコード生成、指示遵守の向上、真の長い文脈処理、およびより迅速な反復サイクルを提供します。GPT-4.1は以前のモデルを凌駕しています。また、コスト効率が高く生産性に優れているため、速度、コスト、一貫性が優先される場面で強力な選択肢となります。

よくある質問

GPT-4.1はChatGPTのユーザーが利用できますか?

はい、GPT-4.1はChatGPT Plus、Pro、Teamユーザーがモデル選択画面から利用可能です。無料ユーザーには自動的にGPT-4.1 Miniが割り当てられ、エンタープライズとエデュケーションプランは近日中に利用可能になる予定です。

GPT-4.1の可用なバージョンと違いは何ですか?

GPT-4.1はコーディングに優れたフルパフォーマンスのフラッグシップモデルです。GPT-4.1 miniはGPT-4.1と比較して遅延とコストが50%低減されています。一方、Nanoバージョンは最も高速で安価なバリエーションで、シンプルなタスク向けに最適化されています。これらのすべてのバリエーションは、100万トークンのコンテキストウィンドウをサポートしています。

GPT-4.1は画像生成や音声入力に対応していますか?

いいえ、GPT-4.1は入力においてマルチモーダルですが、画像の理解と処理は可能ですが、出力はテキストのみに限定されています。