2025年5月22日リリースの最新AIモデルの詳細比較
特にOpus 4の秀逸な点は、Context Windowは200Kですが、「忘れない」というのが特徴のようです。現在までのモデルは、プロンプトとそれに対する回答数が多くなると忘れることがありました。Opus 4は、質問や検索と回答の内容を忘れることなく「全て」覚えていてくれて対応するらしいとのことです。
はじめに
2025年5月22日, Anthropicは次世代のClaudeモデルとして「Claude Opus 4」と「Claude Sonnet 4」をリリースしました。これらのモデルは以前のモデルから大幅に性能が向上し、特にコーディング能力と長文処理能力に優れています。この文書では、両モデルの主な違いと特徴を詳しく比較します。
基本的な位置づけ
Claude Opus 4
Anthropicの最高性能モデルであり、「世界のトップコーディングモデル」と位置付けられています。複雑で長時間を要するタスクやエージェントワークフローにおいて持続的な高性能を発揮します。数時間にわたって自律的に作業を続けることができ、旧世代Sonnetモデルよりも大幅に改善されています。
Claude Sonnet 4
Claude Sonnet 3.7を大幅に改良したモデルで、優れたコーディング能力を持ちながらも、日常的なタスクに適した効率的なモデルとして設計されています。高いボリュームのユースケースや広範なAIシステム内のタスク固有のサブエージェントとして効果的に機能します。
主要スペック比較
機能/特徴 | Claude Opus 4 | Claude Sonnet 4 |
---|---|---|
レスポンス速度 | ||
コンテキストウィンドウ | 200K トークン | 200K トークン |
最大出力 | 32,000 トークン | 64,000 トークン |
学習データカットオフ | 2025年3月 | 2025年3月 |
価格 (入力) | $15/100万トークン | $3/100万トークン |
価格 (出力) | $75/100万トークン | $15/100万トークン |
キャッシュ書き込み (5分) | $28.75/100万トークン | $3.75/100万トークン |
キャッシュ書き込み (1時間) | $30/100万トークン | $6/100万トークン |
キャッシュヒット & リフレッシュ | $1.50/100万トークン | $0.30/100万トークン |
利用可能なプラン | Pro, Max, Team, Enterprise | 無料プランを含む全プラン |
ハイブリッドモデル構造
Claude Opus 4とSonnet 4はどちらも「ハイブリッドモデル」という新しい構造を採用しており、以下の2つの応答モードを提供します。
- ほぼ即時の応答モード
- スピーディな対話や簡単なタスクに適しています。従来のモデルと同様に素早く応答します。
- 拡張思考モード (Extended thinking)
- より深い推論が必要な複雑なタスクに対応します。モデルがより長い時間をかけて考え、より高品質な回答を提供します。
この構造により、タスクの複雑さに応じて適切な処理モードを選択し、効率とパフォーマンスのバランスを最適化します。
両モデルの共通の新機能
- ツール使用を伴う拡張思考 (ベータ版)思考中にウェブ検索などのツールを使用できるようになり、モデルが思考とツール使用を交互に行うことで回答の質を向上させます。
- メモリ機能の向上開発者がローカルファイルアクセスを提供するとき、アップロードされたファイルを作成・維持し、長期的なタスク認識を向上させます。重要な事実を抽出・保存して継続性を維持し、時間の経過とともに知識を蓄積します。
- 並列ツール実行複数のツールを同時に実行できる機能が追加され、効率的な情報収集と処理が可能になりました。
- 行動改善ショートカットやループホール使用が45%減少し、エージェントタスクでの不適切な動作が大幅に改善されました。特にショートカットやループホールに弱いエージェントタスクにおいて効果が顕著です。
ベンチマーク性能比較
両モデルは主要なベンチマークで高いスコアを記録しています。特にコーディング能力において顕著な性能向上が見られます。
Claude 4モデル ベンチマークパフォーマンス比較
ベンチマーク | Claude Opus 4 | Claude Sonnet 4 | 備考 |
---|---|---|---|
SWE-bench コーディング | 72.5% | 72.7% | 実際のソフトウェアエンジニアリングタスクでの性能 |
TerminalBench | 43.2% | 情報なし | ターミナルコマンドの処理能力 |
GPQA Diamond | 74.9%/80.0% | 70.0%/情報なし | 拡張思考なし/あり |
MMLU | 7.406/情報なし (誤記の可能性あり、原文確認) | 85.4%/情報なし | 拡張思考なし/あり |
MMMU | 情報なし/77.0% (誤記の可能性あり、原文確認) | 72.0%/なし | 拡張思考なし/あり |
AIME | 33.9%/なし | 33.1%/なし | 拡張思考なし/あり |
上記のベンチマーク結果は に基づいています。スコアは されています。(原文に詳細がないため、この部分は不完全です)
Claude Opus 4の強み
- 複雑なコーディングタスクでの卓越した性能
- 長時間にわたる自律的な作業が可能
- 高度なエージェントワークフローの実行
- 複数ファイルにまたがる複雑なコード変更の理解
- メモリ機能の大幅な向上
- 科学的研究、複雑な問題解決に適
主な利用シーン
- コーディングエージェント
利用企業の声
「Opus 4はコーディングにおいて画期的な性能を示しています。」
「コードベースにおいて、複数ファイルにまたがる複雑な変更において、その理解力が向上しているのが見られます。」
Claude Sonnet 4の強み
- 日常的なタスクに最適化された効率的な動作
- 高いボリュームのユースケースに適した設計
- エージェントシナリオでの優れたパフォーマンス
- 複雑な指示に正確に従う能力の向上
- コードベースナビゲーションエラーの大幅減 (20%)
- より外科的で精密なコード編集
主な利用シーン
- コーディングタスク
- サブエージェント
- RAG (Retrieval Augmented Generation)
利用企業の声
「Claude Sonnetはエージェント開発で力を発揮します。Github Copilotのようなコーディングエージェントのモデルとして導入する予定です。」
「複雑な指示に従う能力が向上しています。」
利用可能性
両モデルは以下のプラットフォームで利用可能です。
Anthropic API | AWS | GCP |
---|---|---|
APIアクセス | Amazon Bedrock AWSのサービス | Google Cloud Vertex AI GoogleのAIプラットフォーム |
プラン別の利用可能性
Claude Opus 4: Pro, Max, Team, Enterprise プラン
Claude Sonnet 4: 無料プランを含む全てのプラン
Claude 4シリーズの追加機能
Claude Code (一般提供)
研究プレビュー中に広範な肯定的フィードバックを受けて、開発者がClaudeとコラボレーションできる方法を拡大。GitHub ActionsによるバックグラウンドタスクやVS CodeおよびJetBrains IDEのネイティブ統合をサポートし、シームレスなペアプログラミングのためにファイル内に直接編集を表示します。
新しいAPI機能
より強力なAIエージェントを構築するための4つの新機能:
- コード実行コンソール
- MCPコレクタ
- ファイルAPI
- プロンプトを最大1時間キャッシュする機能
モデル選択のガイドライン
Claude Opus 4を選ぶ場合
- 複雑なコーディングプロジェクトに取り組む
- 高度な自律的作業が重要なタスクがある
- フロンティアエージェント製品を開発している
- 科学的研究や複雑な文書作成を行う
- 複数ファイルにまたがるコード変更が必要
Claude Sonnet 4を選ぶ場合
- コスト効果を重視している
- 高いボリュームの日常的なタスクを処理
- より早いレスポンスタイムが必要
- 基本的なコーディングと推論のニーズがある
- より大きなAIシステム内のサブエージェントとして機能する
- 無料プランでの利用を希望する
Claude(クロード)日本向け有料プランの月額料金
Claude 4(Sonnet 4/Opus 4)を日本で利用する場合の主な有料プラン(月額・税込目安)は以下の通りです。
プラン名 月額料金(ドル) 月額料金(円・目安) 利用可能モデル 備考 Proプラン 20ドル 約3,300円 Sonnet 4, Opus 4 ほか 年額払いで月17ドル(約2,805円)15 Maxプラン 100ドル/200ドル 約16,500円/33,000円 Proと同様(使用量が5倍/20倍) Teamプラン 25ドル(1人) 約4,125円(1人) Proと同様 5名から利用可15 Enterprise 要問い合わせ 要問い合わせ Proと同様 法人向け - ※1ドル=約165円換算(2025年5月時点の例として)
- 無料プランでもSonnet 4が利用できますが、利用回数などに制限があります。
- 有料プラン(Pro以上)でOpus 4を利用可能です。
API利用料金(参考)
- Claude Opus 4:入力100万トークンあたり15ドル(約2,200円)、出力100万トークンあたり75ドル(約11,000円)
- Claude Sonnet 4:入力100万トークンあたり3ドル(約430円)、出力100万トークンあたり15ドル(約2,200円)
まとめ
- 個人利用ならProプラン(月額約3,300円)が標準的
- 法人・チーム利用はTeamプラン(月額約4,125円/人~)、Maxプラン(大容量利用向け)
- Opus 4は有料プラン加入が必要、Sonnet 4は無料でも利用可(制限あり)
詳細や最新の為替レートは公式サイトでご確認ください。
まとめ
Claude Opus 4とSonnet 4はどちらも前世代モデルから大幅な性能向上を果たし、特にコーディングと長文処理能力において業界トップレベルの性能を実現しています。ハイブリッド構造の導入により、素早い応答と深い思考の両方が可能になりました。
Claude Opus 4は複雑なタスクと長時間作業に適した高性能モデルであり、Claude Sonnet 4は日常的な使用に適した効率的で実用的なモデルとなっています。
ユースケースに応じて最適なモデルを選択することで、AIの能力を最大限に活用できるでしょう。
両モデルともAnthropic API, Amazon Bedrock, Google Cloud Vertex AI ですぐに利用可能です。