Anthropic Claude Sonnet 4とOpus 4の違い

2025年5月22日リリースの最新AIモデルの詳細比較

特にOpus 4の秀逸な点は、Context Windowは200Kですが、「忘れない」というのが特徴のようです。現在までのモデルは、プロンプトとそれに対する回答数が多くなると忘れることがありました。Opus 4は、質問や検索と回答の内容を忘れることなく「全て」覚えていてくれて対応するらしいとのことです。

はじめに

2025年5月22日, Anthropicは次世代のClaudeモデルとして「Claude Opus 4」と「Claude Sonnet 4」をリリースしました。これらのモデルは以前のモデルから大幅に性能が向上し、特にコーディング能力と長文処理能力に優れています。この文書では、両モデルの主な違いと特徴を詳しく比較します。

基本的な位置づけ

Claude Opus 4

Anthropicの最高性能モデルであり、「世界のトップコーディングモデル」と位置付けられています。複雑で長時間を要するタスクやエージェントワークフローにおいて持続的な高性能を発揮します。数時間にわたって自律的に作業を続けることができ、旧世代Sonnetモデルよりも大幅に改善されています。

Claude Sonnet 4

Claude Sonnet 3.7を大幅に改良したモデルで、優れたコーディング能力を持ちながらも、日常的なタスクに適した効率的なモデルとして設計されています。高いボリュームのユースケースや広範なAIシステム内のタスク固有のサブエージェントとして効果的に機能します。

主要スペック比較

機能/特徴	Claude Opus 4	Claude Sonnet 4
レスポンス速度
コンテキストウィンドウ	200K トークン	200K トークン
最大出力	32,000 トークン	64,000 トークン
学習データカットオフ	2025年3月	2025年3月
価格 (入力)	$15/100万トークン	$3/100万トークン
価格 (出力)	$75/100万トークン	$15/100万トークン
キャッシュ書き込み (5分)	$28.75/100万トークン	$3.75/100万トークン
キャッシュ書き込み (1時間)	$30/100万トークン	$6/100万トークン
キャッシュヒット & リフレッシュ	$1.50/100万トークン	$0.30/100万トークン
利用可能なプラン	Pro, Max, Team, Enterprise	無料プランを含む全プラン

ハイブリッドモデル構造

Claude Opus 4とSonnet 4はどちらも「ハイブリッドモデル」という新しい構造を採用しており、以下の2つの応答モードを提供します。

ほぼ即時の応答モード
- スピーディな対話や簡単なタスクに適しています。従来のモデルと同様に素早く応答します。
拡張思考モード (Extended thinking)
- より深い推論が必要な複雑なタスクに対応します。モデルがより長い時間をかけて考え、より高品質な回答を提供します。

この構造により、タスクの複雑さに応じて適切な処理モードを選択し、効率とパフォーマンスのバランスを最適化します。

両モデルの共通の新機能

ツール使用を伴う拡張思考 (ベータ版)思考中にウェブ検索などのツールを使用できるようになり、モデルが思考とツール使用を交互に行うことで回答の質を向上させます。
メモリ機能の向上開発者がローカルファイルアクセスを提供するとき、アップロードされたファイルを作成・維持し、長期的なタスク認識を向上させます。重要な事実を抽出・保存して継続性を維持し、時間の経過とともに知識を蓄積します。
並列ツール実行複数のツールを同時に実行できる機能が追加され、効率的な情報収集と処理が可能になりました。
行動改善ショートカットやループホール使用が45%減少し、エージェントタスクでの不適切な動作が大幅に改善されました。特にショートカットやループホールに弱いエージェントタスクにおいて効果が顕著です。

ベンチマーク性能比較

両モデルは主要なベンチマークで高いスコアを記録しています。特にコーディング能力において顕著な性能向上が見られます。

Claude 4モデルベンチマークパフォーマンス比較

ベンチマーク	Claude Opus 4	Claude Sonnet 4	備考
SWE-bench コーディング	72.5%	72.7%	実際のソフトウェアエンジニアリングタスクでの性能
TerminalBench	43.2%	情報なし	ターミナルコマンドの処理能力
GPQA Diamond	74.9%/80.0%	70.0%/情報なし	拡張思考なし/あり
MMLU	7.406/情報なし (誤記の可能性あり、原文確認)	85.4%/情報なし	拡張思考なし/あり
MMMU	情報なし/77.0% (誤記の可能性あり、原文確認)	72.0%/なし	拡張思考なし/あり
AIME	33.9%/なし	33.1%/なし	拡張思考なし/あり

上記のベンチマーク結果はに基づいています。スコアはされています。(原文に詳細がないため、この部分は不完全です)

Claude Opus 4の強み

複雑なコーディングタスクでの卓越した性能
長時間にわたる自律的な作業が可能
高度なエージェントワークフローの実行
複数ファイルにまたがる複雑なコード変更の理解
メモリ機能の大幅な向上
科学的研究、複雑な問題解決に適

主な利用シーン

コーディングエージェント

利用企業の声

「Opus 4はコーディングにおいて画期的な性能を示しています。」

「コードベースにおいて、複数ファイルにまたがる複雑な変更において、その理解力が向上しているのが見られます。」

Claude Sonnet 4の強み

日常的なタスクに最適化された効率的な動作
高いボリュームのユースケースに適した設計
エージェントシナリオでの優れたパフォーマンス
複雑な指示に正確に従う能力の向上
コードベースナビゲーションエラーの大幅減 (20%)
より外科的で精密なコード編集

主な利用シーン

コーディングタスク
サブエージェント
RAG (Retrieval Augmented Generation)

利用企業の声

「Claude Sonnetはエージェント開発で力を発揮します。Github Copilotのようなコーディングエージェントのモデルとして導入する予定です。」

「複雑な指示に従う能力が向上しています。」

利用可能性

両モデルは以下のプラットフォームで利用可能です。

Anthropic API	AWS	GCP
APIアクセス	Amazon Bedrock AWSのサービス	Google Cloud Vertex AI GoogleのAIプラットフォーム

プラン別の利用可能性

Claude Opus 4: Pro, Max, Team, Enterprise プラン

Claude Sonnet 4: 無料プランを含む全てのプラン

Claude 4シリーズの追加機能

Claude Code (一般提供)

研究プレビュー中に広範な肯定的フィードバックを受けて、開発者がClaudeとコラボレーションできる方法を拡大。GitHub ActionsによるバックグラウンドタスクやVS CodeおよびJetBrains IDEのネイティブ統合をサポートし、シームレスなペアプログラミングのためにファイル内に直接編集を表示します。

新しいAPI機能

より強力なAIエージェントを構築するための4つの新機能:

コード実行コンソール
MCPコレクタ
ファイルAPI
プロンプトを最大1時間キャッシュする機能

モデル選択のガイドライン

Claude Opus 4を選ぶ場合

複雑なコーディングプロジェクトに取り組む
高度な自律的作業が重要なタスクがある
フロンティアエージェント製品を開発している
科学的研究や複雑な文書作成を行う
複数ファイルにまたがるコード変更が必要

Claude Sonnet 4を選ぶ場合

コスト効果を重視している
高いボリュームの日常的なタスクを処理
より早いレスポンスタイムが必要
基本的なコーディングと推論のニーズがある
より大きなAIシステム内のサブエージェントとして機能する

無料プランでの利用を希望する

Claude（クロード）日本向け有料プランの月額料金

Claude 4（Sonnet 4／Opus 4）を日本で利用する場合の主な有料プラン（月額・税込目安）は以下の通りです。

プラン名	月額料金（ドル）	月額料金（円・目安）	利用可能モデル	備考
Proプラン	20ドル	約3,300円	Sonnet 4, Opus 4 ほか	年額払いで月17ドル（約2,805円）1 5
Maxプラン	100ドル／200ドル	約16,500円／33,000円	Proと同様（使用量が5倍／20倍）
Teamプラン	25ドル（1人）	約4,125円（1人）	Proと同様	5名から利用可1 5
Enterprise	要問い合わせ	要問い合わせ	Proと同様	法人向け

※1ドル=約165円換算（2025年5月時点の例として）
無料プランでもSonnet 4が利用できますが、利用回数などに制限があります。
有料プラン（Pro以上）でOpus 4を利用可能です。

API利用料金（参考）

Claude Opus 4：入力100万トークンあたり15ドル（約2,200円）、出力100万トークンあたり75ドル（約11,000円）
Claude Sonnet 4：入力100万トークンあたり3ドル（約430円）、出力100万トークンあたり15ドル（約2,200円）

まとめ

個人利用ならProプラン（月額約3,300円）が標準的
法人・チーム利用はTeamプラン（月額約4,125円/人～）、Maxプラン（大容量利用向け）
Opus 4は有料プラン加入が必要、Sonnet 4は無料でも利用可（制限あり）

詳細や最新の為替レートは公式サイトでご確認ください。

まとめ

Claude Opus 4とSonnet 4はどちらも前世代モデルから大幅な性能向上を果たし、特にコーディングと長文処理能力において業界トップレベルの性能を実現しています。ハイブリッド構造の導入により、素早い応答と深い思考の両方が可能になりました。

Claude Opus 4は複雑なタスクと長時間作業に適した高性能モデルであり、Claude Sonnet 4は日常的な使用に適した効率的で実用的なモデルとなっています。

ユースケースに応じて最適なモデルを選択することで、AIの能力を最大限に活用できるでしょう。

両モデルともAnthropic API, Amazon Bedrock, Google Cloud Vertex AI ですぐに利用可能です。

はじめに

基本的な位置づけ

Claude Opus 4

Claude Sonnet 4

主要スペック比較

ハイブリッドモデル構造

両モデルの共通の新機能

ベンチマーク性能比較

Claude 4モデル ベンチマークパフォーマンス比較

Claude Opus 4の強み

主な利用シーン

利用企業の声

Claude Sonnet 4の強み

主な利用シーン

利用企業の声

利用可能性

プラン別の利用可能性

Claude 4シリーズの追加機能

Claude Code (一般提供)

新しいAPI機能

モデル選択のガイドライン

Claude Opus 4を選ぶ場合

Claude Sonnet 4を選ぶ場合

Claude（クロード）日本向け有料プランの月額料金

まとめ

Claude 4モデルベンチマークパフォーマンス比較