AI APIの料金、正直わかりにくい
「ChatGPT APIっていくらかかるの?」。この質問、クライアントからもエンジニアからも本当によく聞かれます。
正直なところ、AI APIの料金体系はわかりにくい。トークン単価、入力と出力で料金が違う、モデルごとに価格が違う、キャッシュが効くと安くなる……。公式ドキュメントを読んでも「で、結局うちの用途だといくら?」が掴みにくい。
この記事では、主要3社(OpenAI・Anthropic・Google)のAPI料金を横並びで比較し、用途別のコスト試算まで出します。2026年5月時点の最新料金です。
---
料金の基本——トークンとは
AI APIの料金は「トークン」単位で計算されます。トークンとは、AIが文章を処理する際の最小単位。英語では1単語≒1トークン、日本語では1文字≒1〜2トークンが目安です。
1,000トークンの目安:
- 英語:約750語
- 日本語:約500〜700文字
料金は「入力(プロンプト)」と「出力(レスポンス)」で別々に課金されます。一般的に出力のほうが2〜4倍高い。
---
OpenAI API(ChatGPT API)の料金
主要モデルの料金(2026年5月時点)
GPT-4o(最もバランスの良いモデル)
- 入力:$2.50 / 100万トークン
- 出力:$10.00 / 100万トークン
GPT-4o mini(軽量・低価格モデル)
- 入力:$0.15 / 100万トークン
- 出力:$0.60 / 100万トークン
GPT-4.1(最新・高性能モデル)
- 入力:$2.00 / 100万トークン
- 出力:$8.00 / 100万トークン
GPT-4.1 mini
- 入力:$0.40 / 100万トークン
- 出力:$1.60 / 100万トークン
GPT-4.1 nano(最軽量)
- 入力:$0.10 / 100万トークン
- 出力:$0.40 / 100万トークン
o3(推論特化モデル)
- 入力:$2.00 / 100万トークン
- 出力:$8.00 / 100万トークン
Responses API vs Chat Completions API
OpenAIは従来のChat Completions APIに加えて、新しいResponses APIを提供しています。料金は同じですが、Responses APIのほうがツール連携やマルチターンのセッション管理がしやすい設計になっています。新規開発ならResponses APIを推奨します。
---
Anthropic API(Claude API)の料金
主要モデルの料金(2026年5月時点)
Claude Opus 4(最高性能)
- 入力:$15.00 / 100万トークン
- 出力:$75.00 / 100万トークン
Claude Sonnet 4(バランス型)
- 入力:$3.00 / 100万トークン
- 出力:$15.00 / 100万トークン
Claude Haiku 3.5(高速・低価格)
- 入力:$0.80 / 100万トークン
- 出力:$4.00 / 100万トークン
Claudeの強み
Claudeは長文処理と日本語品質に定評があります。コンテキストウィンドウが最大200Kトークン(約15万文字)と大きく、長い文書の要約やドキュメント処理に向いています。ChatGPTとClaudeの違いも参考にしてください。
Prompt Caching
Anthropic APIにはPrompt Caching機能があり、同じシステムプロンプトを繰り返し使う場合にキャッシュが効いて入力コストが最大90%削減されます。チャットボットのように同じ前提条件で多数のリクエストを処理する場合、コスト削減効果が非常に大きい。
---
Google Gemini APIの料金
主要モデルの料金(2026年5月時点)
Gemini 2.5 Pro
- 入力:$1.25〜$2.50 / 100万トークン(トークン数で変動)
- 出力:$10.00 / 100万トークン
Gemini 2.5 Flash
- 入力:$0.15 / 100万トークン
- 出力:$0.60 / 100万トークン(思考なし)/ $3.50(思考あり)
Gemini 2.0 Flash
- 入力:$0.10 / 100万トークン
- 出力:$0.40 / 100万トークン
Geminiの強み
Geminiはマルチモーダル対応が強力で、画像・動画・音声の入力に追加料金がかからない(テキスト換算のトークン料金のみ)。Google検索との統合(Grounding)も特徴的です。
---
3社比較表
高性能モデル(複雑なタスク向け)
| モデル | 入力/100万tk | 出力/100万tk | 特徴 | |---|---|---|---| | GPT-4.1 | $2.00 | $8.00 | コーディング・指示遵守に強い | | Claude Sonnet 4 | $3.00 | $15.00 | 日本語品質・長文処理 | | Gemini 2.5 Pro | $1.25〜$2.50 | $10.00 | マルチモーダル・大コンテキスト |
軽量モデル(定型業務・大量処理向け)
| モデル | 入力/100万tk | 出力/100万tk | 特徴 | |---|---|---|---| | GPT-4.1 nano | $0.10 | $0.40 | 最安クラス | | Claude Haiku 3.5 | $0.80 | $4.00 | 日本語品質を維持しつつ高速 | | Gemini 2.0 Flash | $0.10 | $0.40 | 最安クラス・マルチモーダル対応 |
---
用途別コスト試算
カスタマーサポートチャットボット
想定:1日100件の問い合わせ、1件あたり入力500トークン・出力300トークン
- GPT-4o mini:月約 $1.35(入力$0.23 + 出力$0.54)× 30日
- Claude Haiku 3.5:月約 $4.80
- Gemini 2.0 Flash:月約 $0.54
→ 軽量モデルなら月数百円〜数千円で運用可能。
社内ドキュメント要約システム
想定:1日20件、1件あたり入力5,000トークン・出力1,000トークン
- GPT-4.1:月約 $7.20
- Claude Sonnet 4:月約 $18.00
- Gemini 2.5 Pro:月約 $9.75
→ 高性能モデルでも月1万円以下で運用可能なケースが多い。
大規模データ処理(月100万リクエスト)
大量処理の場合はBatch APIの利用がコスト効率が良い。OpenAIのBatch APIは通常料金の50%割引。
---
API費用を抑える実践テクニック
1. 適切なモデル選定
全てのタスクに最高性能モデルを使う必要はありません。定型的な分類・抽出タスクならmini/nano/flashモデルで十分。タスクの複雑さに応じてモデルを使い分けるのが基本です。
2. プロンプトの最適化
無駄に長いシステムプロンプトはコストの無駄。必要十分な指示に絞る。特にClaudeのPrompt Cachingを活用する場合、キャッシュ対象のプロンプトを固定部分と可変部分に分離する設計が重要です。
3. キャッシュの活用
- Prompt Caching(Anthropic):同じプロンプトの再利用でコスト90%削減
- Responses API + session(OpenAI):マルチターンでのコンテキスト共有
4. Batch APIの利用
リアルタイム性が不要なタスク(日次レポート生成、一括データ処理等)はBatch APIで処理すると大幅にコスト削減できます。
5. レスポンスの長さを制限
max_tokensパラメータで出力トークン数を制限する。特に出力料金が高いモデル(Claude Opus等)では効果が大きい。
---
よくある質問
無料で使えるAI APIはありますか?
Google Gemini APIには無料枠(1分あたり15リクエスト)があります。OpenAIとAnthropicには無料枠はありませんが、初回登録時にクレジットが付与されることがあります。
個人開発でも使えますか?
はい。クレジットカード登録だけで利用開始できます。個人の趣味プロジェクトなら月数百円で収まるケースがほとんどです。
APIキーが漏洩したらどうなりますか?
第三者に不正利用され、高額な請求が発生するリスクがあります。各サービスの管理画面で利用上限(Monthly Spend Limit)を必ず設定してください。
---
まとめ
AI APIの料金は、用途とモデル選定次第で月数百円から数万円まで幅があります。重要なのは:
AI APIを活用したシステム開発については、AI開発サービスのページもご覧ください。「どのAPIを使うべきか」の技術選定から、AIコンサルティングでサポートしています。
Written by
Swaaab編集部
広島を拠点に、AI開発・DX支援・Web制作を手がけるSwaaab株式会社の編集チーム。現場で得た知見をもとに、実践的な情報を発信しています。