【2024年11月最新】主要LLMの料金を徹底比較
2024年10月07日
2024年11月01日
目次
- 主要LLM API料金比較と各モデルの特徴
- Anthropic API: Claudeシリーズの料金と特徴
- Claude 3.5 Sonnet
- Claude 3 Opus
- Claude 3 Haiku
- Claude 3 Sonnet
- Claude 2.1
- Claude 2.0
- Claude Instant
- OpenAI API: GPTシリーズの料金と特徴
- GPT-4o
- GPT-4o mini
- OpenAI o1-preview
- OpenAI o1-mini
- その他のモデル
- Gemini APIの料金と特徴
- Gemini 1.5 Flash
- Gemini 1.5 Flash-8B
- Gemini 1.5 Pro
- Gemini 1.0 Pro
- Text Embedding 004
- 主要LLMモデルの比較表
主要LLM API料金比較と各モデルの特徴
AI技術の進化とともに、さまざまな企業が提供する大規模言語モデル(LLM)のAPIを活用する機会が増えています。しかし、それぞれのモデルには料金体系や特徴が異なり、最適な選択をするためには慎重な検討が必要です。この記事では、Anthropic、OpenAI、Google Geminiの主要なLLM APIの料金と特徴を比較し、どのモデルがどのユースケースに適しているかを解説します。
Anthropic API: Claudeシリーズの料金と特徴
AnthropicはClaudeシリーズを通じて、さまざまな用途に対応するモデルを提供しています。各モデルはパフォーマンスとコストのバランスが異なり、ユースケースに応じた選択が可能です。
Claude 3.5 Sonnet
- 特徴: 200Kトークンのコンテキストウィンドウを持ち、最も高度なモデル。複雑なタスクに対応できるうえ、長い文脈を維持するため、大量のテキスト処理に適している。
- ユースケース: 高度な文書分析、会話の文脈維持、長時間の対話型AIアプリケーション。
- 料金:
- 入力: $3.00/1Mトークン
- 出力: $15.00/1Mトークン
- プロンプトキャッシング(書き込み): $3.75/1Mトークン
- プロンプトキャッシング(読み込み): $0.30/1Mトークン
Claude 3 Opus
- 特徴: 高度な分析や複雑なタスクに対応可能なモデル。多段階プロセスや高次元の数学的およびコーディングタスクに強い。
- ユースケース: 複雑な問題解決やコード生成、長い手順を必要とするワークフローに最適。
- 料金:
- 入力: $15.00/1Mトークン
- 出力: $75.00/1Mトークン
- プロンプトキャッシング(書き込み): $18.75/1Mトークン
- プロンプトキャッシング(読み込み): $1.50/1Mトークン
Claude 3 Haiku
- 特徴: 非常に高速でコスト効率の高いモデル。軽量なタスクや多数のリクエストを処理する用途に適している。
- ユースケース: リアルタイムのアプリケーションや高速レスポンスが求められる環境での使用に最適。
- 料金:
- 入力: $0.25/1Mトークン
- 出力: $1.25/1Mトークン
- プロンプトキャッシング(書き込み): $0.30/1Mトークン
- プロンプトキャッシング(読み込み): $0.03/1Mトークン
Claude 3 Sonnet
- 特徴: 200Kトークンのコンテキストウィンドウを持ち、最も高度なモデル。複雑なタスクに対応でき、大量のテキスト処理に最適。
- ユースケース: 高度な文書分析、会話の文脈維持、長時間の対話型AIアプリケーション。
- 料金:
- 入力: $3.00/1Mトークン
- 出力: $15.00/1Mトークン
- プロンプトキャッシング(書き込み): $3.75/1Mトークン
- プロンプトキャッシング(読み込み): $0.30/1Mトークン
Claude 2.1
- 特徴: 高速かつ中程度の複雑さのタスクに適したモデル。200Kトークンのコンテキストウィンドウを提供し、コストパフォーマンスが良い。
- ユースケース: ビジネスドキュメントの処理、要約作成、大量のデータ解析に適している。
- 料金:
- 入力: $8.00/1Mトークン
- 出力: $24.00/1Mトークン
Claude 2.0
- 特徴: 100Kトークンのコンテキストウィンドウを持ち、基本的な処理や会話型アプリケーションに向いている。
- ユースケース: チャットボットや簡単な質問応答システムに最適。
- 料金:
- 入力: $8.00/1Mトークン
- 出力: $24.00/1Mトークン
Claude Instant
- 特徴: 100Kトークンのコンテキストウィンドウを持ち、低コストで高速なモデル。リアルタイムのアプリケーション向け。
- ユースケース: 大量の短いリクエスト処理や、リアルタイムチャット対応。
- 料金:
- 入力: $0.80/1Mトークン
- 出力: $2.40/1Mトークン
OpenAI API: GPTシリーズの料金と特徴
OpenAIのモデルは、幅広い用途に対応した複数のバージョンが提供されており、ビジョン機能を含むGPT-4oや、GPT-4 Turboなども含まれています。
GPT-4o
- 特徴: GPT-4 Turboよりも高速でコスト効率が高く、さらに強力なビジョン機能を備える。128Kのコンテキストウィンドウを提供。
- ユースケース: 大規模な対話型アプリケーションや複雑なビジョンタスク。
- 料金:
- 入力: $2.50/1Mトークン
- 出力: $10.00/1Mトークン
- キャッシュトークン: $1.25/1Mトークン
- ビジョン: ビジョン処理も対応可能。
GPT-4o mini
- 特徴: 小型で、GPT-3.5 Turboよりもスマートで安価なモデル。コストパフォーマンスを重視したユースケースに最適。
- ユースケース: 低コストで画像認識や軽量なAI処理を必要とするプロジェクト。
- 料金:
- 入力: $0.15/1Mトークン
- 出力: $0.60/1Mトークン
- キャッシュトークン: $0.075/1Mトークン
- ビジョン: ビジョン処理も対応可能。
OpenAI o1-preview
- 特徴: 複雑なタスクに特化した論理的思考モデルで、128Kトークンのコンテキストウィンドウを提供。
- ユースケース: 複雑な問題解決や高度な数学、論理的思考を必要とするアプリケーション。
- 料金:
- 入力: $15.00/1Mトークン
- 出力: $60.00/1Mトークン
- キャッシュトークン: $7.50/1Mトークン
OpenAI o1-mini
- 特徴: コーディングや科学分野のユースケースに最適で、安価かつ高速に動作する論理的思考モデル。
- ユースケース: 教育用ツールやコーディングサポート。
- 料金:
- 入力: $3.00/1Mトークン
- 出力: $12.00/1Mトークン
- キャッシュトークン: $1.50/1Mトークン
その他のモデル
モデル | 入力料金 (1Mトークン) | 出力料金 (1Mトークン) | 特徴 | コンテキストウィンドウ | ビジョン対応 |
---|---|---|---|---|---|
chatgpt-4o-latest | $5.00 | $15.00 | 最新のChatGPTモデル | N/A | No |
gpt-4-turbo | $10.00 | $30.00 | 高速でコスト効率の良いモデル | N/A | No |
gpt-4-turbo-2024-04-09 | $10.00 | $30.00 | 2024年4月更新版、コスト効率の良いモデル | N/A | No |
gpt-4 | $30.00 | $60.00 | 高性能で大規模なタスクに最適 | N/A | No |
gpt-4-32k | $60.00 | $120.00 | 32Kのコンテキストウィンドウを持つ高性能モデル | 32K | No |
gpt-4-0125-preview | $10.00 | $30.00 | プレビュー版モデル | N/A | No |
gpt-4-1106-preview | $10.00 | $30.00 | プレビュー版モデル | N/A | No |
gpt-4-vision-preview | $10.00 | $30.00 | ビジョン機能を備えたGPTモデル | N/A | Yes |
gpt-3.5-turbo-0125 | $0.50 | $1.50 | GPT-3.5の高速でコスト効率の良いモデル | N/A | No |
gpt-3.5-turbo-instruct | $1.50 | $2.00 | コーディングやタスクの指示に特化したモデル | N/A | No |
gpt-3.5-turbo-1106 | $1.00 | $2.00 | GPT-3.5の一般用途向けモデル | N/A | No |
gpt-3.5-turbo-0613 | $1.50 | $2.00 | GPT-3.5のバージョン0613 | N/A | No |
gpt-3.5-turbo-16k-0613 | $3.00 | $4.00 | 16Kのコンテキストウィンドウを持つモデル | 16K | No |
gpt-3.5-turbo-0301 | $1.50 | $2.00 | GPT-3.5のバージョン0301 | N/A | No |
davinci-002 | $2.00 | $2.00 | GPT-3ベースの高性能モデル | N/A | No |
babbage-002 | $0.40 | $0.40 | 低コストで基本的なタスクに最適なモデル | N/A | No |
Gemini APIの料金と特徴
GoogleのGemini APIは、商用および個人向けに柔軟な価格プランを提供しており、無料プランも含まれています。
Gemini 1.5 Flash
- 特徴: 無料プランでも小規模なアプリケーションに適しており、従量課金制プランでは大規模なトラフィックにも対応可能。
- ユースケース: 個人プロジェクトやスタートアップ向けの低コストなAI処理。
- 料金:
- 入力 $0.15/1Mトークン、出力 $0.30/1Mトークン
Gemini 1.5 Flash-8B
- 特徴: さらに高度なリクエスト処理に対応し、大規模なトラフィックにも対応可能。
- ユースケース: 商業プロジェクトや高トラフィックのWebアプリケーション。
- 料金:
- 入力: $0.0375/1Mトークン
- 出力: $0.15/1Mトークン
Gemini 1.5 Pro
- 特徴: 高性能で商用アプリケーション向け。1,000リクエスト/分まで対応できるため、大規模プロジェクトにも対応。
- ユースケース: 商用AIアプリケーションやデータ解析ツール。
- 料金:
- 入力: $3.50/1Mトークン
- 出力: $10.50/1Mトークン
- キャッシュトークン: $0.875/1Mトークン
Gemini 1.0 Pro
- 特徴: 無料プランでは中小規模のプロジェクトに適しており、従量課金プランではさらに多くのリクエストに対応可能。
- ユースケース: シンプルなデータ解析や基本的なチャットボット機能の構築に適している。
- 料金:
- 入力: $0.50/1Mトークン
- 出力: $1.50/1Mトークン
Text Embedding 004
- 特徴: 埋め込み機能を利用した高度な検索やクラスタリングに対応。無料で利用可能。
- ユースケース: 高度な検索、クラスタリング、トピックモデリング、分類機能。
- 料金: 無料
主要LLMモデルの比較表
モデル | 入力料金 (1Mトークン) | 出力料金 (1Mトークン) | 特徴 | コンテキストウィンドウ | ビジョン対応 |
---|---|---|---|---|---|
Claude 3.5 Sonnet | $3.00 | $15.00 | 最も高度なモデルで、大量のデータ処理に最適 | 200K | Yes |
Claude 3 Opus | $15.00 | $75.00 | 複雑な分析や多段階プロセスに対応 | 200K | Yes |
Claude 3 Haiku | $0.25 | $1.25 | 高速かつコスト効率が良いモデル | 200K | Yes |
Claude 3 Sonnet | $3.00 | $15.00 | 最も高度なモデルで、大量のデータ処理に最適 | 200K | Yes |
GPT-4o | $2.50 | $10,00 | 強力なビジョン機能を備えた高速モデル | 128K | Yes |
GPT-4o mini | $0.15 | $0.60 | 小型かつ安価で、画像認識や軽量処理に最適 | 128K | Yes |
OpenAI o1-preview | $15.00 | $60.00 | 複雑な問題解決に特化した論理的思考モデル | 128K | No |
OpenAI o1-mini | $3.00 | $12.00 | 複雑な問題解決に特化した論理的思考モデル | 128K | No |
Gemini 1.5 Flash | $0.15 | $0.30 | 小規模プロジェクトに最適 | 1M | No |
Gemini 1.5 Pro | $3.50 | $10.50 | 高性能で商用アプリケーションに対応 | 2M | No |
Gemini 1.0 Pro | $0.50 | $1.50 | 基本的なチャットボットやデータ解析に最適 | 32K | No |
chatgpt-4o-latest | $5.00 | $15.00 | 最新のChatGPTモデル | N/A | Yes |
gpt-4-turbo | $10.00 | $30.00 | 高速でコスト効率の良いモデル | N/A | Yes |
gpt-4-vision-preview | $10.00 | $30.00 | ビジョン機能を備えたGPTモデル | N/A | Yes |