AIで何か自動化したい——でも「API利用料がいくらになるか分からなくて怖い」。この記事は、私が実際に Threads投稿botをClaude APIで毎日動かしている 運用データをもとに、本当にかかる金額 と コストを下げる順番 を、忖度なしで公開します。
結論を先に: 計測した呼び出し構造 × 公式単価で見積もると、実コストは 月 $1〜2(数百円)レンジ。安いモデル(Haiku)を選んでいるのが理由で、コスト削減は モデル選択が9割 です。
(正確な金額は運用日数と再生成回数で動きます。自分で動かすときの確かめ方は §6 に)
1. 何を動かしているか(前提の開示)
E-E-A-Tのため、まず計測対象を明示します。
- 構成: 毎朝1回、
researcher → analyst → writer → posterの順でエージェントが連鎖し、投稿を1本生成・投稿。 - 使用モデル: 全エージェントが Claude Haiku 4.5(
claude-haiku-4-5)。 - 1日あたりのAPI呼び出し: 最低5回(調査1 + 分析1 + 執筆/品質評価3)。ただし執筆は品質・類似度のしきい値を満たすまで 最大5回再生成 する設計なので、日によって増える(再試行が続けば10回超もありうる)。
- 出力上限(max_tokens): 調査512 / 分析1024 / 執筆800〜1500。← ここが効きます(後述)。
- 課金形態:
ANTHROPIC_API_KEYによる API従量課金(Claude Code等のサブスクとは別物)。
⚠️ よくある誤解:
ccusage等が出すのは Claude Code(サブスク) の使用量で、API botの実費とは別 です。botの実費は Anthropic Console の Usage で確認します。
2. Claude API の料金表(2026-06 時点・実取得)
100万トークン(MTok)あたりの単価。出典: platform.claude.com/docs(最新は必ず公式を確認)。
| モデル | 入力 /MTok | 出力 /MTok | キャッシュ読込 /MTok |
|---|---|---|---|
| Haiku 4.5 | $1 | $5 | $0.10 |
| Sonnet 4.6 | $3 | $15 | $0.30 |
| Opus 4.8 | $5 | $25 | $0.50 |
ポイント2つ:
- 出力は入力の5倍高い(Haikuで$1 vs $5)。→
max_tokensを絞るのが効く。 - モデル間で5〜25倍の差。→ タスクに対して過剰なモデルを使わないのが最大の節約。
3. このbotの実コスト試算
計測した呼び出し構造(5回/日)× 上記単価で計算した1ヶ月のコストです。
(入力トークンはbot側で未計測のため幅で提示。呼び出し回数も再生成で変動するので、これは下限寄りの目安です。自分の環境での確かめ方は §6 を参照)
| 想定 | 入力/日 | 出力/日 | 1日 | 1ヶ月 |
|---|---|---|---|---|
| 控えめ | 7,500 | 3,736 | $0.026 | 約 $0.79 |
| 多め | 20,000 | 3,736 | $0.039 | 約 $1.16 |
→ 月 $1前後。AIで毎日コンテンツを生成し続けて、コーヒー1杯以下。
もしモデルを上げていたら?(同じ仕事量で比較)
| モデル | 1ヶ月(多め想定) | Haiku比 |
|---|---|---|
| Haiku 4.5 | $1.16 | — |
| Sonnet 4.6 | $3.48 | 約3倍 |
| Opus 4.8 | $5.80 | 約5倍 |
投稿生成という定型タスクにOpusは過剰。用途的にHaikuで足りている以上、上位モデルは費用対効果が悪い、というのが実運用の結論です。
4. コストを下げる4つのレバー(効く順)
レバー1: モデルを正しく選ぶ(最大・最初にやる)
削減幅 67〜80%。「とりあえずOpus/Sonnet」をやめ、タスクが定型ならHaiku。分類・抽出・定型生成はHaikuで十分。難しい推論だけ上位モデルに回す。
レバー2: max_tokens を絞る(タダで効く)
出力は入力の5倍高い。出力上限を実需に合わせるだけで出力コストが直接下がる。このbotは調査512/分析1024と用途別に上限を変えている。「念のため4096」は無駄。
レバー3: プロンプトキャッシュ(繰り返しがあるなら)
同じシステムプロンプト/コンテキストを毎回送るなら cache_control を付与。キャッシュ読込は通常入力の10%(90%off)。1回でも再利用すれば元が取れる。
レバー4: Batch API(即時性が不要なら)
非同期一括処理で 入力・出力とも50%off。「今すぐ返事」が不要なバルク生成(記事ネタ100本まとめて等)はBatchへ。
適用順が大事: 1→2を先にやる(構造的に効く)。3・4は規模が出てから。小規模botでは1・2だけで実質ほぼ最適化済み。
5. 逆に「やらなくていい」こと
- 過度なリトライ/多重ドラフト生成: 1リクエストが安くても回数で増える。回数を疑う。
- 巨大コンテキストの毎回送信: キャッシュ未使用なら入力代が積む。必要分だけ渡す。
- ストリーミングで安くなる、は誤解: UXは良くなるが料金は同じ。
6. 自分の数字で確かめる(Console実測のすすめ)
ここまでの金額は「計測した呼び出し構造 × 公式単価」で出した試算です。自分で動かすときは、必ず自分のConsoleの実数値で答え合わせしてください——それが一番確実です。
- 確認先: Anthropic Console → Usage で、API keyごとの実使用額・入出力トークンが日次で見られます。
- 見るべき数字: 「入力トークン」「出力トークン」「合計コスト」。出力トークンが想定より多ければ、§4のレバー2(
max_tokens)が効きます。 - 試算と実測がズレる主因: ①再生成の回数(品質しきい値で増減) ②入力に渡すコンテキスト量。どちらも本文の手法で下げられます。
私のbotの規模(Haiku・5〜10回/日・出力数百〜千トークン)では、この構造から 月$1〜2のレンジに収まる のが結論です。あなたの用途でも、まず①モデル選択と②max_tokensを押さえれば、Consoleの数字は同じように小さく収まるはずです。
あわせて読みたい
- AIで書いた記事をブログで収益化する全体像 → Claudeで書いた記事をブログで収益化する全手順
- AIブログを始めるサーバー選び → ConoHa WINGで始める全手順 ・ レンタルサーバー比較
まとめ
- Claude APIで定型コンテンツbotを24h動かしても 月$1〜2。怖がる金額ではない。
- 削減は ①モデル選択 → ②max_tokens → ③キャッシュ → ④Batch の順。①②で大半が決まる。
- 「とりあえず上位モデル」が一番の無駄。タスクにHaikuで足りるかをまず問う。


コメント