【実測】Claude APIでbotを24時間動かして月いくら?コストを下げる4つのレバー

AIで何か自動化したい——でも「API利用料がいくらになるか分からなくて怖い」。この記事は、私が実際に Threads投稿botをClaude APIで毎日動かしている 運用データをもとに、本当にかかる金額コストを下げる順番 を、忖度なしで公開します。

結論を先に: 計測した呼び出し構造 × 公式単価で見積もると、実コストは 月 $1〜2(数百円)レンジ。安いモデル(Haiku)を選んでいるのが理由で、コスト削減は モデル選択が9割 です。
(正確な金額は運用日数と再生成回数で動きます。自分で動かすときの確かめ方は §6 に)

1. 何を動かしているか(前提の開示)

E-E-A-Tのため、まず計測対象を明示します。

  • 構成: 毎朝1回、researcher → analyst → writer → poster の順でエージェントが連鎖し、投稿を1本生成・投稿。
  • 使用モデル: 全エージェントが Claude Haiku 4.5(claude-haiku-4-5)。
  • 1日あたりのAPI呼び出し: 最低5回(調査1 + 分析1 + 執筆/品質評価3)。ただし執筆は品質・類似度のしきい値を満たすまで 最大5回再生成 する設計なので、日によって増える(再試行が続けば10回超もありうる)。
  • 出力上限(max_tokens): 調査512 / 分析1024 / 執筆800〜1500。← ここが効きます(後述)。
  • 課金形態: ANTHROPIC_API_KEY による API従量課金(Claude Code等のサブスクとは別物)。

⚠️ よくある誤解: ccusage 等が出すのは Claude Code(サブスク) の使用量で、API botの実費とは別 です。botの実費は Anthropic Console の Usage で確認します。

2. Claude API の料金表(2026-06 時点・実取得)

100万トークン(MTok)あたりの単価。出典: platform.claude.com/docs(最新は必ず公式を確認)。

モデル 入力 /MTok 出力 /MTok キャッシュ読込 /MTok
Haiku 4.5 $1 $5 $0.10
Sonnet 4.6 $3 $15 $0.30
Opus 4.8 $5 $25 $0.50

ポイント2つ:

  1. 出力は入力の5倍高い(Haikuで$1 vs $5)。→ max_tokens を絞るのが効く。
  2. モデル間で5〜25倍の差。→ タスクに対して過剰なモデルを使わないのが最大の節約。

3. このbotの実コスト試算

計測した呼び出し構造(5回/日)× 上記単価で計算した1ヶ月のコストです。
(入力トークンはbot側で未計測のため幅で提示。呼び出し回数も再生成で変動するので、これは下限寄りの目安です。自分の環境での確かめ方は §6 を参照)

想定 入力/日 出力/日 1日 1ヶ月
控えめ 7,500 3,736 $0.026 約 $0.79
多め 20,000 3,736 $0.039 約 $1.16

月 $1前後。AIで毎日コンテンツを生成し続けて、コーヒー1杯以下。

もしモデルを上げていたら?(同じ仕事量で比較)

モデル 1ヶ月(多め想定) Haiku比
Haiku 4.5 $1.16
Sonnet 4.6 $3.48 約3倍
Opus 4.8 $5.80 約5倍

投稿生成という定型タスクにOpusは過剰。用途的にHaikuで足りている以上、上位モデルは費用対効果が悪い、というのが実運用の結論です。

4. コストを下げる4つのレバー(効く順)

レバー1: モデルを正しく選ぶ(最大・最初にやる)

削減幅 67〜80%。「とりあえずOpus/Sonnet」をやめ、タスクが定型ならHaiku。分類・抽出・定型生成はHaikuで十分。難しい推論だけ上位モデルに回す。

レバー2: max_tokens を絞る(タダで効く)

出力は入力の5倍高い。出力上限を実需に合わせるだけで出力コストが直接下がる。このbotは調査512/分析1024と用途別に上限を変えている。「念のため4096」は無駄。

レバー3: プロンプトキャッシュ(繰り返しがあるなら)

同じシステムプロンプト/コンテキストを毎回送るなら cache_control を付与。キャッシュ読込は通常入力の10%(90%off)。1回でも再利用すれば元が取れる。

レバー4: Batch API(即時性が不要なら)

非同期一括処理で 入力・出力とも50%off。「今すぐ返事」が不要なバルク生成(記事ネタ100本まとめて等)はBatchへ。

適用順が大事: 1→2を先にやる(構造的に効く)。3・4は規模が出てから。小規模botでは1・2だけで実質ほぼ最適化済み。

5. 逆に「やらなくていい」こと

  • 過度なリトライ/多重ドラフト生成: 1リクエストが安くても回数で増える。回数を疑う。
  • 巨大コンテキストの毎回送信: キャッシュ未使用なら入力代が積む。必要分だけ渡す。
  • ストリーミングで安くなる、は誤解: UXは良くなるが料金は同じ

6. 自分の数字で確かめる(Console実測のすすめ)

ここまでの金額は「計測した呼び出し構造 × 公式単価」で出した試算です。自分で動かすときは、必ず自分のConsoleの実数値で答え合わせしてください——それが一番確実です。

  • 確認先: Anthropic Console → Usage で、API keyごとの実使用額・入出力トークンが日次で見られます。
  • 見るべき数字: 「入力トークン」「出力トークン」「合計コスト」。出力トークンが想定より多ければ、§4のレバー2(max_tokens)が効きます。
  • 試算と実測がズレる主因: ①再生成の回数(品質しきい値で増減) ②入力に渡すコンテキスト量。どちらも本文の手法で下げられます。

私のbotの規模(Haiku・5〜10回/日・出力数百〜千トークン)では、この構造から 月$1〜2のレンジに収まる のが結論です。あなたの用途でも、まず①モデル選択と②max_tokensを押さえれば、Consoleの数字は同じように小さく収まるはずです。

あわせて読みたい

まとめ

  • Claude APIで定型コンテンツbotを24h動かしても 月$1〜2。怖がる金額ではない。
  • 削減は ①モデル選択 → ②max_tokens → ③キャッシュ → ④Batch の順。①②で大半が決まる。
  • 「とりあえず上位モデル」が一番の無駄。タスクにHaikuで足りるかをまず問う。

コメント

タイトルとURLをコピーしました