多くのチームは、最初は AI を「もう契約しているのだから、できるだけ使えばいい」道具として扱う。負担が見えるのは初日ではなく、数週間後に請求を開いたときだ。固定月額だと思っていた費用が、入力、出力、再試行、長いコンテキスト、強いモデル、agent の実行時間で少しずつ押し上げられている。

TechCrunch は 2026 年 6 月 5 日の記事で AI コストの圧力を整理し、FinOps Foundation のエグゼクティブディレクター J.R. Storment の言葉として、議論は「とにかく速く使う」から「ガードレールが必要だ。どう制御するか」に移ったと紹介している。これは大きな AI 企業だけの話ではない。小さなチーム、コンテンツ担当者、開発チーム、運用フローにもそのまま当てはまる。

問題は「AI が高いから減らす」ことではない。どのタスクなら高いモデルコストを払う価値があるのか、どれが習慣的なアップグレードにすぎないのか、どれを先に小さくしてから AI に渡すべきかを見分けられるかどうかだ。

ミニレッスン:モデルを選ぶ前にタスクを分類する

最初に「一番安いモデルはどれか」と聞かない。まずタスクを三つのコスト階層に入れる。

コスト階層向いているタスク標準の進め方アップグレード条件停止・ダウングレード条件
標準タスク短い要約、段落の書き換え、小さなコード説明、会議メモ整理安いモデルまたは標準モデルを使う。入力を短くし、出力形式を一度で指定する初回の回答に明らかに文脈が足りず、補っても完了できない答えを少しきれいにしたいだけで、リスクや価値が上がらないなら上げない
強化タスク案の比較、長文整理、意思決定表、複雑なエラー確認強いモデルを許可するが、先に資料を要約し、分割し、出力欄を決める結果が購買、リリース、顧客対応、チーム判断に影響するモデルが反復し、出典が曖昧で、根拠を説明できないときは人が判断する
プロジェクト級タスク多段階 agent、複数ファイル変更、長時間分析、バッチ処理先にタスク概要、資料範囲、再試行上限、人の確認点、予算上限を書くowner、受け入れ基準、ロールバック方法があり、人手なら大きな時間を使うagent が範囲を広げる、再試行を続ける、成果を検証できないなら止める

この表の役割は、「AI を使うかどうか」ではなく「この作業はどのコスト階層か」に問いを変えることだ。同じモデルでも、タスクによって妥当性は変わる。短い要約に最強モデルを使うのは無駄かもしれない。一方で、高リスクな契約比較を最安モデルだけで済ませると、誤りのコストが人に戻ってくる。

token コストが直感に合わない理由

多くの AI API は「一回質問したらいくら」だけでなく、入力と出力に使われた token 数を見て課金する。token は、モデルが文字を処理するときの小さな単位だと考えるとよい。日本語、英語、句読点、コードも token に分かれる。文書が長いほど、文脈が多いほど、出力が長いほど、請求は上がりやすい。

Anthropic、OpenAI、Amazon Bedrock は、それぞれモデルや機能ごとの価格を公開している。表の形式は違っても、共通しているのは、モデル能力、入力長、出力長、キャッシュ、バッチ処理、ツール呼び出しが実際の費用に影響するという点だ。

だからチームは「一回の呼び出し価格」だけを見ないほうがいい。次を確認する。

  • 毎回、不要な生データまで入れていないか。
  • 出力が本当に必要な長さを超えていないか。
  • agent が人の確認なしに再試行していないか。
  • 低リスクの小さな作業にも最強モデルを使っていないか。
  • 高コストの作業が、確認時間の削減、エラー低下、納期短縮などの成果に変わっているか。

「少なく使う」より、コストガードレール表を持つ

管理者が「AI コストが高いから、みんな少し控えて」とだけ言うと、たいてい二つの悪い結果になる。本当に必要な人が使いにくくなり、価値の低いタスクは見えないところで予算を消費し続ける。

よりよい方法は、二週間ごとに小さなガードレール表を見直すことだ。

確認欄質問なぜ重要か
タスク目的AI は時間短縮、判断補助、初稿作成、自動実行のどれに使われたか目的が違えば、許容できるコストとリスクも違う。
資料範囲関係ない内容を削り、長文を要約し、分割したかもっとも多い無駄は、すべての資料を一度に入れること。
モデル階層なぜこのタスクに強いモデルが必要か説明できないなら、まず標準ルートに置く。
出力上限欄、長さ、形式を固定したか無制限の出力は費用を増やし、人の確認も難しくする。
再試行ルールどんな場合に何回まで再質問してよいかagent と自動フローはここで最も制御を失いやすい。
成果確認この費用で何を得たかコスト管理は利用を抑えることではなく、高コスト作業に理由を持たせること。

この表は精密でなくていい。チームが、どのタスクを標準に残し、どれを強化し、どれをプロジェクト管理として扱うべきか見えるだけで十分だ。

アップグレードしない三つの場面

AI コストが膨らむのは、誰かが意図的に浪費したからとは限らない。アップグレードが簡単すぎるから起きることが多い。次の三つでは、モデルを上げたり agent を起動したりしない。

  1. タスク範囲がまだ広すぎる。 フォルダ全体、長い文書、長い会話をそのまま入れているなら、まず範囲を整理する。高いモデルに替えるのはその後だ。
  2. 出力を検証できない。 出典、欄、テスト、人の確認点がないなら、費用を増やしても自信のあるリスクが増えるだけかもしれない。
  3. 停止ラインがない。 agent が再試行し続け、ツールを呼び続け、範囲を広げられるなら、問題は一回の費用ではなくフロー設計だ。

高コスト AI は、難しい問題のために専門家へ依頼するのに近い。先に問題、制約、成果物、止める条件を決める。詰まったら自動でアップグレードするものではない。

今日できる三つのこと

第一に、直近一週間で最もよく使った AI タスクを三種類だけ書き出す。モデル名から始めず、タスクの目的を書く。

第二に、それらを「標準、強化、プロジェクト級」に入れる。各階層に一つだけ重要なルールを置く。標準タスクは入力長を制限する、強化タスクは出力欄を持つ、プロジェクト級タスクは owner と再試行上限を持つ、という形でよい。

第三に、二週間後に一つだけ見る。高コストタスクは見える成果に変わったか。変わっていないなら、先に利用者を責めず、タスク分類、資料範囲、停止ルールを調整する。

AI コスト管理は、みんなを怖がらせて使わせないことではない。高い費用をかける一回一回に理由を持たせることだ。いつ使い、いつ小さくし、いつ止めるかをチームが知っていれば、請求は驚きではなく管理できるワークフローになる。

生活四コマ

AI タスクカードを分類し、予算メーターを警戒から安定へ戻すチームの4コマ漫画

  1. 最初は、どんな AI タスクも同じ機械に入れていて、すべて同じモデルコストを払う価値があるように見える。
  2. タスクが積み上がると予算メーターが上がり、問題は範囲と再試行だったと気づく。
  3. よい進め方は、小さな道具、強化道具、プロジェクト級の仕事に分け、人の確認点を横に置くこと。
  4. 各タスクに合うコスト階層が決まると、AI 請求は驚きではなく管理できるワークフローになる。

AI 整理カード

この記事の状況に合わせて、AI に整理してもらう

自分の AI チャットツールに貼り付けると、このミニクラスを自分用のチェックリストにできます。BMC は、あなたが AI に貼り付けた内容を見ることはありません。

Share

このミニクラスを共有

このミニクラスが仕事の詰まりをほどく助けになったら、AI の使い方を考えている人にも共有してください。

参考資料