業務系SE が AI を使うときに踏みがちな3つの落とし穴
役割分担を決めても、まだ油断できないところがある
前回の記事「いろいろ使って迷っていた業務系SEが、ようやく決めた4つのAIの役割分担」では、Claude / ChatGPT / Microsoft Copilot / Gemini を、シーンごとに使い分けるところまで書きました。
ただ、使い分けが決まっても、「AI が返してきた答えをそのまま受け取っていいのか?」は、また別の話です。私自身、便利さに慣れてきた頃ほど、踏みやすい落とし穴がいくつかありました。
この記事では、業務系SE として AI を使う中で特に踏みがちな3つの落とし穴を、自分の失敗ベースで整理します。ふとしたときに踏みがちな落とし穴です。
1. 同じ AI でも、出力は毎回ブレる
SE の感覚だと「同じ入力なら同じ出力」を期待しがちですが、AI は確率的に答えを組み立てるので、同じプロンプトでも毎回微妙に違う答えを返します。
私の体験で印象に残っているのは、障害切り分けの「次にやることリスト」を相談したときです。1回目は「ログ確認 → ネットワーク確認 → DB接続確認」、2回目は「DB接続確認 → ログ確認 → ネットワーク確認」と、ステップの順番が変わって返ってきました。どちらも筋は通っていますが、「これが答え」と固定で受け取りたい場面だと戸惑います。
重要な依頼ほど、何度か試して結果を見比べるくらいの距離感がちょうどいいと思います。「1回でうまくいかなかった = AI が苦手な領域」と判断するのは早すぎることがあります。
2. 「無料で十分」と「有料の価値」をシーンで分ける
1本目で「議事録なら無料プランで十分」と書きました。これは今も変わりません。
ただし、これは個人で AI を試すときの話です。会社で業務利用する場合は法人契約(基本は有料)が前提になるので、ここで言う「無料か有料か」は、個人で AI を使うときの判断として読んでください。
私自身も、Claude を最初は無料プランで試していました。ただ、Claude Code や Claude Cowork など、使いたい機能が有料プラン限定だったので Pro プランに切り替えました。すると今度は 1時間も触ると即トークン切れ → 数時間〜数日待ち、という時間との戦いになりました。たまらず50ドル分のトークンを追加購入してみたものの、週の途中でまた打ち止め。結局10日ほどで MAX プランに切り替えました。
ChatGPT は逆で、副業を始める前は無料で問題なかったのですが、最近は画像生成が強くなったので試したい、けれど無料だと1日数枚で止まる。今ちょうど、有料プランに踏み出すかどうか迷っているところです。
教訓は、やはり「シーンを増やすなら有料、シーンを絞るなら無料」だと思います。
3. AI の出力をそのまま信じない(特にコード・SQL)
業務系SE として、これは外せません。AI が書く SQL文 やコードは、動いているように見えても、想定外のデータで誤動作することがあります。
会社で使っている Microsoft Copilot に調べ物を頼んだとき、事実と違う回答が返ってくることが何度かありました。「公式リファレンスにはこう書いてあるよ」とリンクを送ると「申し訳ございません。間違えていました。」と謝ってくる。「もう一度検討してください」とお願いすると、最初の答えとまったく逆の結論が返ってくることもありました。
最近では、SQL文 を書いてもらった結果、JOIN の条件設計が甘く、重複したデータが取れてしまったことがありました。SQL は一見動いているように見えるので、出力をそのまま実行する怖さは特に大きいです。
私は AI に書いてもらった SQL文 でも、本番に流す前に必ず自分で目を通します。AI は「下書きを早く出してくれる優秀な後輩」、最終判断は人間の仕事、という距離感です。
まとめ:踏みがちな3つの落とし穴
最後に、3つの落とし穴のおさらいです。
- 同じ AI でも、出力は毎回ブレる — 重要な依頼ほど、何度か試して見比べる
- 「無料で十分」と「有料の価値」をシーンで分ける — 上限で待てるか・困るかで判断
- AI の出力をそのまま信じない(特にコード・SQL) — 最終判断は人間の仕事
どれも、慣れてきた頃に気を抜くと踏みがちな落とし穴です。逆に言えば、踏みやすいポイントを最初に知っておけば、AI を使うことの怖さは減らせると思っています。
AI もまた、業務に取り入れる新しい道具のひとつ。完璧に使いこなさなくていいので、半歩先で困らないように、お互い気をつけながら進んでいきましょう。
— ぽん
タグ
この記事をシェア
関連記事
業務系SE が Perplexity で実際に試した3つの調べ物
業務系SE が Perplexity を実際に試して整理した3つの調べ物。料金プラン比較、サポート期限調査、最新機能のキャッチアップ。Claude や ChatGPT とは違う「検索 × AI」の立ち位置を、実体験で書きました。
いろいろ使って迷っていた業務系SEが、ようやく決めた4つのAIの役割分担
Claude・ChatGPT・Microsoft Copilot・Gemini。4つを全部使ってみて、業務系SEがたどり着いた現実的な使い分け。判断軸とシーン別の選び方を、実体験で書きました。
半歩出遅れた業務系SEが、Claudeに会議議事録を任せて定時で帰れるようになった話
毎週の議事録作成に追われていた業務系SEが、Claudeに任せたら何が変わったか。実際に使っているプロンプト3つと、AIに任せない判断軸まで、本音で書きました。