SKILL.md の description は、エージェントがそのスキルを読むべきか判断する主要シグナルです。
良い description の原則
- 命令形で書く:
Use this skill when... - 実装ではなくユーザー意図を書く
- やや押し気味に書く
- 短く保つ: 1024 文字以内
発火テスト用クエリを作る
現実的な user prompt をshould_trigger 付きで用意します。
複数回走らせて trigger rate を見る
モデルの挙動は確率的なので、各クエリを 3 回程度実行し、何回発火したかを見ます。should_trigger: trueは 0.5 以上で合格should_trigger: falseは 0.5 未満で合格
過学習を避ける
クエリを train / validation に分けます。- train: 失敗分析と改善に使う
- validation: 一般化しているかの確認だけに使う
最適化ループ
- 現在の description を評価する
- 失敗を分類する
- description を修正する
- 再評価する
- validation pass rate が最も高い版を選ぶ
- 発火しないなら適用場面の説明を広げる
- 誤発火するなら境界条件を明示する
- 失敗クエリの単語を足すだけの修正は避ける
反映
最終的に選んだ description をSKILL.md に戻し、長さと実運用で再確認します。