モデルの違い
- 積極性: 一部のモデル(
gemini-2.5-pro
やclaude-4-sonnet
など)は自信があり、最小限のプロンプトで意思決定する。 - 好奇心: 別のモデル(
o3
やclaude-4-opus
など)は、より深く文脈を理解するために計画したり質問したりする。 - コンテキストウィンドウ: 一部のモデルは一度により多くのコードベースを処理でき、大規模なタスクに便利。
なぜ重要か
- 出力をより速く得る
- 提案の品質を高める
- 使い方とコストを最適化する
モデルの挙動
Thinking モデル
- モデルにタスクを任せて走らせたいときに最適
- プロンプトは少なめでOKだけど、やや主張が強いこともある
- 想定より大きな変更を行う場合がある
claude-4-opus
gemini-2.5-pro
o3
(複雑な推論向けに設計)
Thinking モデルは非 Thinking モデルより高コストなことが多い。
model pricing をチェックしてね。
model pricing をチェックしてね。
Non-thinking モデル
- 精密でコントロールされた変更に最適
- プロンプトは多めに必要だけど、挙動はより予測可能
- ガイド、修正、微調整がしやすい
claude-4-sonnet
gpt-4.1
スタイルで選ぶ
claude-4-sonnet
、gemini-2.5-pro
、gpt-4.1
はどれも日常使いの信頼できる相棒になれる—どれだけコントロールしたいか次第。
選び方
1. プロンプトのスタイル
こんな使い方が好きなら… | モデル |
---|---|
自分で主導して明確な指示を出したい | claude-4-sonnet , gpt-4.1 |
モデルに主体的に動いてほしい | claude-4-opus , gemini-2.5-pro , o3 |
2. タスクの種類
タスク | モデル |
---|---|
指示に沿った変更 | claude-4-sonnet , gemini-2.5-pro |
コードベースのナビゲーション/検索 | gemini-2.5-pro , claude-4-opus , o3 |
計画立案や問題解決 | claude-4-opus , gemini-2.5-pro |
複雑なバグや深い推論 | o3 |
o3
は複雑であいまいな問題向けに設計されてる。強力だけど
その分遅くてリソース消費も大きいから、日常的に使うより
たまに使うのに向いてるよ。選択ツリー
自動選択
o3
を除く)信頼できるモデルを選んでフローを保ってくれるよ。タスクの種類でルーティングはしないけど、迷ったときの堅実なデフォルトだよ。
うまくいったものを保存
- モデルを事前選択
- カスタム指示を追加
- 将来のタスクで設定を再利用
更新情報
日付 | 変更内容 |
---|---|
2025年5月下旬 | 新しいモデルに合わせて推奨事項を更新。能力向上に伴いカテゴリを整理・簡素化。 |
2025年5月上旬 | モデル選定の指針、挙動パターン、選定基準をカバーした初版を公開 |
重要なポイント
- 自分にいちばんハマるモデルを選ぼう
- 主体的に動くモデルもある。探索やプランニング、モデルにアイデア出しを任せたいタスクに向いてる。
- 指示どおりに動くモデルもある。精度や予測可能性が大事で、直接コントロールしたいタスクに向いてる。
claude-4-sonnet
、gemini-2.5-pro
、gpt-4.1
はどれも日常の主力として優秀。選ぶポイントは対話スタイル次第。o3
は最難度の問題向けに設計されている。- 迷ったら Auto-select が安全なデフォルト。
- うまくいった構成は Custom Modes として保存して、ワークフローを効率化しよう。