概要
このモジュールでは、Microsoft Foundry の補完的な戦略を使用して、生成 AI モデルのパフォーマンスを最適化する方法について説明しました。
以下の方法を学習しました。
- システム メッセージ、数ショット学習、モデル パラメーターなどのプロンプト エンジニアリング手法を適用して、モデル出力を最適化します。
- 取得拡張生成 (RAG) を使用して言語モデルを作成するタイミングと方法について説明します。
- モデルの微調整によって動作の一貫性が向上するタイミングを特定します。
- 最適化戦略を比較し、それらを組み合わせるタイミングを決定します。
重要なポイントは、プロンプト エンジニアリング、RAG、および微調整が競合するアプローチではなく、モデルのパフォーマンスのさまざまなディメンションに対処する補完的な戦略であるということです。 プロンプト エンジニアリングから始めて、モデルの動作をガイドし、ファクト精度にドメイン固有のデータが必要な場合は RAG を追加し、プロンプト エンジニアリングだけでは確実に実現できない一貫したスタイルと形式が必要な場合は微調整を検討します。
旅行代理店のシナリオでは、最も効果的なソリューションは、ブランドの声を維持する微調整されたモデル、実際のホテル カタログでの応答を根拠とする RAG、会話固有の指示と安全ガードレールを追加するプロンプト エンジニアリングの 3 つをすべて組み合わせることがあります。