リアルタイム音声エージェントの設計最適化の概要 (プレビュー)

[この記事はプレリリース ドキュメントであり、変更されることがあります]

このガイドの記事では、Microsoft テクノロジを使用してリアルタイム音声エージェントを構築するためのベスト プラクティスについて説明します。 これらの記事では、 リアルタイム エージェント (RTA) を設計および構築 する必要があり、顧客体験に基づいて適切なアプローチを選択する方法が必要なユーザー向けの実用的なガイドを提供します。

このガイドとは別に、Microsoft Dynamics 365 Contact Center Forward Deployed Engineering GitHub で確認できる実際の顧客実装に基づいて、テンプレートを開発しました。

Important

  • これはプレビュー機能です。
  • プレビュー機能は運用環境での使用を想定しておらず、機能が制限されている可能性があります。 これらの機能は追加使用条件の対象であり、公式リリース前にアクセス可能です。これにより、お客様は早期に利用し、フィードバックを提供することができます。

オーケストレーションと音声モードを選択する

AI エージェントを構築するときは、次の 1 つの原則から始めます。

  • すべてのエージェントの設計は、会話の制御方法を決定することから始まります。

音声エージェントの場合、2 つ目の重要な決定があります。

  • 音声をエンド ツー エンドで処理する方法。

会話オーケストレーションと音声モードは、コスト、待機時間、柔軟性、コンプライアンス、運用の複雑さを形成します。

次の図は、選択の選択肢をまとめたものです。

クラシック、ハイブリッド、および生成オプションを使用したオーケストレーション モデルの選択と、Basic および Streaming の音声モード パネルのスクリーンショット。