カスタム テキスト分類のユース ケース

重要

英語以外の翻訳は便宜上のみ提供されています。 詳細なバージョンについては、このドキュメントのEN-USバージョンを参照してください。

透明度に関するメモとは

AI システムには、テクノロジだけでなく、それを使用するユーザー、影響を受けるユーザー、デプロイされる環境も含まれます。 目的に合ったシステムを作成するには、テクノロジのしくみ、機能と制限事項、および最適なパフォーマンスを実現する方法を理解する必要があります。 Microsoftの透明性に関するメモは、AI テクノロジのしくみ、システム所有者がシステムのパフォーマンスと動作に影響を与える選択肢、およびテクノロジ、人、環境など、システム全体について考えることの重要性を理解するのに役立ちます。 独自のシステムを開発または展開するときに Transparency Notes を使用したり、システムを使用するユーザーやシステムの影響を受けるユーザーと共有したりできます。

Microsoftの透明性に関するメモは、AI の原則を実践するためのMicrosoftの広範な取り組みの一環です。 詳細については、「Microsoft AI の原則を参照してください。

カスタム テキスト分類の概要

カスタム テキスト分類 は、機械学習インテリジェンスを適用してテキスト分類タスク用のカスタム モデルを構築できるようにするクラウドベースの API サービスです。

カスタム テキスト分類では、次の 2 種類のプロジェクトがサポートされています。

  • 単一ラベル分類: データセット内のファイルごとに 1 つのラベルのみを割り当てます。 たとえば、ファイルが映画スクリプトの場合、"アクション"、"スリラー"、"ロマンス" としてのみ分類できます。
  • 複数のラベル分類: データセット内の各ファイルに複数のラベルを割り当てます。 たとえば、ファイルがムービー スクリプトの場合は、"Action" または "Action" と "Thriller" に分類できます。

カスタム テキスト分類の基本

カスタム テキスト分類は、Foundry Tools の Azure Language 内のカスタム機能の一部として提供されます。 この機能を使用すると、ユーザーはカスタム AI モデルを構築して、ユーザーが事前に定義したカスタム カテゴリにテキストを分類できます。 カスタム テキスト分類プロジェクトを作成することで、開発者はデータに繰り返しタグを付け、モデルの性能をトレーニング、評価、改善し、それを利用可能な状態にします。 タグ付けされたデータの品質は、モデルのパフォーマンスに大きく影響します。

モデルの構築とカスタマイズを簡略化するために、このサービスには 、Language Studio を介してアクセスできるカスタム Web ポータルが用意されています。 この クイックスタートの手順に従うと、サービスの使用を簡単に開始できます。

カスタム テキスト分類の用語

カスタム テキスト分類では、次の用語が一般的に使用されます。

用語 定義
プロジェクト プロジェクトは、データに基づいてカスタム AI モデルを構築するための作業領域です。 プロジェクトにアクセスできるのは、使用されているAzure リソースへの共同作成者アクセス権を持つユーザーのみです。 プロジェクト内では、データにタグを付け、モデルを構築し、必要に応じてそれらを評価して改善し、最終的にモデルをデプロイして使用できるようにすることができます。 プロジェクト内で同じデータセット上に複数のモデルを構築できます。
モデル モデルは、特定のタスクを実行するようにトレーニングされたオブジェクトです。 このシステムでは、モデルによってテキストが分類されます。 モデルは、タグ付けされたデータから学習することによってトレーニングされます。
クラス クラスは、テキストの全体的な分類を示すユーザー定義のカテゴリです。 開発者は、トレーニングのためにモデルに渡す前に、割り当てられたクラスでデータにタグを付けます。

カスタム テキスト分類のユース ケースの例

カスタム テキスト分類は、さまざまな業界の複数のシナリオで使用できます。 いくつかの例を次に示します。

  • 自動メールまたはチケットトリアージ: すべての種類のサポート センターは、構造化されていないフリーフォームのテキストと添付ファイルを含む大量のメールまたはチケットを受け取ります。 社内の専門分野の専門家へのタイムリーなレビュー、受信確認、そしてルーティングが重要です。 この規模のメール トリアージでは、ユーザーは適切な部門を確認してルーティングする必要があり、これには時間とリソースが必要です。 カスタム テキスト分類を使用して受信テキストを分析し、関連する部門に自動的にルーティングされるコンテンツをトリアージして分類し、さらにアクションを実行できます。

  • セマンティック検索を強化および強化するためのナレッジ マイニング: 検索は、テキスト コンテンツをユーザーに表示するアプリの基礎となります。 一般的なシナリオとしては、カタログ検索やドキュメント検索、小売製品検索、データ サイエンスのナレッジ マイニングなどがあります。 さまざまな業界の多くの企業が、構造化されたドキュメントと非構造化ドキュメントの両方を含む、プライベートで異種のコンテンツに対して豊富な検索エクスペリエンスを構築しようとしている。 パイプラインの一部として、開発者はカスタム テキスト分類を使用して、業界に関連するクラスにテキストを分類できます。 予測クラスを使用すると、よりカスタマイズされた検索エクスペリエンスのためにファイルのインデックス作成を強化できます。

ユース ケースを選択するときの考慮事項

  • 重大な悪影響を及ぼす可能性のある意思決定には、カスタム テキスト分類を使用しないでください。 個人に重大な影響を与える可能性のある意思決定の人間によるレビューを含めます。 たとえば、インシデントに関するユーザーの説明に基づいて、保険金請求を受け入れるか拒否するかを識別します。

  • あいまいで代表的ではないクラスを作成しないでください。 スキーマを設計するときは、相互に類似するクラスを避けて、相互に区別するのが難しい可能性があります。 たとえば、映画のスクリプトを分類する場合は、ロマンス、コメディ、rom-com のクラスを作成しないようにします。 代わりに、ロマンスクラスとコメディクラスで複数ラベル分類モデルを使用することを検討してください。 次に、rom-com ムービーの場合は、両方のクラスを割り当てます。

  • 法的および規制上の考慮事項: 組織は、Foundry Tools とソリューションを使用する際に、特定の法的および規制上の義務を評価する必要があります。これは、すべての業界またはシナリオでの使用には適していない可能性があります。 さらに、Foundry Tools またはソリューションは、該当するサービス利用規約および関連する行動規範で禁止されている方法で設計されておらず、使用されない場合があります。

次の手順