カスタムテキスト分類のユースケース

重要

英語以外の翻訳は便宜上のみ提供されています。詳細なバージョンについては、このドキュメントのEN-USバージョンを参照してください。

透明度に関するメモとは

AI システムには、テクノロジだけでなく、それを使用するユーザー、影響を受けるユーザー、デプロイされる環境も含まれます。目的に合ったシステムを作成するには、テクノロジのしくみ、機能と制限事項、および最適なパフォーマンスを実現する方法を理解する必要があります。 Microsoftの透明性に関するメモは、AI テクノロジのしくみ、システム所有者がシステムのパフォーマンスと動作に影響を与える選択肢、およびテクノロジ、人、環境など、システム全体について考えることの重要性を理解するのに役立ちます。独自のシステムを開発または展開するときに Transparency Notes を使用したり、システムを使用するユーザーやシステムの影響を受けるユーザーと共有したりできます。

Microsoftの透明性に関するメモは、AI の原則を実践するためのMicrosoftの広範な取り組みの一環です。詳細については、「Microsoft AI の原則を参照してください。

カスタムテキスト分類の概要

カスタムテキスト分類は、機械学習インテリジェンスを適用してテキスト分類タスク用のカスタムモデルを構築できるようにするクラウドベースの API サービスです。

カスタムテキスト分類では、次の 2 種類のプロジェクトがサポートされています。

単一ラベル分類: データセット内のファイルごとに 1 つのラベルのみを割り当てます。たとえば、ファイルが映画スクリプトの場合、"アクション"、"スリラー"、"ロマンス" としてのみ分類できます。
複数のラベル分類: データセット内の各ファイルに複数のラベルを割り当てます。たとえば、ファイルがムービースクリプトの場合は、"Action" または "Action" と "Thriller" に分類できます。

カスタムテキスト分類の基本

カスタムテキスト分類は、Foundry Tools の Azure Language 内のカスタム機能の一部として提供されます。この機能を使用すると、ユーザーはカスタム AI モデルを構築して、ユーザーが事前に定義したカスタムカテゴリにテキストを分類できます。カスタムテキスト分類プロジェクトを作成することで、開発者はデータに繰り返しタグを付け、モデルの性能をトレーニング、評価、改善し、それを利用可能な状態にします。タグ付けされたデータの品質は、モデルのパフォーマンスに大きく影響します。

モデルの構築とカスタマイズを簡略化するために、このサービスには、Language Studio を介してアクセスできるカスタム Web ポータルが用意されています。このクイックスタートの手順に従うと、サービスの使用を簡単に開始できます。

カスタムテキスト分類の用語

カスタムテキスト分類では、次の用語が一般的に使用されます。

用語	定義
プロジェクト	プロジェクトは、データに基づいてカスタム AI モデルを構築するための作業領域です。プロジェクトにアクセスできるのは、使用されているAzure リソースへの共同作成者アクセス権を持つユーザーのみです。プロジェクト内では、データにタグを付け、モデルを構築し、必要に応じてそれらを評価して改善し、最終的にモデルをデプロイして使用できるようにすることができます。プロジェクト内で同じデータセット上に複数のモデルを構築できます。
モデル	モデルは、特定のタスクを実行するようにトレーニングされたオブジェクトです。このシステムでは、モデルによってテキストが分類されます。モデルは、タグ付けされたデータから学習することによってトレーニングされます。
クラス	クラスは、テキストの全体的な分類を示すユーザー定義のカテゴリです。開発者は、トレーニングのためにモデルに渡す前に、割り当てられたクラスでデータにタグを付けます。