テキストと自然言語

完了

詳細については、「 テキストと画像 」タブを参照してください。

自然言語処理 (NLP) は、言語を理解するための AI モデルと手法をカバーする広範な用語です。 NLP は、生成型 AI 大規模言語モデル (LLM) が構築される基盤です。

現在、多くの自然言語処理シナリオは生成 AI モデルによって処理されていますが、予測可能な結果を生成したり、カスタム ルールを適用したりするために専門家の NLP ツールを使用する一般的なテキスト分析のユース ケースがあります。

センチメント、キーワード、および要約について分析されるテキストの図。

  • 言語検出 - ドキュメントが書き込まれる言語 (または言語) を決定します。 多くの場合、言語検出は、多段階のテキスト処理ワークフローの最初のステップです。
  • テキスト分類 - ドキュメントを特定のカテゴリに割り当てる。テキストの本文が正、負、または中立のいずれであるかを判断するための 感情分析 を含みます。
  • キー用語抽出エンティティ検出 - ドキュメント内のキーワードまたはフレーズを識別し、人、場所、組織などのエンティティのメンションを見つける。 エンティティ検出の特に特殊な形式は、 個人を特定できる情報 (PII) を検出して編集することです。名前、住所、電話番号、その他の非公開の詳細など。
  • 要約 - メイン ポイントをカプセル化しながら、テキストの量を減らします。

テキスト分析のシナリオ

テキスト分析のための NLP テクノロジの一般的な用途は次のとおりです。

  • 通話や会議のドキュメントまたはトランスクリプトを分析して主要な件名を決定し、人、場所、組織、製品、またはその他のエンティティの特定の言及を特定します。
  • ソーシャル メディアの投稿、製品レビュー、または記事を分析してセンチメントと意見を評価する。
  • 頻繁に寄せられる質問に回答したり、生成 AI の複雑さを必要としない予測可能な会話ダイアログを調整したりできるチャットボットを実装する。
  • プライバシー ポリシーと法律に準拠するためにデータを共有または分析する前に PII を編集する。