Microsoft Purview データ セキュリティ調査では、サポートされている画像ファイルの種類に対して光学式文字認識 (OCR) テキスト抽出がサポートされています。 次の表に、現在サポートされているイメージ ファイルの種類を示し、ファイルの種類がファイル識別、メタデータ抽出、OCR テキスト抽出でサポートされているかどうかを示します。
イメージ
画像の抽出は調査範囲への項目の追加の一部であり、OCR の自動処理はorganizationに対する追加料金ではありません。
| Mime の種類 | ファイル識別 | メタデータ抽出 | OCR テキスト抽出 | 考えられる拡張機能 |
|---|---|---|---|---|
| image/bmp | はい | はい | はい | .bmp |
| image/emf | はい | はい | はい | 。Emf |
| image/gif | はい | はい | はい | .gif |
| image/jpeg | はい | はい | はい | 。Jpeg;.jpg |
| image/png | はい | はい | はい | .png |
| image/svg+xml | はい | はい | はい | 。Svg |
| image/tiff | はい | はい | はい | 。Tif |
| image/vnd.dwg | はい | はい | はい | .dwg; .dxf |
| image/wmf | はい | はい | はい | 。Wmf |
注:
OCR テキスト抽出列は、データが自動的にベクター化されるときに、これらの画像形式からテキストを抽出できることを示します。 OCR テキスト抽出はデータの準備中に自動的に行われ、抽出されたテキストは AI ベースの分析ツールで使用するためにベクター化されます。