ストレージ タスクのシナリオ

大規模なデータ レイクには、さまざまな処理方法を必要とするさまざまなオブジェクトの種類を持つ何千ものデータ セットを含めることができます。 BLOB コンテナー内の個々のオブジェクトには、属性に応じて、特定の保持期間または有効期限、異なる階層化遷移、または異なるラベルによるタグ付けが必要になる場合があります。 Azure Storage Actions を使用すると、数十億個の BLOB をスキャンするタスクを定義し、ファイル拡張子、名前付けパターン、インデックス タグ、BLOB メタデータ、作成時間、コンテンツ タイプ、BLOB 層などのシステム プロパティなどのプロパティに基づいて各 BLOB を調べることができます。 この方法により、多くの繰り返しまたは 1 回限りのユース ケースが簡略化されます。 この記事では、ストレージ アクションが適用されているか、適用される可能性があるシナリオについて説明します。

オブジェクト タグを使用したリテンション期間と有効期限の管理

金融サービス機関は、Azure Blob Storage を使用して顧客サービスの通話記録を取り込みます。 これらの記録には、取引注文が行われたか、アカウント情報が更新されたかを示す BLOB タグがあります。 これらの記録の保持要件は、呼び出しの種類によって異なります。 Azure Storage Actions を使用すると、BLOB タグと作成時間の組み合わせを使用して、取り込まれた記録の保持期間と有効期限を自動的に管理するタスクを定義できるようになりました。

データセットでのデータ保護の管理

大手旅行サービス会社は BLOB のバージョン管理とスナップショットを使用していますが、データセットの保護ニーズは異なります。 機密データには厳密なバージョン履歴が必要ですが、他のユーザーには必要ありません。 すべてのデータセットの広範なバージョンとスナップショット履歴を保持すると、コストがかかりすぎます。 Azure Storage Actions を使用すると、メタデータとタグを使用して、バージョンとスナップショットの保持とライフサイクルをより柔軟に管理できるようになりました。

名前付けパターンとファイルの種類に基づくコストの最適化

多くの Azure Storage のお客様は、パス プレフィックス、名前付け規則、またはファイルの種類に基づいて、BLOB の階層化、有効期限、保持を管理する必要があります。 これらの属性は、サイズ、作成時刻、最終変更時刻またはアクセス時刻、アクセス層、バージョン数などの BLOB プロパティと組み合わせて、必要に応じてオブジェクトを処理できます。

大規模な BLOB の 1 回限りの処理

Azure Storage Actions は、進行中のデータ管理操作に加えて、数十億個のオブジェクトの 1 回限りの処理にも使用できます。 たとえば、アーカイブ層から大規模なデータセットをリハイドレートするタスク、分析パイプラインを再起動するときにデータセットの一部のタグをリセットするタスク、新しいプロセスまたは更新されたプロセスの BLOB タグを初期化するタスク、冗長なデータセットと古いデータセットをクリーンアップするタスクを定義できます。

こちらも参照ください