Compartilhar via


Índices de filtro de Bloom (obsoletos)

Important

Não use índices de filtro Bloom. Azure Databricks preteriu esse recurso e recomenda remover todos os índices de filtro Bloom existentes de suas tabelas.

Os índices de filtro Bloom são um mecanismo legado de filtragem de dados que o Azure Databricks não recomenda mais para nenhuma carga de trabalho. Eles adicionam sobrecarga de gravação, são difíceis de ajustar e acabam sendo substituídos por alternativas mais eficazes.

Em vez disso, use os seguintes recursos:

  • E/S preditiva: na computação habilitada para Foton com o Databricks Runtime 12.2 e posteriores, a E/S preditiva executa o salto de arquivo em todas as colunas automaticamente. Ele substitui totalmente os índices de filtro Bloom, que só adicionam sobrecarga de gravação quando o Photon está habilitado.
  • Clustering líquido: no Databricks Runtime 13.3 e superior, o clustering líquido melhora o salto de dados organizando dados com base em colunas frequentemente filtradas.

Remover índices de filtro bloom existentes

Se você tiver índices de filtro Bloom existentes em suas tabelas, remova-os para eliminar a sobrecarga de gravação desnecessária.

DROP BLOOMFILTER INDEX ON TABLE table_name

Para obter detalhes da sintaxe, consulte DROP BLOOM FILTER INDEX.

Depois de remover todos os índices de filtro bloom, execute VACUUM para limpar os arquivos de índice subjacentes no _delta_index diretório.