Partilhar via


Índices do filtro de Bloom (obsoletos)

Important

Não use índices de filtro Bloom. O Azure Databricks descontinuou esta funcionalidade e recomenda remover quaisquer índices de filtro de Bloom existentes das suas tabelas.

Os índices de filtro de Bloom são um mecanismo legado de salto de dados que o Azure Databricks já não recomenda para qualquer carga de trabalho. Adicionam sobrecarga de escrita, são difíceis de ajustar e são substituídas por alternativas mais eficazes.

Use as seguintes funcionalidades em vez disso:

  • E/S preditiva: Na computação com fotões e Databricks Runtime 12.2 e superiores, a E/S preditiva executa automaticamente o salto de ficheiros em todas as colunas. Substitui totalmente os índices de filtro de Bloom, que só adicionam sobrecarga de escrita quando o Photon está ativado.
  • Agrupamento de líquidos: No Databricks Runtime 13.3 e versões superiores, o agrupamento de líquidos melhora o desempenho da filtragem de dados ao estruturar os dados com base em colunas frequentemente filtradas.

Remover índices de filtro de Bloom existentes

Se já tiver índices de filtro de Bloom nas suas tabelas, elimine-os para eliminar sobrecarga desnecessária de escrita:

DROP BLOOMFILTER INDEX ON TABLE table_name

Para obter detalhes de sintaxe, consulte DROP BLOOM FILTER INDEX.

Depois de eliminar todos os índices do filtro de Bloom, execute VACUUM para limpar os ficheiros de índice subjacentes no _delta_index diretório.