Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Importante
O Dimensionamento Automático do Lakebase é a versão mais recente do Lakebase, com computação de dimensionamento automático, escala para zero, ramificação e restauração instantânea. Para regiões com suporte, consulte a disponibilidade da região. Se você for um usuário provisionado do Lakebase, consulte Lakebase Provisioned.
Ao final deste guia, você terá um banco de dados postgres em execução com dados de exemplo, conectados ao Catálogo do Unity, com dados fluindo entre o Lakebase e o Databricks lakehouse.
Etapas: (1) Criar um projeto → (2) Conectar → (3) Criar uma tabela → (4) Registrar no Catálogo do Unity → (5) Fornecer dados
Etapa 1: Criar seu primeiro projeto
Abra o Aplicativo Lakebase no comutador de aplicativos.
Selecione Autoscaling para acessar a interface do usuário do Lakebase Autoscaling.
Clique em Novo projeto. Dê um nome ao projeto e selecione sua versão do Postgres. Seu projeto é criado com uma única ramificação production, um banco de dados padrão databricks_postgres e recursos de computação configurados para a ramificação.
Pode levar alguns instantes para que sua computação seja ativada. A computação do production branch está sempre ativada por padrão (a escala para zero está desabilitada), mas você pode definir essa configuração, se necessário.
A região do projeto é definida automaticamente para a região do espaço de trabalho.
Saiba mais: Criar um projeto | Dimensionamento automático | Escalar para zero
Etapa 2: Conectar-se ao banco de dados
No seu projeto, selecione o branch de produção e clique em Conectar. As cadeias de conexão funcionam com qualquer cliente Postgres padrão (psql, pgAdmin, DBeaver ou estruturas de aplicativo).
Para se conectar à sua identidade do Databricks, copie o psql snippet da caixa de diálogo de conexão e cole o token OAuth quando solicitado:
psql 'postgresql://your-email@databricks.com@ep-abc-123.databricks.com/databricks_postgres?sslmode=require'
Saiba mais: Início rápido | de conexãopsql | pgAdmin | Postgres clients
Etapa 3: Criar sua primeira tabela
O Editor de SQL do Lakebase vem pré-carregado com SQL de exemplo. No projeto, selecione o branch de produção , abra o Editor de SQL e execute as instruções fornecidas para criar uma playing_with_lakebase tabela e inserir dados de exemplo.
Saiba mais: Editor SQL | Editor de Tabelas | Clientes Postgres
Etapa 4: Registrar-se no Catálogo do Unity
Seu banco de dados do Lakebase está em execução, mas é invisível para o restante da plataforma Databricks até que você o registre no Catálogo do Unity. Depois de registrado, você pode consultar tabelas do Lakebase do Databricks SQL, unir dados operacionais com a análise do Lakehouse e aplicar a governança unificada.
No Catalog Explorer, crie um novo catálogo com Lakebase Autoscaling como o tipo, apontando para o branch do production do projeto e o banco de dados do databricks_postgres.
Agora você pode consultar em um SQL Warehouse:
SELECT * FROM lakebase_catalog.public.playing_with_lakebase;
Saiba mais: Registrar-se no Catálogo do Unity
Etapa 5: Servir dados do Lakehouse em seu aplicativo
As tabelas sincronizadas trazem dados analíticos do Catálogo do Unity para o banco de dados lakebase para que os aplicativos possam consultá-los com leituras transacionais de baixa latência. Crie uma tabela de catálogo do Unity de exemplo e sincronize-a com o Lakebase.
Em um sql warehouse ou notebook, crie uma tabela de origem:
CREATE TABLE main.default.user_segments AS
SELECT * FROM VALUES
(1001, 'premium', 2500.00, 'high'),
(1002, 'standard', 450.00, 'medium'),
(1003, 'premium', 3200.00, 'high'),
(1004, 'basic', 120.00, 'low')
AS segments(user_id, tier, lifetime_value, engagement);
Agora sincronize esta tabela no Lakebase. No Explorador de Catálogos user_segments, crie uma tabela sincronizada no modo Instantâneo, direcionando-a para o banco de dados do projeto databricks_postgres. O modo de instantâneo copia os dados uma vez. Para atualizações contínuas, use o modo Acionado ou Contínuo.
Após a conclusão da sincronização, os dados estão disponíveis no Lakebase como default.user_segments_synced. Consulte-o no Editor de SQL do Lakebase:
SELECT * FROM "default".user_segments_synced WHERE engagement = 'high';
Observação
default deve ser citado porque é uma palavra-chave reservada do PostgreSQL. O esquema da tabela sincronizada herda o nome do esquema do Unity Catalog, por isso, se o esquema for nomeado default, você sempre deverá citá-lo em consultas. Aspas em torno de outros identificadores são opcionais.
Sua análise lakehouse agora está pronta para ser utilizada a partir do seu banco de dados transacional.
Saiba mais: Tabelas sincronizadas | Modos de sincronização | Mapeamento de tipo de dados
Próximas etapas
- Criar um aplicativo:Tutorial de aplicativos Databricks | Aplicativos externos
- Desenvolver com ramificações:Tutorial de desenvolvimento baseado em ramificações
- Configurar sua equipe:Conceder acesso ao projeto e ao banco de dados
- Explore a plataforma:Conceitos principais | Visão geral dos projetos | Todos os tutoriais