Partilhar via


Controle de versão no Azure Data Factory

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Gorjeta

Data Factory em Microsoft Fabric é a próxima geração de Azure Data Factory, com uma arquitetura mais simples, IA incorporada e novas funcionalidades. Se és novo na integração de dados, começa pelo Fabric Data Factory. As cargas de trabalho existentes do ADF podem atualizar para o Fabric para aceder a novas capacidades em ciência de dados, análise em tempo real e relatórios.

Por defeito, a experiência de utilizador (UX) do Azure Data Factory é diretamente criada no serviço Data Factory. Esta experiência tem as seguintes limitações:

  • O serviço Data Factory não inclui um repositório para armazenar as entidades JSON para suas alterações. A única maneira de salvar as alterações é através do botão Publicar tudo e todas as alterações são publicadas diretamente no serviço de fábrica de dados.
  • O serviço Data Factory não está otimizado para colaboração e controle de versão.
  • O modelo do Azure Resource Manager necessário para implementar o próprio Data Factory não está incluído.

Para proporcionar uma melhor experiência de autoria, o Azure Data Factory permite configurar um repositório Git com Repositórios do Azure ou GitHub. O Git é um sistema de controlo de versões que permite uma colaboração e controlo de alterações mais fáceis. Este artigo descreve como configurar e trabalhar em um repositório git, além de destacar as práticas recomendadas e um guia de solução de problemas.

Também pode consultar Continuous integration and delivery (CI/CD) em Azure Data Factory para aprender mais sobre o padrão mais amplo CI/CD, cujo controlo de versões é um aspeto crítico.

Nota

Adicionámos suporte público ao GitHub no Azure Gov e Microsoft Azure operados pela 21Vianet. Consulte o blog de anúncios.

Para saber mais sobre como o Azure Data Factory se integra com o Git, veja o vídeo tutorial de 15 minutos abaixo:

Vantagens da integração no Git

Abaixo está uma lista de algumas das vantagens que a integração git oferece para a experiência de criação:

  • Controle do código-fonte: À medida que as cargas de trabalho do data factory se tornam cruciais, convém integrar sua fábrica ao Git para aplicar vários benefícios do controle do código-fonte, como os seguintes:
    • Capacidade de rastrear/auditar alterações.
    • Capacidade de reverter alterações que introduziram bugs.
  • Salvamentos parciais: ao criar no serviço de data factory, não é possível salvar as alterações como rascunho e todas as publicações devem passar pela validação do data factory. Quer seus pipelines não estejam concluídos ou você simplesmente não queira perder alterações se seu computador falhar, a integração do git permite alterações incrementais dos recursos do data factory, independentemente do estado em que eles estejam. Configurar um repositório git permite que você salve as alterações, permitindo que você publique apenas depois de testar suas alterações para sua satisfação.
  • Colaboração e controle: se você tiver vários membros da equipe contribuindo para a mesma fábrica, convém permitir que seus colegas de equipe colaborem uns com os outros por meio de um processo de revisão de código. Você também pode configurar sua fábrica de modo que nem todos os colaboradores tenham permissões iguais. Alguns membros da equipe só podem ter permissão para fazer alterações via Git e apenas algumas pessoas da equipe podem publicar as alterações na fábrica.
  • Melhor CI/CD: Se você estiver implantando em vários ambientes com um processo de entrega contínua, a integração do git facilitará certas ações. Algumas dessas ações incluem:
    • Configure o seu pipeline de lançamento para ser iniciado automaticamente assim que houver alterações na sua fábrica 'dev'.
    • Personalize as propriedades na sua fábrica que estão disponíveis como parâmetros no modelo Resource Manager. Pode ser útil manter apenas o conjunto necessário de propriedades como parâmetros e ter todo o resto codificado.
  • Melhor desempenho: Uma fábrica média com integração git carrega 10 vezes mais rápido do que uma autoria no serviço Data Factory. Essa melhoria de desempenho ocorre porque os recursos são baixados via Git.

Nota

A autoria direta com o serviço Data Factory está desativada no Azure Data Factory UX quando um repositório Git está configurado. As alterações feitas via PowerShell ou SDK são publicadas diretamente no serviço Data Factory e não são inseridas no Git.

Conectar-se a um repositório Git

Existem quatro formas diferentes de ligar um repositório Git à tua fábrica de dados tanto para o Repositórios do Azure como para o GitHub. Depois de se conectar a um repositório Git, pode visualizar e gerir a sua configuração no hub de gestão em Configuração do Git na secção de código fonte.

Método de configuração 1: Página inicial

Na página inicial Azure Data Factory, selecione Configurar repositório de código no topo.

Configurar um repositório de código a partir da página inicial

Método de configuração 2: Criação de tela

Na interface de autoria da experiência do utilizador do Azure Data Factory, selecione o menu suspenso Data Factory e depois selecione Configurar repositório de código.

Configurar as configurações do repositório de código a partir da edição

Método de configuração 3: Hub de gerenciamento

Vai ao centro de gestão no Azure Data Factory Studio. Selecione Configuração do Git na secção Controle de código-fonte. Se você não tiver nenhum repositório conectado, selecione Configurar.

Definir as configurações do repositório de código a partir do hub de gerenciamento

Método de configuração 4: Durante a criação da fábrica

Ao criar uma nova fábrica de dados no portal Azure, pode configurar a informação do repositório Git no separador Git configuration.

Nota

Ao configurar o git no portal do Azure, definições como nome do projeto e nome do repositório têm de ser introduzidas manualmente em vez de fazerem parte de um menu suspenso.

Configurar as definições do repositório de código a partir do portal Azure

Autor com integração do Repositórios do Azure Git

A criação visual com a integração do Repositórios do Azure Git oferece controlo de código fonte e colaboração para o trabalho nos seus pipelines de fábrica de dados. Pode associar uma fábrica de dados a um repositório de organização Git do Repositórios do Azure para controlo de versões, colaboração, versionamento, entre outros. Uma única organização Git do Repositórios do Azure pode ter múltiplos repositórios, mas um repositório Git do Repositórios do Azure pode ser associado apenas a uma fábrica de dados. Se não tiver uma organização Repositórios do Azure ou repositório, siga estas instruções para criar os seus recursos.

Nota

Podes armazenar ficheiros de scripts e dados num repositório Git do Repositórios do Azure. No entanto, tens de carregar os ficheiros manualmente para o Armazenamento do Azure. Um pipeline do Azure Data Factory não carrega automaticamente scripts ou ficheiros de dados armazenados num repositório Git do Repositórios do Azure para o Armazenamento do Azure. Arquivos adicionais, como modelos ARM, scripts ou arquivos de configuração, podem ser armazenados no repositório fora da pasta mapeada. Se fizeres isto, lembra-te que é necessária uma tarefa adicional para construir/implementar e interagir com os ficheiros armazenados fora da pasta mapeada do Azure DevOps.

Definições do Repositórios do Azure

O painel de configuração orienta você passo a passo na configuração de cada uma das seguintes configurações do repositório de código:

Configuração Descrição valor
Tipo de repositório O tipo do repositório de código Repositórios do Azure.
Azure DevOps Git ou GitHub
Microsoft Entra ID O nome do seu inquilino Microsoft Entra. <your tenant name>
Organização do Repositórios do Azure O nome da sua organização Repositórios do Azure. Pode encontrar o nome da sua organização Repositórios do Azure em https://{organization name}.visualstudio.com. Pode iniciar sessão na sua organização Repositórios do Azure para aceder ao seu perfil Visual Studio e ver os seus repositórios e projetos. <your organization name>
ProjectName O nome do seu projeto Repositórios do Azure. Pode encontrar o nome do seu projeto Repositórios do Azure em https://{organization name}.visualstudio.com/{project name}. <your Azure Repos project name>
Nome do repositório O nome do seu repositório de código Repositórios do Azure. Os projetos Repositórios do Azure contêm repositórios Git para gerir o seu código-fonte à medida que o projeto cresce. Você pode criar um novo repositório ou usar um repositório existente que já esteja em seu projeto. <your Azure Repos code repository name>
Ramo de colaboração O ramo de colaboração do Repositórios do Azure que é usado para publicação. Por padrão, é main. Altere essa configuração caso queira publicar recursos de outra ramificação. <your collaboration branch name>
Ramo de publicação A ramificação de publicação é a ramificação no seu repositório onde os modelos ARM relacionados à publicação são armazenados e atualizados. Por padrão, é adf_publish. <your publish branch name>
Pasta raiz A tua pasta raiz no ramo de colaboração do Repositórios do Azure. <your root folder name>
Importar recursos existentes do Data Factory para o repositório Especifica se devem importar recursos existentes do Data Factory a partir da UX Authoring canvas para um repositório Repositórios do Azure Git. Selecione a caixa para importar seus recursos de fábrica de dados para o repositório Git associado no formato JSON. Essa ação exporta cada recurso individualmente (ou seja, os serviços vinculados e os conjuntos de dados são exportados para JSONs separados). Quando esta caixa não é selecionada, os recursos existentes não são importados. Selecionado (padrão)
Ramificação para a qual importar recurso Especifica para qual ramificação os recursos do data factory (pipelines, conjuntos de dados, serviços vinculados etc.) são importados. Você pode importar recursos para uma das seguintes ramificações: a. Colaboração b. Criar novo c. Utilização existente

Nota

Se estiver a usar o Microsoft Edge e não vir quaisquer valores na lista pendente da sua conta de Azure DevOps, adicione https://*.visualstudio.com à lista de sites de confiança.

Editando configurações de repositório

Se precisar de fazer ajustes às definições do seu repositório Repositórios do Azure Git configurado, poderá escolher Edit.

Captura de ecrã a mostrar o botão de edição para editar um repositório Repositórios do Azure Git.

Você pode atualizar sua ramificação de publicação e decidir se deseja ou não desativar o botão de publicação do estúdio ADF. Se você optar por desativar o botão de publicação do estúdio, o botão de publicação ficará acinzentado no estúdio. Isso ajuda a evitar a substituição da última implantação de publicação automatizada.

Captura de tela mostrando uma caixa de seleção para desabilitar o botão de publicação para o estúdio Data Factory.

Use um tenant diferente do Microsoft Entra

O repositório Git do Repositórios do Azure pode estar num tenant diferente do Microsoft Entra. Para especificar um tenant diferente do Microsoft Entra, tens de ter permissões de administrador para a subscrição do Azure que estás a usar. Para obter mais informações, consulte alterar o administrador de subscrição.

Importante

Para se ligar a outro Microsoft Entra ID, o utilizador iniciado deve fazer parte desse Active Directory.

Use a sua conta Microsoft pessoal

Para usar uma conta Microsoft pessoal para integração com o Git, pode conectar o seu repositório do Azure pessoal ao Active Directory da sua organização.

  1. Adicione a sua conta conta Microsoft pessoal ao Active Directory da sua organização como convidado. Para mais informações, consulte Adicionar Microsoft Entra utilizadores de colaboração B2B no portal Azure.

  2. Inicie sessão no portal Azure com a sua conta conta Microsoft pessoal. Depois mude para o Active Directory da sua organização.

  3. Vai à secção Azure DevOps, onde agora vês o teu repositório pessoal. Selecione o repositório e ligue-se ao Active Directory.

Após essas etapas de configuração, seu repositório pessoal estará disponível quando você configurar a integração do Git na interface do usuário do Data Factory.

Para mais informações sobre como ligar Repositórios do Azure ao Active Directory da sua organização, consulte Ligue a sua organização de Azure DevOps ao Microsoft Entra ID.

Autor com integração GitHub

A autoria visual com integração com o GitHub suporta controlo de código-fonte e colaboração para trabalhar nos seus pipelines de fábrica de dados. Podes associar uma fábrica de dados a um repositório de conta do GitHub para controlo de origem, colaboração e gestão de versões. Uma única conta GitHub pode alojar múltiplos repositórios, e cada repositório pode estar associado a múltiplas fábricas de dados. Ao configurar cada data factory para usar uma ramificação diferente dentro do mesmo repositório, você pode manter ambientes separados (como desenvolvimento, preparo e produção) enquanto gerencia suas configurações de forma independente. Se não tiver uma conta GitHub ou repositório, siga estas instruções para criar os seus recursos.

A integração GitHub com o Data Factory suporta tanto GitHub público (ou seja, https://github.com), GitHub Enterprise Cloud como GitHub Enterprise Server. Podes usar repositórios públicos e privados do GitHub com o Data Factory desde que tenhas permissão de leitura e escrita para o repositório no GitHub. Para se conectar a um repositório público, selecione a opção Usar repositório de links, pois estes não estão visíveis no menu suspenso de Nome do repositório. A integração GitHub servidor empresarial do ADF só funciona com versões oficialmente suportadas do GitHub servidor empresarial.

Para repositórios pertencentes à conta da organização GitHub, o administrador tem de autorizar a aplicação ADF. Para repositórios pertencentes à conta de utilizador do GitHub, um utilizador com pelo menos permissão de colaborador pode autorizar a aplicação ADF. Essa permissão não dá ao aplicativo ADF acesso direto a todos os repositórios de propriedade da conta/organização, apenas permite que o aplicativo ADF aja em nome do usuário para acessar repositórios com base nas permissões de acesso do usuário.

Nota

Se estiveres a usar Microsoft Edge, a versão anterior a 2.1.4 do GitHub Enterprise não funciona com ele. GitHub suporta oficialmente >=3.0 e tudo isto deve ser adequado para ADF. À medida que o GitHub altera a sua versão mínima, as versões suportadas por ADF também mudam.

Definições do GitHub

 Captura de ecrã mostrando o GitHub Configurar um Painel de Configuração do Repositório.

Nota

Se encontrar o erro Falhou ao listar GitHub repositórios. Por favor, certifique-se de que o nome da conta está correto e que tem permissão para realizar a ação., certifique-se de que está a usar o nome do proprietário correto e não o URL do repositório GitHub.

Captura de ecrã a mostrar o painel

GitHub definições do repositório

O painel de configuração mostra as seguintes definições do repositório GitHub:

Definição Descrição Valor
Tipo de repositório O tipo do repositório de código Repositórios do Azure. GitHub
Use GitHub Enterprise Server Caixa de seleção para selecionar GitHub Enterprise Server. Não selecionado (padrão)
URL do GitHub Enterprise Server A URL raiz do GitHub Enterprise (deve ser HTTPS para o servidor local GitHub Enterprise). Por exemplo: https://github.mydomain.com. É necessário apenas se Use GitHub Enterprise Server estiver selecionado <your GitHub Enterprise Server URL>
Proprietário do repositório GitHub Organização GitHub ou conta que detém o repositório. Este nome pode ser encontrado a partir de https://github.com/{owner}/{repository name}. Ao navegar até esta página, deves introduzir as credenciais do GitHub OAuth na tua organização ou conta do GitHub. Se selecionar Use GitHub Enterprise Server, aparece uma caixa de diálogo que permite introduzir o seu token de acesso. <your GitHub repository owner name>
Nome do repositório O nome do seu repositório de código do GitHub. As contas do GitHub contêm repositórios Git para gerir o seu código-fonte. Você pode criar um novo repositório ou usar um repositório existente que já esteja em sua conta. Especifique o nome do seu repositório de código GitHub quando selecionar Select repositório. <your repository name>
Link do repositório Git Link para o repositório de código do GitHub. Especifique o link do seu repositório de código GitHub quando selecionar Usar link do repositório. <your repository link>
Ramo de colaboração O seu ramo de colaboração no GitHub que é usado para publicação. Por padrão, é principal. Altere essa configuração caso queira publicar recursos de outra ramificação. Você também pode criar uma nova ramificação de colaboração aqui. <your collaboration branch>
Ramo de publicação A ramificação em seu repositório onde os modelos ARM relacionados à publicação são armazenados e atualizados. <your publish branch name>
Pasta raiz A tua pasta raiz no ramo de colaboração do GitHub. <your root folder name>
Importar recursos existentes para o repositório Especifica se os recursos existentes do Data Factory devem ser importados do canvas de design UX para um repositório GitHub. Selecione a caixa para importar seus recursos de fábrica de dados para o repositório Git associado no formato JSON. Essa ação exporta cada recurso individualmente (ou seja, os serviços vinculados e os conjuntos de dados são exportados para JSONs separados). Quando esta caixa não é selecionada, os recursos existentes não são importados. Selecionado (padrão)
Importar recurso para esta ramificação Especifica para qual ramificação os recursos do data factory (pipelines, conjuntos de dados, serviços vinculados etc.) são importados.

Editando configurações de repositório

Se for necessário fazer algum ajuste nas definições do seu repositório de GitHub configurado, pode optar por Edit.

Captura de ecrã mostrando o botão de edição para editar um repositório de GitHub.

Você pode atualizar sua ramificação de publicação e decidir se deseja ou não desativar o botão de publicação do estúdio ADF. Se você optar por desativar o botão de publicação do estúdio, o botão de publicação ficará acinzentado no estúdio. Isso ajuda a evitar a substituição da última implantação de publicação automatizada.

Captura de ecrã a mostrar uma caixa de seleção para desativar o botão de publicar no Azure Data Factory studio.

Organizações GitHub

Ligar-se a uma organização GitHub requer que a organização conceda permissão ao Azure Data Factory. Um usuário com permissões ADMIN na organização deve executar as etapas abaixo para permitir que o data factory se conecte.

A primeira conexão ao GitHub público ou ao GitHub Enterprise Cloud no Azure Data Factory

Se está a ligar-se ao GitHub público ou ao GitHub Enterprise Cloud a partir do Azure Data Factory pela primeira vez, siga estes passos para se ligar a uma organização GitHub.

  1. No painel de configuração Git, introduza o nome da organização no campo GitHub Account. Aparece um prompt para iniciar sessão no GitHub.
  2. Inicie sessão com as suas credenciais de utilizador.
  3. Pede-lhe que autorize Azure Data Factory como uma aplicação chamada AzureDataFactory. Nesta tela, você verá uma opção para conceder permissão para o ADF acessar a organização. Se não vires a opção de conceder permissão, pede a um administrador para conceder manualmente a permissão através do GitHub.

Depois de seguir estas etapas, sua fábrica pode se conectar a repositórios públicos e privados dentro de sua organização. Se você não conseguir se conectar, tente limpar o cache do navegador e tente novamente.

Já está ligado ao GitHub público ou ao GitHub Enterprise Cloud usando uma conta pessoal

Se já se ligou ao GitHub público ou ao GitHub Enterprise Cloud e só recebeu permissão para aceder a uma conta pessoal, siga os passos abaixo para conceder permissões a uma organização.

  1. Vai a GitHub e abre Settings.

    Abrir GitHub definições

  2. Selecione Aplicativos. Na guia Aplicativos OAuth autorizados, você verá AzureDataFactory.

    Selecione aplicativos OAuth

  3. Selecione o aplicativo e conceda acesso ao aplicativo à sua organização.

    Conceder acesso

Depois de seguir estas etapas, sua fábrica pode se conectar a repositórios públicos e privados dentro de sua organização.

Ligação ao GitHub Enterprise Server

Se te ligares ao GitHub Enterprise Server, precisas de usar um token de acesso pessoal para autenticação. Saiba como criar um token de acesso pessoal em Criar um token de acesso pessoal.

Nota

O GitHub Enterprise Server está no seu ambiente privado auto-hospedado, por isso precisa de controlo total do firewall, das políticas de rede e da VPN quando usa esta autenticação. Para mais informações, consulte About GitHub Enterprise Server.

Screenshot mostra o painel do servidor empresarial do GitHub para configuração de um repositório.

Captura de tela mostrando o uso da autenticação de token de acesso do servidor corporativo.

Limitações conhecidas do GitHub

  • Podes armazenar scripts e ficheiros de dados num repositório GitHub. No entanto, tens de carregar os ficheiros manualmente para o Armazenamento do Azure. Um pipeline Data Factory não carrega automaticamente scripts ou ficheiros de dados armazenados num repositório GitHub para o Armazenamento do Azure.

  • O GitHub Enterprise com uma versão anterior à 2.14.0 não funciona no navegador Microsoft Edge.

  • A integração do GitHub com as ferramentas de autoria visual do Data Factory só funciona na versão geralmente disponível do Data Factory.

Conectando ao Azure DevOps Server 2022

Se se ligar ao Azure DevOps Server 2022, precisa de usar um token de acesso pessoal para autenticação. Saiba como criar um token de acesso pessoal aqui.

Ligue-se ao Azure DevOps local fornecendo o Azure DevOps Server URL e Azure DevOps Project Collection

A captura de tela mostra o ADO configurar um repositório usando o servidor.

Forneça o token com escopo de acesso como leitura/gravação de código.

A captura de tela mostra como configurar o token de acesso do ADO.

Controlo de versões

Os sistemas de controle de versão (também conhecidos como controle do código-fonte) permitem que os desenvolvedores colaborem no código e rastreiem as alterações feitas na base de código. O controle do código-fonte é uma ferramenta essencial para projetos de vários desenvolvedores.

Criando ramificações de recursos

Cada repositório Git do Repositórios do Azure associado a uma data factory tem um ramo de colaboração. main( é a ramificação de colaboração padrão). Os usuários também podem criar ramificações de recursos clicando em + Nova ramificação na lista suspensa de ramificação.

Criar uma nova ramificação

Quando o novo painel de ramo aparecer, insira o nome do seu ramo de funcionalidade e selecione um ramo para basear o trabalho.

Captura de tela mostrando como criar uma ramificação com base na ramificação privada.

Quando estiver pronto para integrar as alterações do branch de funcionalidades para o branch de colaboração, clique na lista suspensa de branch e selecione Criar pull request. Esta ação leva-o ao Repositórios do Azure Git, onde pode criar pull requests, fazer revisões de código e integrar alterações no seu ramo de colaboração. main( é o padrão). Você só tem permissão para publicar no serviço Data Factory a partir de sua ramificação de colaboração.

Criar um novo pedido de pull

Definir definições de publicação

Por padrão, o Data Factory gera os templates do Resource Manager da fábrica publicada e guarda-os numa branch chamada adf_publish. Para configurar uma ramificação de publicação personalizada, adicione um publish_config.json arquivo à pasta raiz na ramificação de colaboração. Ao publicar, o ADF lê este ficheiro, procura o campo publishBranch e guarda todos os Resource Manager templates na localização especificada. Se a ramificação não existir, o data factory a criará automaticamente. Um exemplo da aparência desse arquivo está abaixo:

{
    "publishBranch": "factory/adf_publish"
}

O Azure Data Factory pode ter apenas um ramo de publicação de cada vez. Quando você especifica uma nova ramificação de publicação, o Data Factory não exclui a ramificação de publicação anterior. Se você quiser remover a ramificação de publicação anterior, exclua-a manualmente.

Nota

O Data Factory só lê o publish_config.json arquivo quando carrega a fábrica. Se você já tiver a fábrica carregada no portal, atualize o navegador para que as alterações entrem em vigor.

Publicar alterações de código

Depois de mesclar as alterações na ramificação de colaboração (main é o padrão), clique em Publicar para publicar manualmente as alterações de código na ramificação principal para o serviço Data Factory.

Publicar alterações no serviço Data Factory

Um painel lateral será aberto onde você confirmar que a ramificação de publicação e as alterações pendentes estão corretas. Depois de verificar as alterações, clique em OK para confirmar a publicação.

Confirme a ramificação de publicação correta

Importante

A ramificação principal não é representativa do que é implantado no serviço Data Factory. A ramificação principal deve ser publicada manualmente no serviço Data Factory.

Práticas recomendadas para integração com Git

Permissões

Normalmente, você não quer que todos os membros da equipe tenham permissão para atualizar o Data Factory. As seguintes configurações de permissões são recomendadas:

  • Todos os membros da equipe devem ter permissões de leitura para o Data Factory.
  • Apenas um conjunto selecionado de pessoas deve ter permissão para publicar no Data Factory. Para fazer isso, eles devem ter a função de colaborador do Data Factory no Grupo de Recursos que contém o Data Factory. Para mais informações sobre permissões, veja Roles and permissions for Azure Data Factory.

É recomendável não permitir check-ins diretos na ramificação de colaboração. Essa restrição pode ajudar a evitar bugs, pois cada check-in passará por um processo de revisão de pull request descrito em Criação de branches de funcionalidades.

Usar palavras-passe do Azure Key Vault

Recomenda-se usar o Azure Key Vault para armazenar quaisquer cadeias de ligação ou palavras-passe ou autenticação gerida de identidade para os Serviços Ligados à Fábrica de Dados. Por razões de segurança, o data factory não armazena segredos no Git. Quaisquer alterações aos Serviços Ligados que contenham segredos como palavras-passe são publicadas imediatamente no serviço Azure Data Factory.

Usar autenticação Key Vault ou MSI também facilita a integração contínua e a implementação, pois não terá de fornecer estes segredos durante a implementação do modelo do Resource Manager.

Resolver problemas de integração no Git

Ramo de publicação obsoleto

Abaixo estão alguns exemplos de situações que podem causar um ramo de publicação obsoleto:

  • Um usuário tem várias ramificações. Em uma ramificação de recurso, eles excluíram um serviço vinculado que não está associado ao AKV (serviços vinculados não AKV são publicados imediatamente, independentemente de estarem no Git ou não) e nunca mesclaram a ramificação de recurso na ramificação de colaboração.
  • Um usuário modificou a fábrica de dados usando o SDK ou o PowerShell
  • Um usuário moveu todos os recursos para uma nova ramificação e tentou publicar pela primeira vez. Os serviços vinculados devem ser criados manualmente ao importar recursos.
  • Um utilizador carrega manualmente um serviço ligado que não é AKV ou um JSON do Integration Runtime. Eles fazem referência a esse recurso de outro recurso, como um conjunto de dados, serviço vinculado ou pipeline. Um serviço não ligado a AKV, criado através da interface de utilizador, é publicado imediatamente porque as credenciais precisam ser criptografadas. Se você carregar um conjunto de dados fazendo referência a esse serviço vinculado e tentar publicar, a interface do usuário permitirá isso porque ele existe no ambiente git. O recurso será rejeitado no momento da publicação porque não existe no serviço de Data Factory.

Se a ramificação de publicação estiver fora de sincronia com a ramificação principal e contiver recursos desatualizados apesar de uma publicação recente, você poderá usar uma das soluções abaixo:

Opção 1: Usar a funcionalidade Sobrescrever modo ao vivo

Ele publica ou substitui o código da sua ramificação de colaboração no modo ao vivo. Ele considera o código em seu repositório como a fonte da verdade.

Fluxo de código:ramificação de colaboração -> modo ao vivo

Forçar a publicação de código da ramificação de colaboração

Opção 2: Desconectar e reconectar o repositório Git

Ele importa o código do modo ativo para o ramo de colaboração. Ele considera o código em modo ao vivo como fonte de verdade.

Fluxo de código:Modo ao vivo -> Ramificação de colaboração

  1. Remova seu repositório Git atual
  2. Reconfigure o Git com as mesmas configurações, mas certifique-se de que a opção Importar recursos existentes do Data Factory para o repositório esteja selecionada e escolha Ramificação de colaboração (mesma ramificação)
  3. Crie um pedido Pull para unir as alterações no ramo de colaboração.

Nota

Só é necessário criar e mesclar uma solicitação pull se você estiver trabalhando em um repositório que não permita confirmações diretas. Na maioria das organizações, os envios para o repositório exigem revisão antes da fusão, portanto, a prática recomendada geralmente é usar essa abordagem. Mas, em alguns casos, não é necessária uma revisão, caso em que não é preciso criar e unir um pull request, podendo as alterações ser diretamente submetidas à ramificação de colaboração.

Escolha qualquer um dos métodos apropriadamente, conforme necessário.

Todos os recursos exibidos como novos na publicação

Durante a publicação, todos os recursos podem aparecer como novos, mesmo que tenham sido publicados anteriormente. Isso pode acontecer se a propriedade lastCommitId for redefinida na propriedade repoConfiguration da fábrica, reimplantando um modelo ARM de fábrica ou atualizando a propriedade repoConfiguration de fábrica por meio do PowerShell ou da API REST. Continuar a publicar os recursos pode resolver o problema, mas para evitar que ele ocorra novamente, evite atualizar a propriedade repoConfiguration de fábrica.

Alternar para um repositório Git diferente

Para alternar para um repositório Git diferente, vá para a página de configuração do Git no hub de gerenciamento em Controle do código-fonte. Selecione Desligar.

Ícone do Git

Insira o nome da fábrica de dados e clique em confirmar para remover o repositório Git associado ao seu data factory.

Remova a associação com o repositório Git atual

Depois de remover a associação com o repositório atual, você pode definir suas configurações do Git para usar um repositório diferente e, em seguida, importar recursos existentes do Data Factory para o novo repositório.

Importante

Remover a configuração do Git de uma fábrica de dados não exclui nada do repositório. A fábrica contém todos os recursos publicados. Você pode continuar a editar a fábrica diretamente no serviço.