Compartilhar via


Transformar dados no Google Sheets (versão prévia) usando o Azure Data Factory ou o Synapse Analytics

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Dica

Data Factory no Microsoft Fabric é a próxima geração de Azure Data Factory, com uma arquitetura mais simples, IA interna e novos recursos. Se você não estiver familiarizado com a integração de dados, comece com Fabric Data Factory. As cargas de trabalho existentes do ADF podem ser atualizadas para Fabric para acessar novos recursos em ciência de dados, análise em tempo real e relatórios.

Este artigo descreve como usar Fluxo de Dados para transformar dados no Google Sheets (versão prévia). Para saber mais, leia o artigo introdutório para Azure Data Factory ou Azure Synapse Analytics.

Importante

Atualmente, esse conector está em versão prévia. Você pode experimentá-lo e oferecer comentários. Se você quiser usar uma dependência de conectores em versão prévia em sua solução, entre em contato com o suporte do Azure.

Funcionalidades com suporte

Esse conector do Planilhas Google tem suporte para os recursos a seguir:

Funcionalidades com suporte IR
Fluxo de dados de mapeamento (origem/-)

① Runtime de integração do Azure ② Runtime de integração auto-hospedado

Para obter uma lista de armazenamentos de dados com suporte como origens e coletores, confira a tabela Armazenamentos de dados com suporte.

Criar um serviço de integração com o Google Sheets usando a interface

Use as etapas a seguir para criar um serviço vinculado do Google Sheets na interface do usuário do portal Azure.

  1. Navegue até a guia Gerenciar no workspace do Azure Data Factory ou do Synapse e selecione Serviços Vinculados e selecione Novo:

  2. Pesquise Planilhas Google (versão prévia) e selecione o conector Planilhas Google (versão prévia).

    Captura de tela mostrando a seleção do conector do Planilhas Google.

  3. Configure os detalhes do serviço, teste a conexão e crie o novo serviço vinculado.

    Captura de tela da configuração do serviço vinculado ao Planilhas Google.

Detalhes da configuração do conector

As seções a seguir fornecem informações sobre as propriedades que são usadas para definir entidades dos pipelines do Data Factory e do Synapse específicas para o Planilhas Google.

Propriedades do serviço vinculado

As propriedades a seguir têm suporte no serviço vinculado ao Planilhas Google:

Propriedade Descrição Obrigatório
tipo A propriedade type deve ser definida como GoogleSheets. Sim
apiToken Especifique um token de API para o Planilhas Google. Marque esse campo como SecureString para armazená-lo com segurança. Ou você pode referenciar um segredo armazenado no Azure Key Vault. Sim

Exemplo:

{
    "name": "GoogleSheetsLinkedService",
    "properties": {
        "type": "GoogleSheets",
        "typeProperties": {
            "apiToken": {
                "type": "SecureString",
                "value": "<API token>"
            }
        }
    }
}

Propriedades de mapeamento do fluxo de dados

Ao transformar dados no fluxo de dados de mapeamento, você pode ler recursos do Planilhas Google. Para saber mais, confira a transformação de origem nos fluxos de dados de mapeamento. Você só pode usar um conjunto de dados em linha como o tipo de origem.

Transformação de origem

A tabela abaixo lista as propriedades que a fonte do Planilhas Google suporta. Você pode editar essas propriedades na guia Opções de origem.

Nome Descrição Obrigatório Valores permitidos Propriedade de script de fluxo de dados
ID da Planilha A ID da planilha no seu Planilhas Google. Verifique se o acesso geral da planilha está definido como Qualquer pessoa com o link. Sim String spreadSheetId
Nome da planilha O nome da folha na planilha. Sim String sheetName
Iniciar célula A célula inicial da planilha de onde os dados são necessários, por exemplo, A2, B4. Sim String startCell
Célula final A célula final da planilha até onde os dados são necessários, por exemplo, F10, S600. Sim String endCell

Exemplo de script de origem do Planilhas Google

Quando você usa o Planilhas Google como tipo de origem, o script de fluxo de dados associado é:

source(allowSchemaDrift: true,
	validateSchema: false,
	store: 'googlesheets',
	format: 'rest',
	spreadSheetId: $spreadSheetId,
	startCell: 'A2',
	endCell: 'F10',
	sheetName: 'Sheet1') ~> GoogleSheetsSource

Para obter uma lista de armazenamentos de dados suportados como fontes e destinos pela atividade de cópia, confira Armazenamentos de dados com suporte.