Partilhar via


Transformar dados no Google Sheets (Preview) usando Azure Data Factory ou Synapse Analytics

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Gorjeta

Data Factory em Microsoft Fabric é a próxima geração de Azure Data Factory, com uma arquitetura mais simples, IA incorporada e novas funcionalidades. Se és novo na integração de dados, começa pelo Fabric Data Factory. As cargas de trabalho existentes do ADF podem atualizar para o Fabric para aceder a novas capacidades em ciência de dados, análise em tempo real e relatórios.

Este artigo descreve como usar o Fluxo de Dados para transformar dados no Google Sheets (Pré-visualização). Para saber mais, leia o artigo introdutório para Azure Data Factory ou Azure Synapse Analytics.

Importante

Este conector está atualmente em versão preliminar. Você pode experimentá-lo e nos dar feedback. Se quiser depender dos conectores de pré-visualização na sua solução, por favor contacte suporte do Azure.

Capacidades suportadas

Este conector do Folhas de cálculo do Google é compatível com as seguintes funcionalidades.

Capacidades suportadas IR
Mapeando o fluxo de dados (fonte/-) (1)

(1) Runtime de integração Azure (2) Runtime de integração auto-hospedado

Para obter uma lista de armazenamentos de dados suportados como fontes/coletores, consulte a tabela Armazenamentos de dados suportados.

Criar um serviço vinculado do Planilhas Google usando a interface do usuário

Use os passos seguintes para criar um serviço ligado ao Google Sheets na interface do portal Azure.

  1. Navegue até ao separador Gerir no seu espaço de trabalho Azure Data Factory ou Synapse e selecione Serviços Ligados, depois selecione Novo:

  2. Pesquise por Planilhas Google (Visualização) e selecione o conector Planilhas Google (Visualização).

    Captura de ecrã a mostrar a seleção do conector do Google Sheets.

  3. Configure os detalhes do serviço, teste a conexão e crie o novo serviço vinculado.

    Captura de ecrã da configuração do serviço associado do Planilhas Google.

Detalhes de configuração do conector

As secções a seguir fornecem informações sobre propriedades utilizadas para definir entidades de pipeline do Data Factory e do Synapse específicas para Folhas de Cálculo Google.

Propriedades do serviço vinculado

As seguintes propriedades são suportadas pelo serviço vinculado do Planilhas Google.

Propriedade Descrição Obrigatório
tipo A propriedade type deve ser definida como GoogleSheets. Sim
apiToken Especifique um token de API para o Planilhas Google. Marque este campo como SecureString para armazená-lo com segurança. Ou pode referenciar um segredo armazenado em Azure Key Vault. Sim

Exemplo:

{
    "name": "GoogleSheetsLinkedService",
    "properties": {
        "type": "GoogleSheets",
        "typeProperties": {
            "apiToken": {
                "type": "SecureString",
                "value": "<API token>"
            }
        }
    }
}

Mapeando propriedades de fluxo de dados

Ao transformar dados no mapeamento de fluxo de dados, pode ler recursos do Google Sheets. Para obter mais informações, consulte a transformação de origem no mapeamento de fluxos de dados. Você só pode usar um conjunto de dados embutido como tipo de origem.

Transformação da fonte

A tabela abaixo lista as propriedades suportadas pelo Google Sheets. Você pode editar essas propriedades na guia Opções de origem .

Nome Descrição Obrigatório Valores permitidos Propriedade do script de fluxo de dados
ID da Folha de Cálculo O ID da folha de cálculo no Google Sheets. Verifique se o acesso geral da planilha está definido como Qualquer pessoa com o link. Sim String spreadSheetId
Nome da folha O nome da folha na folha de cálculo. Sim String Nome da folha
Célula inicial A célula inicial da folha de onde os dados são necessários, por exemplo A2, B4. Sim String startCell [en]
Célula final A célula final da folha onde os dados são necessários, por exemplo F10, S600. Sim String endCell

Exemplo de script de origem do Planilhas Google

Quando você usa o Planilhas Google como tipo de fonte, o script de fluxo de dados associado é:

source(allowSchemaDrift: true,
	validateSchema: false,
	store: 'googlesheets',
	format: 'rest',
	spreadSheetId: $spreadSheetId,
	startCell: 'A2',
	endCell: 'F10',
	sheetName: 'Sheet1') ~> GoogleSheetsSource

Para obter uma lista de armazenamentos de dados suportados como fontes e destinos pela atividade de cópia, consulte Armazenamentos de dados suportados.