Criar uma estrutura de mineração relacional

Aplica-se a: SQL Server 2019 e anteriores Analysis Services Azure Analysis Services Fabric/Power BI Premium

Importante

A mineração de dados foi preterida no SQL Server 2017 Analysis Services e agora descontinuada no SQL Server 2022 Analysis Services. A documentação não é atualizada para recursos preteridos e descontinuados. Para saber mais, consulte Compatibilidade com versões anteriores do Analysis Services.

A maioria dos modelos de mineração de dados baseia-se em fontes relacionais de dados. As vantagens de criar um modelo relacional de mineração de dados são que pode reunir dados ad hoc e treinar e atualizar um modelo sem a complexidade de criar um cubo.

Uma estrutura de mineração relacional pode retirar dados de fontes díspares. Os dados brutos podem ser armazenados em tabelas, ficheiros ou sistemas de bases de dados relacionais, desde que os dados possam ser definidos como parte da vista da fonte de dados. Por exemplo, deve usar uma estrutura de mineração relacional se os seus dados estiverem no Excel, num data warehouse SQL Server ou numa base de dados de relatórios SQL Server, ou em fontes externas acedidas através dos fornecedores OLE DB ou ODBC.

Este tópico fornece uma visão geral de como usar o Assistente de Mineração de Dados para criar uma estrutura de mineração relacional.

Requisitos

Processo para criar uma estrutura de mineração relacional

Como Escolher Fontes de Dados

Como Especificar o Tipo de Conteúdo e o Tipo de Dados

Porquê e Como Criar um Conjunto de Dados de Resistência

Porquê e Como Ativar o Drillthrough

Requerimentos

Primeiro, deve ter uma fonte de dados existente. Pode usar o Data Source designer para configurar uma fonte de dados, caso ainda não exista uma. Para mais informações, consulte Criar uma Fonte de Dados (SSAS Multidimensional).

De seguida, utilize o Assistente de Vista de Fonte de Dados para reunir os dados necessários numa única vista de fonte de dados. Para mais informações sobre como pode selecionar, transformar, filtrar ou gerir dados com vistas de fonte de dados, consulte Vistas de Fonte de Dados em Modelos Multidimensionais.

Visão Geral do Processo

Inicie o Assistente de Mineração de Dados, clicando com o botão direito no nó Estruturas de Mineração no Explorador de Soluções e selecionando Adicionar Nova Estrutura de Mineração. O assistente guia-o pelos seguintes passos para criar a estrutura de um novo modelo de mineração relacional:

Selecione o Método de Definição: Aqui seleciona um tipo de fonte de dados e escolhe a partir de base de dados relacional ou data warehouse.
Crie a Estrutura de Mineração de Dados: Determine se vai construir apenas uma estrutura ou uma estrutura com um modelo de mineração.

Também escolhe um algoritmo apropriado para o seu modelo inicial. Para orientações sobre qual algoritmo é o melhor para certas tarefas, consulte Algoritmos de Mineração de Dados (Serviços de Análise - Mineração de Dados).
Selecione Vista de Fonte de Dados: Escolha uma vista de fonte de dados para usar no treino do seu modelo. A vista da fonte de dados pode também conter dados usados para testes, ou dados não relacionados. Podes escolher quais os dados que são realmente usados na estrutura e no modelo. Também podes aplicar filtros aos dados mais tarde.
Especificar Tipos de Tabela: Selecione a tabela que contém os casos usados para análise. Para alguns conjuntos de dados, especialmente os usados para construir modelos de cesta de mercado, pode também incluir uma tabela relacionada, para usar como tabela aninhada.

Para cada tabela, deve especificar a chave, para que o algoritmo saiba como identificar um registo único, e registos relacionados se tiver adicionado uma tabela aninhada.

Para mais informações, consulte Colunas de Estrutura de Mineração.
Especifique os Dados de Treino: Nesta página, escolhe como tabela de casos, qual é a tabela que contém os dados mais importantes para análise.

Para alguns conjuntos de dados, especialmente os usados para construir modelos de cesta de mercado, pode também incluir uma tabela relacionada. Os valores nessa tabela aninhada serão tratados como múltiplos valores, todos relacionados com uma única linha (ou caso) na tabela principal.
Especificar Conteúdo e Tipos de Dados das Colunas: Para cada coluna que utilizar na estrutura, deve escolher tanto um tipo de dado como um tipo de conteúdo.

O assistente irá detetar automaticamente possíveis tipos de dados, mas não precisa de usar o tipo de dado recomendado pelo assistente. Por exemplo, mesmo que os seus dados contenham números, podem ser representativos de dados categóricos. As colunas que especifica como chaves recebem automaticamente o tipo de dados correto para o tipo de modelo específico. Para mais informações, consulte Colunas e Tipos de Dados de Modelos de Mineração (Mineração de Dados).

O tipo de conteúdo que escolhe para cada coluna que utiliza no modelo indica ao algoritmo como os dados devem ser processados.

Por exemplo, pode decidir discretizar números, em vez de usar valores contínuos. Também pode pedir ao algoritmo para detetar automaticamente o melhor tipo de conteúdo para a coluna. Para mais informações, consulte Tipos de Conteúdo (Mineração de Dados).
Criar Conjunto de Testes: Nesta página, pode indicar ao assistente quantos dados devem ser reservados para testes do modelo. Se os seus dados suportarem múltiplos modelos, é uma boa ideia criar um conjunto de dados de teste, para que todos os modelos possam ser testados nos mesmos dados.

Para mais informações, consulte Testes e Validação (Mineração de Dados).
Completar o Feiticeiro: Nesta página, dá um nome à nova estrutura de mineração e ao modelo de mineração associado, e guarda a estrutura e o modelo.

Também pode definir algumas opções importantes, dependendo do tipo de modelo. Por exemplo, pode ativar a funcionalidade de drillthrough na estrutura.

Neste ponto, a estrutura de mineração e o seu modelo são apenas metadados; Terá de processar ambos para obter resultados.

Como Escolher Dados Relacionais

As estruturas de mineração relacional podem basear-se em quaisquer dados disponíveis através de uma fonte de dados OLE DB. Se os dados de origem estiverem contidos em várias tabelas, usa uma vista de fonte de dados para reunir as tabelas e colunas de que precisa num só local.

Se as tabelas incluírem relações de um-para-muitos — por exemplo, tem múltiplos registros de compras para cada cliente que pretende analisar — pode adicionar ambas as tabelas e depois usar uma tabela como tabela de referência, ligando dados do lado múltiplo da relação como uma subtabela.

Os dados numa estrutura de mineração são derivados do que está na visualização de origem de dados existente. Pode modificar os dados conforme necessário dentro da vista da fonte de dados, adicionando relações ou colunas derivadas que possam não estar presentes nos dados relacionais subjacentes. Também pode criar cálculos nomeados ou agregações dentro da vista da fonte de dados. Estas funcionalidades são muito úteis se não tiver controlo sobre a organização dos dados na fonte de dados, ou se quiser experimentar diferentes agregações de dados para os seus modelos de mineração de dados.

Não é obrigado a usar todos os dados disponíveis; Podes escolher quais as colunas a incluir na estrutura de mineração. Todos os modelos baseados nessa estrutura podem então usar essas colunas, ou podes sinalizar certas colunas como Ignorar para um modelo específico. Pode permitir que os utilizadores de um modelo de mineração de dados explorem mais a partir dos resultados do modelo para ver colunas adicionais da estrutura de mineração que não foram incluídas no próprio modelo de mineração.

Como Especificar o Tipo de Conteúdo e o Tipo de Dados

O tipo de dados é praticamente igual aos tipos de dados que especifica no SQL Server ou noutras interfaces de aplicação: datas e horas, números de tamanhos diferentes, valores booleanos, texto e outros dados discretos.

No entanto, os tipos de conteúdo são importantes para a mineração de dados e afetam o resultado da análise. O tipo de conteúdo indica ao algoritmo o que deve fazer com os dados: os números devem ser tratados numa escala contínua ou descartados? Quantos valores potenciais existem? Cada valor é distinto? Se o valor for uma chave, que tipo de chave é – indica um valor de data/hora, uma sequência ou algum outro tipo de chave?

Note que a escolha do tipo de dado pode limitar a sua escolha de tipos de conteúdo. Por exemplo, não podes discretizar valores que não sejam numéricos. Se não conseguir ver o tipo de conteúdo que pretende, pode clicar em Voltar para voltar à página do tipo de dados e tentar outro tipo de dado.

Não precisa de se preocupar demasiado em errar o tipo de conteúdo. É muito fácil criar um novo modelo e alterar o tipo de conteúdo dentro do modelo, desde que o novo tipo de conteúdo seja suportado pelo conjunto de tipos de dados na estrutura de mineração. Também é muito comum criar múltiplos modelos usando diferentes tipos de conteúdo, seja como experiência, seja para satisfazer os requisitos de um algoritmo diferente.

Por exemplo, se os seus dados contêm uma coluna de rendimento, pode criar dois modelos diferentes ao usar o algoritmo Microsoft Decision Trees, e configurar a coluna alternadamente como números contínuos ou intervalos discretos. No entanto, se adicionasse um modelo usando o algoritmo Microsoft Naïve Bayes, seria forçado a alterar a coluna apenas para valores discretizados, porque esse algoritmo não suporta números contínuos.

Porquê e Como Dividir Dados em Conjuntos de Treino e Teste

Perto do final do assistente, tem de decidir se deve particionar os seus dados em conjuntos de treino e teste. A capacidade de provisionar uma porção amostrada aleatoriamente dos dados para testes é muito conveniente, pois garante que um conjunto consistente de dados de teste está disponível para utilização com todos os modelos de mineração associados à nova estrutura de mineração.

Advertência

Note que esta opção não está disponível para todos os tipos de modelos. Por exemplo, se criar um modelo de previsão, não poderá usar o holdout, porque o algoritmo de séries temporais exige que não haja lacunas nos dados. Para uma lista dos tipos de modelos que suportam conjuntos de dados de validação, consulte Conjuntos de Dados de Treino e Teste.

Para criar este conjunto de dados de retenção, especifica a percentagem dos dados que pretende usar para testes. Todos os dados restantes serão usados para treino. Opcionalmente, pode definir um número máximo de casos a usar para testes, ou definir um valor semente para iniciar o processo de seleção aleatória.

A definição do conjunto de teste holdout é armazenada com a estrutura de mineração, de modo que, sempre que se cria um novo modelo baseado na estrutura, o conjunto de dados de teste estará disponível para avaliar a exatidão do modelo. Se eliminar a cache da estrutura de mineração, a informação sobre os casos usados para treino e os usados para testes também será eliminada.

Porquê e Como Ativar o Drillthrough

Quase no fim do assistente, tem a opção de ativar drillthrough. É fácil perder esta opção, mas é importante. O Drillthrough permite-lhe visualizar dados de origem na estrutura de mineração consultando o modelo de mineração.

Porque é que isto é útil? Suponha que está a ver os resultados de um modelo de clustering e quer ver os clientes que foram colocados num cluster específico. Ao usar o drillthrough, pode visualizar detalhes como informações de contacto.

Advertência

Para usar o drillthrough, deve ativá-lo quando cria a estrutura de mineração. Podes ativar o drillthrough nos modelos mais tarde, definindo uma propriedade no modelo, mas as estruturas de mineração exigem que esta opção esteja definida no início. Para mais informações, consulte Consultas Drillthrough (Mineração de Dados).

Ver também

Designer de Mineração de Dados
Assistente de Mineração de Dados (Serviços de Análise - Mineração de Dados)
Propriedades do Modelo de Mineração
Propriedades para a Estrutura de Mineração e Colunas de Estrutura
Tarefas e Instruções de Estrutura de Mineração

Comentários

Esta página foi útil?

Last updated on 2026-02-03

Criar uma estrutura de mineração relacional

Requerimentos

Visão Geral do Processo

Como Escolher Dados Relacionais

Como Especificar o Tipo de Conteúdo e o Tipo de Dados

Porquê e Como Dividir Dados em Conjuntos de Treino e Teste

Porquê e Como Ativar o Drillthrough

Ver também

Comentários

Recursos adicionais