Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Aplica-se a:
SQL Server 2019 e anteriores Analysis Services
Azure Analysis Services
Fabric/Power BI Premium
Importante
A mineração de dados foi preterida no SQL Server 2017 Analysis Services e agora descontinuada no SQL Server 2022 Analysis Services. A documentação não é atualizada para recursos preteridos e descontinuados. Para saber mais, consulte Compatibilidade com versões anteriores do Analysis Services.
A mineração de dados é um processo que envolve a interação de múltiplos componentes.
Acede às fontes de dados numa base de dados SQL Server ou em qualquer outra fonte de dados para usar em treino, testes ou previsão.
Define estruturas e modelos de mineração de dados usando SQL Server Data Tools ou Visual Studio.
Geres objetos de mineração de dados e crias previsões e consultas usando o SQL Server Management Studio.
Quando a solução está concluída, implementa-a numa instância do SQL Server Analysis Services.
O processo de criação destes objetos solução já foi descrito noutro local. Para mais informações, consulte Soluções de Mineração de Dados.
As secções seguintes descrevem a arquitetura lógica dos objetos numa solução de mineração de dados.
Objetos de Mineração de Dados Personalizados
Dados Fonte de Mineração de Dados
Os dados que utiliza na mineração de dados não são armazenados na solução de mineração de dados; apenas as encadernações são guardadas. Os dados podem residir numa base de dados criada numa versão anterior do SQL Server, num sistema CRM ou até num ficheiro plano. Quando treina a estrutura ou modelo através do processamento, cria-se um resumo estatístico dos dados e armazena-se numa cache que pode ser mantida para uso em operações posteriores, ou eliminada após o processamento. Para mais informações, consulte Estruturas de Mineração (Serviços de Análise - Mineração de Dados).
Combina dados díspares no objeto de vista de fonte de dados do SQL Server Analysis Services (DSV), que proporciona uma camada de abstração sobre a sua fonte de dados. Você pode especificar joins entre tabelas e adicionar tabelas que tenham uma relação de muitos-para-um para criar colunas de tabelas aninhadas. A definição destes objetos, a fonte de dados e a vista da fonte de dados, são armazenadas dentro da solução com as extensões de nomes de ficheiro, *.ds e *.dsv. Para mais informações sobre a criação e utilização de fontes de dados e vistas de fontes de dados dos SQL Server Analysis Services, consulte Fontes de Dados Suportadas (SSAS - Multidimensional).
Também pode definir e alterar fontes de dados e vistas de fontes de dados usando AMO ou XMLA. Para mais informações sobre como trabalhar com estes objetos programaticamente, consulte Visão Geral da Arquitetura Lógica (Serviços de Análise - Dados Multidimensionais).
Estruturas mineiras
Uma estrutura de mineração de dados é um contentor lógico de dados que define o domínio de dados a partir do qual os modelos de mineração são construídos. Uma única estrutura de mineração pode suportar múltiplos modelos de mineração.
Quando precisas de usar os dados na solução de mineração de dados, o Analysis Services lê os dados da fonte e gera um cache de agregados e outras informações. Por defeito, este cache é mantido para que os dados de treino possam ser reutilizados para suportar modelos adicionais. Se precisares de eliminar a cache, altera a propriedade CacheMode no objeto de estrutura de mineração para o valor, ClearAfterProcessing. Para mais informações, consulte Aulas de Mineração de Dados AMO.
Os Serviços de Análise também oferecem a capacidade de separar os seus dados em conjuntos de treino e teste, para que possa testar os seus modelos de mineração num conjunto representativo e selecionado aleatoriamente de dados. Os dados não são realmente armazenados separadamente; em vez disso, os dados do caso na cache da estrutura são marcados com uma propriedade que indica se esse caso particular é usado para treino ou para testes. Se a cache for eliminada, essa informação não pode ser recuperada.
Para mais informações, consulte Estruturas de Mineração (Serviços de Análise - Mineração de Dados).
Uma estrutura de mineração de dados pode conter tabelas aninhadas. Uma tabela aninhada fornece detalhes adicionais sobre o caso que é modelado na tabela de dados primária. Para mais informações, consulte Tabelas Aninhadas (Serviços de Análise - Mineração de Dados)
Modelos de Mineração
Antes do processamento, um modelo de mineração de dados é apenas uma combinação de propriedades de metadados. Estas propriedades especificam uma estrutura de mineração, especificam um algoritmo de mineração de dados e definem uma coleção de parâmetros e definições de filtro que afetam a forma como os dados são processados. Para mais informações, consulte Modelos de Mineração (Serviços de Análise - Mineração de Dados).
Quando processa o modelo, os dados de treino que estavam armazenados na cache da estrutura de mineração são usados para gerar padrões, baseados tanto nas propriedades estatísticas dos dados como nas heurísticas definidas pelo algoritmo e pelos seus parâmetros. Isto é conhecido como o treino do modelo.
O resultado do treino é um conjunto de dados resumidos, contidos no conteúdo do modelo, que descreve os padrões encontrados e fornece regras para gerar previsões. Para mais informações, consulte Mining Model Content (Analysis Services - Data Mining).
Em casos limitados, a estrutura lógica do modelo pode também ser exportada para um ficheiro que represente fórmulas do modelo e ligações de dados segundo um formato padrão, a Predictive Modeling Markup Language (PMML). Esta estrutura lógica pode ser importada para outros sistemas que utilizam PMML e o modelo assim descrito pode então ser usado para previsão. Para mais informações, consulte Compreender a Instrução DMX Select.
Objetos de Mineração de Dados Personalizados
Outros objetos que utiliza no contexto de um projeto de mineração de dados, como gráficos de precisão ou consultas de previsão, não são mantidos dentro da solução, mas podem ser scriptados usando ASSL ou construídos com AMO.
Além disso, pode estender os serviços e funcionalidades disponíveis numa instância do SQL Server Analysis Services adicionando estes objetos personalizados:
Montagens personalizadas
Os assemblies .NET podem ser definidos usando qualquer linguagem compatível com CLR ou COM, e depois registados em uma instância do SQL Server. Os ficheiros assembly são carregados a partir do local definido pela aplicação, e uma cópia é guardada no servidor juntamente com os dados. A cópia do ficheiro assembly é usada para carregar o assembly sempre que o serviço é iniciado.
Para mais informações, consulte Gestão de Montagens de Modelos Multidimensionais.
Procedimentos armazenados personalizados
A mineração de dados do SQL Server Analysis Services suporta a utilização de procedimentos armazenados para trabalhar com objetos de mineração de dados. Pode criar os seus próprios procedimentos armazenados para expandir a funcionalidade e trabalhar mais facilmente com dados devolvidos por consultas de previsão e de conteúdo.
Definição de Procedimentos Armazenados
Os seguintes procedimentos armazenados são suportados para utilização na realização de validação cruzada.
Procedimentos Armazenados de Mineração de Dados (Serviços de Análise - Mineração de Dados)
Adicionalmente, o SQL Server Analysis Services contém muitos procedimentos armazenados do sistema que são usados internamente para mineração de dados. Embora os procedimentos armazenados do sistema sejam para uso interno, pode achá-los atalhos úteis. A Microsoft reserva-se o direito de alterar estes procedimentos armazenados conforme necessário; por isso, para uso em produção, recomendamos que crie consultas usando DMX, AMO ou XMLA.
Algoritmos de plug-in personalizados
O SQL Server Analysis Services fornece um mecanismo para criar os seus próprios algoritmos e depois adicionar os algoritmos como um novo serviço de mineração de dados à instância do servidor.
O Analysis Services utiliza interfaces COM para comunicar com algoritmos de plugins. Para saber mais sobre como implementar novos algoritmos, consulte Algoritmos de Plugins.
Deve registar cada novo algoritmo antes de o poder usar. Para registar um algoritmo, adiciona-se os metadados necessários para os algoritmos no ficheiro .ini da instância do SQL Server Analysis Services. Deve adicionar a informação a cada instância onde planeia usar o novo algoritmo. Depois de adicionares o algoritmo, podes reiniciar a instância e usar o conjunto de linhas do esquema MINING_SERVICES para visualizar o novo algoritmo, incluindo as opções e fornecedores que o algoritmo suporta.
Ver também
Processamento de um modelo multidimensional (Serviços de Análise)
Referência às Extensões de Mineração de Dados (DMX)