Información general de las actividades

Las actividades son los bloques de creación que le ayudan a crear flujos de trabajo de datos de un extremo a otro en Microsoft Fabric. Piense en ellos como las tareas que mueven y transforman los datos para satisfacer sus necesidades empresariales. Puede usar una actividad de copia para mover datos de SQL Server a Azure Blob Storage. Después, podría agregar una actividad de flujo de datos o una actividad de cuaderno para procesar y transformar esos datos antes de cargarlos en Azure Synapse Analytics para la creación de informes.

Las actividades se agrupan en flujos de trabajo para lograr objetivos específicos. Por ejemplo, puede crear una canalización que:

  • Extrae datos de registro de orígenes diferentes
  • Limpia y organiza los datos
  • Ejecuta análisis para buscar información

Agrupar las actividades en una canalización le permite administrar todos estos pasos como una unidad en lugar de controlar cada actividad por separado. Puede implementar y programar toda la canalización a la vez para ejecutarla siempre que la necesite.

Microsoft Fabric ofrece tres tipos de actividades:

Actividades de movimiento de datos

Estas actividades le ayudan a mover datos de un lugar a otro en la canalización.

Actividad de movimiento Description
Copia de datos Puede copiar datos de cualquier origen admitido en cualquier destino admitido. Consulte la introducción al conector para ver lo que está disponible.
Trabajo de copia Los trabajos de copia son un método simplificado para mover datos rápidamente.

Si necesita elegir entre diferentes opciones de movimiento de datos, consulte el artículo de la guía de decisiones sobre el movimiento de datos.

Actividades de transformación de datos

Estas actividades le ayudan a procesar y transformar los datos. Puede usarlos individualmente o encadenarlos junto con otras actividades.

Para obtener más información, consulte el artículo sobre las actividades de transformación de datos.

Actividad de transformación de datos Entorno de computación
Copia de datos Administrador de proceso de Microsoft Fabric
Flujo de datos Gen2 Administrador de proceso de Microsoft Fabric
Eliminar datos Administrador de proceso de Microsoft Fabric
Fabric Notebook Clústeres de Apache Spark administrados por Microsoft Fabric
Actividad de HDInsight Clústeres de Apache Spark administrados por Microsoft Fabric
Definición de trabajos de Spark Clústeres de Apache Spark administrados por Microsoft Fabric
Procedimiento almacenado Azure SQL, Azure Synapse Analytics o SQL Server
Script SQL Azure SQL, Azure Synapse Analytics o SQL Server

Actividades de flujo de control

Estas actividades le ayudan a controlar cómo se ejecuta el flujo de trabajo:

Actividad de control Description
Anexar variable Agrega un valor a una variable de matriz existente.
Actividad de Azure Batch Ejecuta un script de Azure Batch.
Actividad de Azure Databricks Ejecuta un trabajo de Azure Databricks (Notebook, Jar, Python).
Actividad de Azure Machine Learning Ejecuta un trabajo de Azure Machine Learning.
Desactivación de la actividad Desactiva otra actividad.
Fail Hace que la ejecución de la canalización produzca un error con un mensaje de error personalizado y un código de error.
Filter Aplica una expresión de filtro a una matriz de entrada.
ForEach La actividad ForEach define un flujo de control repetido en la canalización. Esta actividad se usa para iterar una colección y ejecuta las actividades especificadas en un bucle. La implementación del bucle de esta actividad es similar a la estructura del bucle ForEach de los lenguajes de programación.
Actividad de funciones Ejecuta una función de Azure Functions.
Obtener metadatos La actividad GetMetadata se puede usar para recuperar metadatos de cualquier dato en una canalización de Data Factory o Synapse.
Condición If La condición If puede usarse para ramificar según una condición que evalúa como verdadero o falso. La actividad de la condición IF proporciona la misma funcionalidad que proporciona una instrucción If en lenguajes de programación. Evalúa un conjunto de actividades cuando la condición se evalúa como true y otro conjunto de actividades cuando la condición se evalúa como false.
Invocación de canalización La actividad Execute Pipeline permite que una canalización de Data Factory o Synapse invoque a otra canalización.
Actividad KQL Ejecuta un script de KQL en una instancia de Kusto.
Actividad de mantenimiento de Lakehouse Efectúe el mantenimiento rutinario de tablas en un Lakehouse desde una canalización de Microsoft Fabric.
Actividad de búsqueda La actividad de búsqueda puede usarse para leer o buscar un registro, un nombre de tabla o un valor de cualquier origen externo. Además, las actividades posteriores pueden hacer referencia a este resultado.
Actualizar la actividad del punto de conexión de SQL Actualiza un punto de conexión de SQL de Lakehouse para reflejar los datos más recientes.
Establecer variable Establece el valor de una variable existente.
Actividad de conmutador Implementa una expresión Switch que permite varias actividades posteriores para cada posible resultado de la expresión.
Actividad de Teams Publica un mensaje en un canal de Teams o chat de grupo.
Hasta la actividad Implementa el bucle Do-Until, que es similar a la estructura de bucle Do-Until de los lenguajes de programación. Ejecuta un conjunto de actividades en un bucle hasta que la condición asociada a la actividad se evalúa como verdadera. Puede especificar un valor de tiempo de espera para la actividad until.
Actividad de espera Cuando use una actividad de espera en una canalización, esta espera durante el tiempo especificado antes de continuar con la ejecución de actividades posteriores.
Actividad web La actividad Web puede usarse para llamar a un punto de conexión REST personalizado desde una canalización.
Actividad de Webhook Use la actividad de webhook para llamar a un punto de conexión y pasar una dirección URL de devolución de llamada. La ejecución de la canalización espera a que la devolución de llamada se invoque antes de continuar con la siguiente actividad.

Adición de actividades a una canalización con la interfaz de usuario de Microsoft Fabric

Aquí se muestra cómo agregar y configurar actividades en la canalización:

  1. Cree una canalización en su espacio de trabajo.
  2. Vaya a la pestaña Actividades y examine las actividades disponibles. Desplácese a la derecha para ver todas las opciones y, a continuación, seleccione una actividad para agregarla al editor de canalizaciones.
  3. Al agregar una actividad y seleccionarla en el lienzo, verá su configuración general en el panel de propiedades siguiente.
  4. Cada actividad tiene otras opciones de configuración en otras pestañas del panel de propiedades.

Captura de pantalla que muestra el editor de canalizaciones con la pestaña Actividades, la barra de herramientas, una actividad de copia y la pestaña General de sus propiedades, todo resaltado.

Configuración general

Al agregar una nueva actividad a una canalización y seleccionarla, verá sus propiedades en la parte inferior de la pantalla. Estos incluyen General, Configuración y, a veces, otras pestañas.

Captura de pantalla de la pestaña Configuración general de una actividad.

Cada actividad incluye campos Nombre y Descripción en la configuración general. Algunas actividades también tienen estas opciones:

Setting Description
Timeout Cuánto tiempo se puede ejecutar una actividad antes de que expire el tiempo de espera. El valor predeterminado es 12 horas y el máximo es siete días. Use el formato D.HH:MM:SS.
Retry Cuántas veces se reintenta si se produce un error en la actividad.
(Propiedades avanzadas) Intervalo de reintento (s) Cuántos segundos hay que esperar entre los reintentos.
(Propiedades avanzadas) Salida segura Cuando se selecciona, la salida de la actividad no aparecerá en los registros.
(Propiedades avanzadas) Entrada segura Cuando se selecciona, la entrada de actividad no aparecerá en los registros.

Note

De forma predeterminada, puede tener hasta 120 actividades por canalización. Esto incluye actividades internas relacionadas con contenedores.

Desactivar una actividad

Puede desactivar una o varias actividades de una canalización para omitirlas durante la validación y ejecución de la canalización. Esta característica mejora la eficacia del desarrollador de canalizaciones, lo que le permite comentar parte de la canalización sin eliminarla del lienzo. Puede reactivar las actividades más adelante.

Desactivar actividades

Hay dos maneras de desactivar una actividad: desactivar una sola actividad desde su pestaña General o desactivar varias actividades con clic derecho.

Guarde los cambios para desactivar las actividades durante la siguiente ejecución de canalización programada.

Desactivar una sola actividad

  1. Seleccione la actividad que desea desactivar
  2. En la pestaña General, seleccione Desactivado para estado de actividad.
  3. Elija un estado para marcar la actividad como. Elija entre Exitoso, Fallido u Omitido

Captura de pantalla del editor de canalizaciones de Fabric Data Factory con la actividad web ActivityDeactivated establecida en Inactivo en el panel Configuración general.

Desactivación de varias actividades

  1. Pulse la tecla Ctrl para hacer una selección múltiple. Con el mouse, haga clic con el botón izquierdo en todas las actividades que desea desactivar.
  2. Haga clic con el botón derecho para abrir el menú desplegable.
  3. Seleccione Desactivar para desactivarlos todos.
  4. Para ajustar la configuración de Marcar actividad como, vaya a la pestaña General de la actividad y realice los cambios oportunos

Captura de pantalla de cómo desactivar varias actividades a la vez.

Reactivar actividades

Para reactivar las actividades, elija Activado para el estado de actividad y vuelva a sus comportamientos anteriores, según lo previsto.

Comportamientos de actividad inactiva

Una actividad inactiva se comporta de forma diferente en una canalización.

  • En el lienzo, la actividad inactiva aparece en gris, con el signo Inactivo junto al tipo de actividad

  • En el lienzo, se coloca un indicador de estado (Exitoso, Fallido u Omitido) en el cuadro para visualizar la configuración de Marcar actividad como.

  • La actividad se excluye de la validación de la tubería. Por lo tanto, no es necesario proporcionar todos los campos necesarios para una actividad inactiva.

  • Durante la ejecución de depuración y la ejecución de canalización, la actividad no se ejecutará realmente. En su lugar, ejecuta un elemento de marcador de posición, con el estado reservado Inactivo

  • La opción de ramificación se controla mediante la opción Marcar actividad como. En otras palabras:

    • Si marca la actividad como Exitosa, se ejecuta la rama UponSuccess o UponCompletion.
    • Si marca la actividad como Error, se ejecuta la rama UponFailure o UponCompletion .
    • Si marca la actividad como Saltada, se ejecuta la rama UponSkip.

    Captura de pantalla que muestra el estado de ejecución de la actividad de una actividad inactiva.

Procedimientos recomendados para la desactivación

La desactivación es una herramienta eficaz para los desarrolladores de canalizaciones. Permite a los desarrolladores comentar partes del código sin necesidad de eliminar permanentemente las actividades. Brilla en los siguientes escenarios:

  • Al desarrollar una canalización, los desarrolladores pueden agregar actividades de marcador de posición inactivas antes de rellenar todos los campos necesarios. Por ejemplo, necesito una actividad de copia de SQL Server a Almacenamiento de datos, pero aún no he configurado todas las conexiones. Así que utilizo una actividad de copia inactiva como soporte para el proceso de desarrollo iterativo.
  • Después de la implementación, el desarrollador puede comentar ciertas actividades que están causando problemas constantemente para evitar costosos reintentos. Por ejemplo, mi servidor SQL local tiene problemas de conexión de red y sé que mis actividades de copia no se realizan correctamente. Puede que quiera desactivar la actividad de copia, para evitar que las solicitudes de reintento inunden el frágil sistema.

Note

Una actividad inactiva nunca se ejecuta realmente. Esto significa que la actividad no tendrá un campo de error o sus campos de salida típicos. Las referencias a campos faltantes pueden producir errores más adelante.