Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En este artículo se describe cómo usar la actividad de copia en una canalización para copiar datos desde y hacia Folder.
Prerrequisitos
Para copiar datos de Folder, debe configurar una puerta de enlace de datos local. Para más información, consulte Acceso a orígenes de datos locales en Data Factory.
Formato admitido
El conector Folder admite los siguientes formatos de archivo. Consulte cada artículo para consultar la configuración según el formato.
Formatos admitidos por el origen
- Formato Avro
- Formato binario
- Formato de texto delimitado
- Excel
- Formato JSON
- Formato ORC
- Formato Parquet
- Formato XML
Formatos admitidos de destino
Configuración admitida
Para la configuración de cada pestaña en la actividad de copia, vaya a las secciones siguientes respectivamente.
General
Consulte las instrucciones de configuración general para configurar la pestaña Configuración general .
Fuente
Las siguientes propiedades son compatibles con Folder en la pestaña Origen de una actividad de copia.
Las siguientes propiedades son obligatorias:
Conexión: seleccione una conexión de carpeta en la lista de conexiones. Si no existe ninguna conexión, cree una nueva conexión de carpeta.
Tipo de ruta de archivo: puede elegir Ruta de archivo, Filtro de archivo, Ruta de archivo con comodín o Lista de archivos como tipo de ruta de archivo. La configuración de cada valor es:
Ruta de acceso del archivo: seleccione Examinar para elegir el archivo que desea copiar o rellene la ruta de acceso manualmente.
Filtro de archivos: filtro nativo del lado servidor de archivos, que proporciona un mejor rendimiento que el filtro de caracteres comodín.
- Ruta de acceso de carpeta: especifique la ruta de acceso a la carpeta.
-
Filtro de archivo: use
*para coincidir con cero o más caracteres y?para que coincida con cero o un solo carácter. Obtenga más información sobre la sintaxis y las notas de los comentarios de esta sección.
Ruta de acceso del archivo Wildcard: Especifique las rutas de acceso Wildcard.
Rutas comodín: Especifique la ruta de acceso de una carpeta o archivo con caracteres comodín para filtrar carpetas o archivos de origen.
Los caracteres comodín permitidos son:
*(equivale a cero o a varios caracteres) y?(equivale a cero o a un único carácter). Use^para escapar si el nombre de la carpeta tiene caracteres comodín o este carácter de escape dentro.Ruta de acceso de carpeta comodín: especifique la ruta de acceso de la carpeta con caracteres comodín para filtrar las carpetas de origen.
Nombre de archivo comodín: Especifique el nombre de archivo utilizando caracteres comodín en la ruta especificada de la carpeta (o ruta de la carpeta comodín) para filtrar los archivos de origen.
Lista de archivos: indica que desea copiar un conjunto de archivos determinado.
- Ruta de acceso de carpeta: especifique la ruta de acceso a la carpeta.
- Ruta de acceso a la lista de archivos: apunta a un archivo de texto que incluye una lista de los archivos que se quieren copiar, con un archivo por línea, que es la ruta de acceso relativa a la ruta de archivo configurada.
Formato de archivo: seleccione el formato de archivo aplicado en la lista desplegable. Seleccione Configuración para configurar el formato de archivo. Para conocer la configuración de diferentes formatos de archivo, consulte los artículos en Formato admitido.
Las siguientes propiedades son opcionales:
- Recursivamente: especifique si los datos se leen de forma recursiva desde las subcarpetas o solo desde la carpeta especificada. Esta propiedad está seleccionada de forma predeterminada y no se aplica al configurar la lista de archivos.
- Eliminar archivos después de la finalización: indica si los archivos binarios se eliminan del almacén de origen después de pasar correctamente al almacén de destino. La eliminación de archivos es por archivo. Esta propiedad solo es válida en el escenario de copia de archivos binarios.
En Avanzado, puede especificar los campos siguientes:
Filtrar por última modificación: los archivos se filtran en función de las fechas de última modificación. Esta propiedad no se aplica al configurar el tipo de ruta de acceso del archivo como Lista de archivos.
Hora de inicio (UTC): los archivos se seleccionan si su hora de última modificación es mayor o igual que la hora configurada.
Hora de finalización (UTC): los archivos se seleccionan si su hora de última modificación es menor que la hora configurada.
Cuando la hora de inicio (UTC) tiene un valor datetime, pero la hora de finalización (UTC) es NULL, significa que se seleccionarán los archivos cuyo último atributo modificado sea mayor o igual que el valor datetime. Cuando la hora de finalización (UTC) tiene un valor datetime, pero la hora de inicio (UTC) es NULL, significa que se seleccionarán los archivos cuyo último atributo modificado sea menor que el valor datetime. Las propiedades pueden ser NULL, lo que significa que no se aplicará ningún filtro de atributo de archivo a los datos.
Habilitar la detección de particiones: especifique si se van a analizar las particiones de la ruta de acceso del archivo y a agregarlas como columnas de origen adicionales. No se selecciona de forma predeterminada y no se admite cuando se usa el formato de archivo binario.
Ruta de acceso a la partición: cuando se habilita la detección de particiones, especifique la ruta de acceso raíz absoluta para leer las carpetas particionadas como columnas de datos.
Si no se especifica, de forma predeterminada,
- Cuando utilizas una ruta de archivo o una lista de archivos en el origen, la ruta raíz de la partición es la que configuraste.
- Cuando uses el filtro de carpeta comodín, la ruta de acceso raíz de la partición es la subruta antes del primer carácter comodín.
Número máximo de conexiones simultáneas: esta propiedad indica el límite superior de conexiones simultáneas establecidas en el almacén de datos durante la ejecución de la actividad. Especifique un valor solo cuando desee limitar las conexiones simultáneas.
Destino
Las siguientes propiedades son compatibles con Folder en la pestaña Destino de una actividad de copia.
Las siguientes propiedades son obligatorias:
Conexión: seleccione una conexión de carpeta en la lista de conexiones. Si no existe ninguna conexión, cree una nueva conexión de carpeta.
Ruta de acceso del archivo: seleccione Examinar para elegir el archivo que desea copiar o rellenar manualmente la ruta de acceso.
Formato de archivo: seleccione el formato de archivo aplicado en la lista desplegable. Seleccione Configuración para configurar el formato de archivo. Para conocer la configuración de diferentes formatos de archivo, consulte los artículos en Formato admitido.
Las siguientes propiedades son opcionales:
En Avanzado, puede especificar los campos siguientes:
Comportamiento de copia: define el comportamiento de copia cuando el origen son archivos de un almacén de datos basado en archivos. Puedes elegir un comportamiento en la lista desplegable.
- Jerarquía plana: todos los archivos de la carpeta de origen están en el primer nivel de la carpeta de destino. Los archivos de destino tienen nombres generados automáticamente.
- Combinar archivos: combina todos los archivos de la carpeta de origen en un archivo. Si se especifica el nombre del archivo, el nombre de archivo combinado es el nombre especificado. De lo contrario, es un nombre de archivo generado automáticamente.
- Conservar la jerarquía (valor predeterminado): conserva la jerarquía de archivos en la carpeta de destino. La ruta de acceso relativa del archivo de origen a la carpeta de origen es idéntica a la ruta de acceso relativa del archivo de destino a la carpeta de destino.
Máximo de conexiones simultáneas: límite superior de conexiones simultáneas establecidas con el almacén de datos durante la ejecución de la actividad. Especifique un valor solo cuando desee limitar las conexiones simultáneas.
Cartografía
Para la configuración de la pestaña Asignación, vaya a Configurar sus asignaciones en la pestaña de asignación.
Settings
Para la configuración de la pestaña Configuración, vaya a Configurar los otros parámetros en la pestaña configuración.
Resumen de tabla
Las tablas siguientes contienen más información sobre la actividad de copia en Folder.
Información de origen
| Nombre | Descripción | Importancia | Obligatorio | Propiedad del script de JSON |
|---|---|---|---|---|
| Conexión | Tu conexión con el almacén de datos de origen. | <tu conexión de carpeta> | Sí | conexión |
| Tipo de ruta de acceso de archivo | Tipo de ruta de acceso de archivo que se usa para obtener datos de origen. | / | Sí | / |
| Para ruta de acceso de archivo | ||||
| Ruta de acceso del archivo | Carpeta o ruta de acceso del archivo desde la que se leen los archivos. | <la carpeta o la ruta del archivo> | No | folderPath nombre de archivo |
| Para filtro de archivos | ||||
| Folder path (Ruta de acceso a la carpeta) | Especifique la ruta de acceso a la carpeta. | <la ruta de la carpeta> | No | folderPath |
| Filtro de archivos | Filtro nativo del lado servidor de archivos. | <el filtro de archivos> | No | fileFilter |
| Para la ruta de acceso del archivo comodín | ||||
| Ruta de carpeta con comodines | Ruta de carpeta con comodín utilizada para filtrar carpetas de origen. | <ruta de acceso de la carpeta con caracteres comodín> | No | wildcardFolderPath |
| Nombre de archivo comodín | Patrón de nombre de archivo comodín usado para filtrar archivos de origen. | <su nombre de archivo con caracteres comodín> | No | wildcardFileName |
| Para lista de archivos | ||||
| Folder path (Ruta de acceso a la carpeta) | Especifique la ruta de acceso a la carpeta. | <la ruta de la carpeta> | No | folderPath |
| Ruta de acceso a la lista de archivos | Ruta de acceso a un archivo de texto que enumera los archivos que se van a copiar (con respecto a la ruta de acceso configurada). | <ruta de acceso de lista de archivos> | No | fileListPath |
| Formato de archivo | Formato de archivo para los datos de origen. Para obtener información sobre los distintos formatos de archivo, consulte los artículos en Formato admitido. | / | Sí | / |
| Recursivamente | Indica si los datos se leen de forma recursiva de las subcarpetas o solo de la carpeta especificada. Esta propiedad no se aplica al configurar la lista de archivos. | true/false | No | recursivo |
| Eliminar archivos después de la finalización | Indica si los archivos binarios se eliminan del almacén de origen después de pasar correctamente al almacén de destino. | true/false | No | deleteFilesAfterCompletion |
| Filtrar por última modificación | Los archivos con la hora de última modificación en el intervalo [Hora de inicio, Hora de finalización) se filtrarán para su posterior procesamiento. La hora se aplicará a la zona horaria UTC en el formato de YYYY-MM-DDTHH:mm:ssZ. Estas propiedades se pueden omitir, lo que significa que no se aplicará ningún filtro de atributo de archivo. Esta propiedad no se aplica al configurar el tipo de ruta de acceso del archivo como Lista de archivos. |
<fecha y hora> | No | modifiedDatetimeStart modifiedDatetimeEnd |
| Habilitación de la detección de particiones | Indica si analizar las particiones de la ruta de acceso del archivo y agregarlas como columnas de origen adicionales. | true/false | No | enablePartitionDiscovery |
| ruta raíz de partición | Cuando esté habilitada la detección de particiones, especifique la ruta de acceso raíz absoluta para poder leer las carpetas con particiones como columnas de datos. | <ruta de acceso a su partición> | No | partitionRootPath |
| Número máximo de conexiones simultáneas | Límite superior de conexiones simultáneas establecidas en el almacén de datos durante la ejecución de la actividad. Especifique un valor solo cuando desee limitar las conexiones simultáneas. | <entero> | No | maxConcurrentConnections |
Información de destino
| Nombre | Descripción | Importancia | Obligatorio | Propiedad del script de JSON |
|---|---|---|---|---|
| Conexión | Su conexión al almacén de datos de destino. | <tu conexión de carpeta> | Sí | conexión |
| Ruta de acceso del archivo | Ruta de acceso de la carpeta donde se escriben los archivos. | <la ruta de la carpeta> | Sí | folderPath nombre de archivo |
| Formato de archivo | Formato de archivo de los datos de destino. Para obtener información sobre diferentes formatos de archivo, consulte los artículos en Formato admitido. | / | Sí | / |
| Comportamiento de copia | Define cómo se escriben los archivos en el destino. | FlattenHierarchy MergeFiles PreserveHierarchy (valor predeterminado) |
No | copyBehavior |
| Número máximo de conexiones simultáneas | Número máximo de conexiones simultáneas al almacén de datos. | <entero> | No | maxConcurrentConnections |