jdbc (DataFrameReader)

Construye un objeto DataFrame que representa la tabla de base de datos accesible a través de la dirección URL urlde JDBC . Las particiones de la tabla se recuperan en paralelo si column se especifica o predicates . Si se especifican y columnpredicates , column tiene prioridad.

Sintaxis

jdbc(url, table, column=None, lowerBound=None, upperBound=None,
     numPartitions=None, predicates=None, properties=None)

Parámetros

Parámetro Tipo Descripción
url str Dirección URL de JDBC del formulario jdbc:subprotocol:subname.
table str Nombre de la tabla de la base de datos externa.
column str, opcional Columna que se va a usar para la creación de particiones (alias para la partitionColumn opción). Requiere lowerBound, upperBoundy numPartitions.
lowerBound int o str, opcional Valor mínimo de para la creación de column particiones. Se requiere cuando column está especificado.
upperBound int o str, opcional Valor máximo de para la creación de column particiones. Se requiere cuando column está especificado.
numPartitions int, opcional Número de particiones. Se requiere cuando column está especificado.
predicates list, opcional Una lista de expresiones de WHERE cláusula, cada una de las cuales define una partición de DataFrame. Se omite si se especifica column.
properties dict, opcional Argumentos de conexión JDBC, que normalmente incluyen 'user' y 'password'. Por ejemplo: {'user': 'SYSTEM', 'password': 'mypassword'}.

Devoluciones

DataFrame

Notas

Evite crear demasiadas particiones en paralelo en un clúster grande, ya que esto puede bloquear los sistemas de base de datos externos.