Compartilhar via


jdbc (DataFrameReader)

Constrói um DataFrame que representa a tabela de banco de dados acessível por meio da URL urlJDBC. As partições da tabela são recuperadas em paralelo se for column especificada ou predicates especificada. Se ambos column e predicates forem especificados, column terá precedência.

Sintaxe

jdbc(url, table, column=None, lowerBound=None, upperBound=None,
     numPartitions=None, predicates=None, properties=None)

Parâmetros

Parâmetro Tipo Descrição
url str A URL JDBC do formulário jdbc:subprotocol:subname.
table str O nome da tabela no banco de dados externo.
column str, opcional A coluna a ser usada para particionamento (alias para a opção partitionColumn ). Requer lowerBound, upperBounde numPartitions.
lowerBound int ou str, opcional O valor mínimo de column particionamento. Necessário quando column está especificado.
upperBound int ou str, opcional O valor máximo de column particionamento. Necessário quando column está especificado.
numPartitions int, opcional O número de partições. Necessário quando column está especificado.
predicates lista, opcional Uma lista de expressões de WHERE cláusula, cada uma definindo uma partição do DataFrame. Ignorado caso column seja especificado.
properties ditado, opcional Argumentos de conexão JDBC, normalmente incluindo 'user' e 'password'. Por exemplo, {'user': 'SYSTEM', 'password': 'mypassword'}.

Devoluções

DataFrame

Observações

Evite criar muitas partições em paralelo em um cluster grande, pois isso pode causar falhas em sistemas de banco de dados externos.