text (DataFrameReader)

Carrega arquivos de texto e retorna um DataFrame cujo esquema começa com uma coluna de cadeia de caracteres nomeada value, seguida por colunas particionadas, se houver. Os arquivos de texto devem ser codificados como UTF-8. Por padrão, cada linha no arquivo de texto é uma nova linha no DataFrame resultante.

Sintaxe

text(paths, wholetext=False, lineSep=None, **options)

Parâmetros

Parâmetro	Tipo	Descrição
`paths`	str ou lista	Um ou mais caminhos de entrada.
`wholetext`	bool, opcional	Se `True`, leia cada arquivo como uma única linha. O padrão é `False`.
`lineSep`	str, opcional	O separador de linha a ser usado. O padrão é `'\n'`, `'\r'`ou `'\r\n'`.

Devoluções

DataFrame

Exemplos

Escreva um DataFrame em um arquivo de texto e leia-o novamente.

import tempfile
with tempfile.TemporaryDirectory(prefix="text") as d:
    df = spark.createDataFrame([("a",), ("b",), ("c",)], schema=["alphabets"])
    df.write.mode("overwrite").format("text").save(d)

    spark.read.schema(df.schema).text(d).sort("alphabets").show()
    # +---------+
    # |alphabets|
    # +---------+
    # |        a|
    # |        b|
    # |        c|
    # +---------+

Comentários

Esta página foi útil?

Last updated on 2026-04-19