text (DataFrameReader)

Carga archivos de texto y devuelve un DataFrame cuyo esquema comienza con una columna de cadena denominada value, seguida de columnas con particiones si hay alguna presente. Los archivos de texto se deben codificar como UTF-8. De forma predeterminada, cada línea del archivo de texto es una nueva fila en el dataframe resultante.

Sintaxis

text(paths, wholetext=False, lineSep=None, **options)

Parámetros

Parámetro	Tipo	Descripción
`paths`	str o list	Una o varias rutas de acceso de entrada.
`wholetext`	bool, opcional	Si `True`es , lea cada archivo como una sola fila. El valor predeterminado es `False`.
`lineSep`	str, opcional	Separador de línea que se va a usar. El valor predeterminado es `'\n'`, `'\r'`o `'\r\n'`.

Devoluciones

DataFrame

Ejemplos

Escriba un DataFrame en un archivo de texto y vuelva a leerlo.

import tempfile
with tempfile.TemporaryDirectory(prefix="text") as d:
    df = spark.createDataFrame([("a",), ("b",), ("c",)], schema=["alphabets"])
    df.write.mode("overwrite").format("text").save(d)

    spark.read.schema(df.schema).text(d).sort("alphabets").show()
    # +---------+
    # |alphabets|
    # +---------+
    # |        a|
    # |        b|
    # |        c|
    # +---------+

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2026-04-19