texte (DataFrameReader)

Charge les fichiers texte et retourne un DataFrame schéma dont le schéma commence par une colonne de chaîne nommée value, suivie de colonnes partitionnée si elles sont présentes. Les fichiers texte doivent être encodés en UTF-8. Par défaut, chaque ligne du fichier texte est une nouvelle ligne dans le DataFrame résultant.

Syntaxe

text(paths, wholetext=False, lineSep=None, **options)

Paramètres

Paramètre	Type	Description
`paths`	str ou list	Un ou plusieurs chemins d’accès d’entrée.
`wholetext`	bool, facultatif	Si `True`, lisez chaque fichier sous la forme d’une seule ligne. La valeur par défaut est `False`.
`lineSep`	str, facultatif	Séparateur de ligne à utiliser. La valeur par défaut est `'\n'`, `'\r'`ou `'\r\n'`.

Retours

DataFrame

Exemples

Écrivez un DataFrame dans un fichier texte et lisez-le.

import tempfile
with tempfile.TemporaryDirectory(prefix="text") as d:
    df = spark.createDataFrame([("a",), ("b",), ("c",)], schema=["alphabets"])
    df.write.mode("overwrite").format("text").save(d)

    spark.read.schema(df.schema).text(d).sort("alphabets").show()
    # +---------+
    # |alphabets|
    # +---------+
    # |        a|
    # |        b|
    # |        c|
    # +---------+

Commentaires

Cette page a-t-elle été utile ?

Last updated on 2026-04-19