Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Läser in textfiler och returnerar ett DataFrame vars schema börjar med en strängkolumn med namnet value, följt av eventuella partitionerade kolumner. Textfiler måste kodas som UTF-8. Som standard är varje rad i textfilen en ny rad i resulterande DataFrame.
Syntax
text(paths, wholetext=False, lineSep=None, **options)
Parameters
| Parameter | Type | Beskrivning |
|---|---|---|
paths |
str eller lista | En eller flera indatasökvägar. |
wholetext |
bool, valfritt | Om Trueläser du varje fil som en enskild rad. Standard är False. |
lineSep |
str, valfritt | Den linjeavgränsare som ska användas. Standardvärdet är '\n', '\r'eller '\r\n'. |
Retur
DataFrame
Exempel
Skriv en DataFrame till en textfil och läs tillbaka den.
import tempfile
with tempfile.TemporaryDirectory(prefix="text") as d:
df = spark.createDataFrame([("a",), ("b",), ("c",)], schema=["alphabets"])
df.write.mode("overwrite").format("text").save(d)
spark.read.schema(df.schema).text(d).sort("alphabets").show()
# +---------+
# |alphabets|
# +---------+
# | a|
# | b|
# | c|
# +---------+