Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Carga archivos de texto y devuelve un DataFrame cuyo esquema comienza con una columna de cadena denominada value, seguida de columnas con particiones si hay alguna presente. Los archivos de texto se deben codificar como UTF-8. De forma predeterminada, cada línea del archivo de texto es una nueva fila en el dataframe resultante.
Sintaxis
text(paths, wholetext=False, lineSep=None, **options)
Parámetros
| Parámetro | Tipo | Descripción |
|---|---|---|
paths |
str o list | Una o varias rutas de acceso de entrada. |
wholetext |
bool, opcional | Si Truees , lea cada archivo como una sola fila. El valor predeterminado es False. |
lineSep |
str, opcional | Separador de línea que se va a usar. El valor predeterminado es '\n', '\r'o '\r\n'. |
Devoluciones
DataFrame
Ejemplos
Escriba un DataFrame en un archivo de texto y vuelva a leerlo.
import tempfile
with tempfile.TemporaryDirectory(prefix="text") as d:
df = spark.createDataFrame([("a",), ("b",), ("c",)], schema=["alphabets"])
df.write.mode("overwrite").format("text").save(d)
spark.read.schema(df.schema).text(d).sort("alphabets").show()
# +---------+
# |alphabets|
# +---------+
# | a|
# | b|
# | c|
# +---------+