pandas_api

Convierte el dataframe existente en un dataframe pandas-on-Spark.

Sintaxis

pandas_api(index_col: Optional[Union[str, List[str]]] = None)

Parámetros

Parámetro Tipo Descripción
index_col str o lista de str, opcional Columna de índice de la tabla en Spark.

Devoluciones

PandasOnSparkDataFrame

Notas

Si un DataFrame de Pandas-on-Spark se convierte en un DataFrame de Spark y, a continuación, vuelve a pandas-on-Spark, perderá la información del índice y el índice original se convertirá en una columna normal.

Esto solo está disponible si Pandas está instalado y disponible.

Ejemplos

df = spark.createDataFrame(
    [(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])

df.pandas_api()
#    age   name
# 0   14    Tom
# 1   23  Alice
# 2   16    Bob

df.pandas_api(index_col="age")
#       name
# age
# 14     Tom
# 23   Alice
# 16     Bob