Compartilhar via


pandas_api

Converte o DataFrame existente em um DataFrame pandas-on-Spark.

Sintaxe

pandas_api(index_col: Optional[Union[str, List[str]]] = None)

Parâmetros

Parâmetro Tipo Descrição
index_col str ou lista de str, opcional Coluna de índice da tabela no Spark.

Devoluções

PandasOnSparkDataFrame

Observações

Se um DataFrame pandas-on-Spark for convertido em um DataFrame spark e voltar para pandas-on-Spark, ele perderá as informações de índice e o índice original será transformado em uma coluna normal.

Isso só estará disponível se o Pandas estiver instalado e disponível.

Exemplos

df = spark.createDataFrame(
    [(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])

df.pandas_api()
#    age   name
# 0   14    Tom
# 1   23  Alice
# 2   16    Bob

df.pandas_api(index_col="age")
#       name
# age
# 14     Tom
# 23   Alice
# 16     Bob