select

Proyecta un conjunto de expresiones y devuelve un nuevo dataframe.

Sintaxis

select(*cols: "ColumnOrName")

Parámetros

Parámetro Tipo Descripción
cols str, columna o lista nombres de columna (cadena) o expresiones (Columna). Si uno de los nombres de columna es '*', esa columna se expande para incluir todas las columnas en el dataframe actual.

Devoluciones

DataFrame: DataFrame con subconjunto (o todos) de columnas.

Ejemplos

df = spark.createDataFrame([
    (2, "Alice"), (5, "Bob")], schema=["age", "name"])

df.select('*').show()
# +---+-----+
# |age| name|
# +---+-----+
# |  2|Alice|
# |  5|  Bob|
# +---+-----+

df.select(df.name, (df.age + 10).alias('age')).show()
# +-----+---+
# | name|age|
# +-----+---+
# |Alice| 12|
# |  Bob| 15|
# +-----+---+