Beskriva

Beräknar grundläggande statistik för numeriska kolumner och strängkolumner.

Syntax

describe(*cols: Union[str, List[str]])

Parameters

Parameter Type Beskrivning
cols str, list, valfritt Kolumnnamn eller lista över kolumnnamn som ska beskrivas med (standard alla kolumner).

Retur

DataFrame: En ny DataFrame som beskriver (tillhandahåller statistik) givet DataFrame.

Notes

Den här funktionen är avsedd för undersökande dataanalys, eftersom vi inte garanterar bakåtkompatibiliteten för schemat för den resulterande DataFrame.This function is meant for exploratory data analysis, as we make no guarantee about the back compatibility of the schema of the resulting DataFrame.

Använd sammanfattning för utökad statistik och kontroll över vilken statistik som ska beräknas.

Exempel

df = spark.createDataFrame(
    [("Bob", 13, 40.3, 150.5), ("Alice", 12, 37.8, 142.3), ("Tom", 11, 44.1, 142.2)],
    ["name", "age", "weight", "height"],
)
df.describe(['age']).show()
# +-------+----+
# |summary| age|
# +-------+----+
# |  count|   3|
# |   mean|12.0|
# | stddev| 1.0|
# |    min|  11|
# |    max|  13|
# +-------+----+

df.describe(['age', 'weight', 'height']).show()
# +-------+----+------------------+-----------------+
# |summary| age|            weight|           height|
# +-------+----+------------------+-----------------+
# |  count|   3|                 3|                3|
# |   mean|12.0| 40.73333333333333|            145.0|
# | stddev| 1.0|3.1722757341273704|4.763402145525822|
# |    min|  11|              37.8|            142.2|
# |    max|  13|              44.1|            150.5|
# +-------+----+------------------+-----------------+