Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Beräknar grundläggande statistik för numeriska kolumner och strängkolumner.
Syntax
describe(*cols: Union[str, List[str]])
Parameters
| Parameter | Type | Beskrivning |
|---|---|---|
cols |
str, list, valfritt | Kolumnnamn eller lista över kolumnnamn som ska beskrivas med (standard alla kolumner). |
Retur
DataFrame: En ny DataFrame som beskriver (tillhandahåller statistik) givet DataFrame.
Notes
Den här funktionen är avsedd för undersökande dataanalys, eftersom vi inte garanterar bakåtkompatibiliteten för schemat för den resulterande DataFrame.This function is meant for exploratory data analysis, as we make no guarantee about the back compatibility of the schema of the resulting DataFrame.
Använd sammanfattning för utökad statistik och kontroll över vilken statistik som ska beräknas.
Exempel
df = spark.createDataFrame(
[("Bob", 13, 40.3, 150.5), ("Alice", 12, 37.8, 142.3), ("Tom", 11, 44.1, 142.2)],
["name", "age", "weight", "height"],
)
df.describe(['age']).show()
# +-------+----+
# |summary| age|
# +-------+----+
# | count| 3|
# | mean|12.0|
# | stddev| 1.0|
# | min| 11|
# | max| 13|
# +-------+----+
df.describe(['age', 'weight', 'height']).show()
# +-------+----+------------------+-----------------+
# |summary| age| weight| height|
# +-------+----+------------------+-----------------+
# | count| 3| 3| 3|
# | mean|12.0| 40.73333333333333| 145.0|
# | stddev| 1.0|3.1722757341273704|4.763402145525822|
# | min| 11| 37.8| 142.2|
# | max| 13| 44.1| 150.5|
# +-------+----+------------------+-----------------+