intervall (SparkSession)

Skapar en DataFrame med en enda LongType kolumn med namnet id, som innehåller element i ett intervall från start till end (exklusivt) med stegvärdet step.

Syntax

range(start, end=None, step=1, numPartitions=None)

Parameters

Parameter Type Beskrivning
start int Startvärdet.
end int, valfritt Slutvärdet (exklusivt). Om det utelämnas start används det som slutvärde och intervallet börjar vid 0.
step int, valfritt Det inkrementella steget (standard: 1).
numPartitions int, valfritt Antalet partitioner i DataFrame.

Retur

DataFrame

Exempel

spark.range(1, 7, 2).show()
# +---+
# | id|
# +---+
# |  1|
# |  3|
# |  5|
# +---+

# If only one argument is specified, it is used as the end value.
spark.range(3).show()
# +---+
# | id|
# +---+
# |  0|
# |  1|
# |  2|
# +---+