toLocalIterator

Retourne un itérateur qui contient toutes les lignes de ce DataFrame. L’itérateur consomme autant de mémoire que la plus grande partition dans ce DataFrame. Avec la prérécupération, elle peut consommer jusqu’à la mémoire des 2 plus grandes partitions.

Syntaxe

toLocalIterator(prefetchPartitions: bool = False)

Paramètres

Paramètre Type Description
prefetchPartitions bool, facultatif Si Spark doit pré-extraire la partition suivante avant d’être nécessaire.

Retours

Itérateur : itérateur de lignes.

Exemples

df = spark.createDataFrame(
    [(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
list(df.toLocalIterator())
# [Row(age=14, name='Tom'), Row(age=23, name='Alice'), Row(age=16, name='Bob')]