inputFiles

Retourneert een momentopname van de best effort van de bestanden die dit DataFrame vormen. Deze methode vraagt elke samenstellende BaseRelation voor de respectieve bestanden en neemt de samenvoeging van alle resultaten. Afhankelijk van de bronrelaties kan dit mogelijk niet alle invoerbestanden vinden. Duplicaten worden verwijderd.

Syntaxis

inputFiles()

Retouren

lijst: lijst met bestandspaden.

Examples

import os
import tempfile
with tempfile.TemporaryDirectory(prefix="inputFiles") as d:
    spark.createDataFrame(
        [{"age": 100, "name": "Alice"}]
    ).repartition(1).write.json(d, mode="overwrite")

    df = spark.read.format("json").load(d)

    if os.environ.get('PYTEST_DBCONNECT_MODE') is None:
        len(df.inputFiles())
    else:
        1  # dbconnect doesn't support inputFiles.
# 1