PySpark SparkFiles类
在Apache Spark中,您可以使用 sc.addFile (sc是您的默认SparkContext)上传文件,并使用 SparkFiles.get 在工作节点上获取路径。因此,SparkFiles解析通过 SparkContext.addFile() 添加的文件路径。
SparkFiles包含以下方法:
- get(filename)
- getrootdirectory()
让我们详细了解它们。
get(filename)
它指定通过SparkContext.addFile()添加的文件的路径。
getrootdirectory()
它指定包含通过SparkContext.addFile()添加的文件的根目录的路径。
命令 - 命令如下:
输出 − 以上命令的输出为−