Método PySpark particiónBy()
PySpark particiónBy() se usa para particionar en función de los valores de la columna mientras se escribe DataFrame en el disco/sistema de archivos. Cuando escribe DataFrame en el disco llamando a deploymentBy(), Pyspark divide los registros en función de la columna de partición y almacena los datos de cada partición en un subdirectorio. PySpark Partition … Continue reading «Método PySpark particiónBy()»