Filtrar un PySpark DataFrame usando isin por exclusión

En este artículo, discutiremos cómo filtrar el marco de datos pyspark usando isin por exclusión.

isin(): Esto se usa para encontrar los elementos contenidos en un marco de datos dado, toma los elementos y obtiene los elementos para que coincidan con los datos.

Sintaxis : isin([elemento1,elemento2,.,elemento n)

Creando Dataframe para demostración:

Python3

# importing module
import pyspark
  
# importing sparksession from pyspark.sql module
from pyspark.sql import SparkSession
  
# creating sparksession and giving an app name
spark = SparkSession.builder.appName('sparkdf').getOrCreate()
  
# list  of students  data  with null values
# we can define null values with none
data = [[1, "sravan", "vignan"],
        [2, "ramya", "vvit"],
        [3, "rohith", "klu"],
        [4, "sridevi", "vignan"],
        [5, "gnanesh", "iit"]]
  
# specify column names
columns = ['ID', 'NAME', 'college']
  
# creating a dataframe from the lists of data
dataframe = spark.createDataFrame(data, columns)
dataframe.show()

Producción:

Método 1: Usar filtro()

filter(): esta cláusula se usa para verificar la condición y dar los resultados, ambos son similares

Sintaxis: dataframe.filter(condición)

Ejemplo 1: Obtener los ID particulares con la cláusula filter()

Python3

# get the ID : 1,2,3 from dataframe
dataframe.filter((dataframe.ID).isin([1,2,3])).show()

Producción:

Ejemplo 2: Obtenga nombres de las columnas del marco de datos.

Python3

# get name as sravan
dataframe.filter((dataframe.NAME).isin(['sravan'])).show()

Producción:

Método 2: Usar Where()

where(): esta cláusula se usa para verificar la condición y dar los resultados

Sintaxis: dataframe.where(condición)

Ejemplo 1: Obtenga las universidades particulares con la cláusula where().

Python3

# get college as vignan
dataframe.where((dataframe.college).isin(['vignan'])).show()

Producción:

Ejemplo 2: Obtener ID excepto 5 del marco de datos.

Python3

# get ID except 1
dataframe.where(~(dataframe.ID).isin([1])).show()

Producción:

Publicación traducida automáticamente

Artículo escrito por sravankumar8128 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *