Python | Marco de datos de Pandas.filter()

Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.

La función Pandas dataframe.filter()se utiliza para crear subconjuntos de filas o columnas del marco de datos de acuerdo con las etiquetas en el índice especificado. Tenga en cuenta que esta rutina no filtra un marco de datos en su contenido. El filtro se aplica a las etiquetas del índice.

Sintaxis: DataFrame.filter(items=Ninguno, like=Ninguno, regex=Ninguno, axis=Ninguno)

Parámetros:
elementos: Lista de ejes de información para restringir (no todos deben estar presentes)
como: Mantener el eje de información donde «arg in col == True»
expresión regular: Mantener el eje de información con re.search (regex, col) ==
Eje verdadero : El eje sobre el que filtrar. De forma predeterminada, este es el eje de información, ‘índice’ para Series, ‘columnas’ para DataFrame

Devoluciones: mismo tipo que el objeto de entrada

Los parámetros items, like y regex están obligados a ser mutuamente excluyentes. Por defecto, el eje es el eje de información que se usa cuando se indexa con [].

Para el enlace al archivo CSV, haga clic aquí

Ejemplo n.º 1: use filter()la función para filtrar tres columnas cualesquiera del marco de datos.

# importing pandas as pd
import pandas as pd
  
# Creating the dataframe 
df = pd.read_csv("nba.csv")
  
# Print the dataframe
df

Ahora filtre las columnas «Nombre», «Colegio» y «Salario».

# applying filter function 
df.filter(["Name", "College", "Salary"])

Producción :

 
Ejemplo n.º 2: use filter()la función para crear un subconjunto de todas las columnas en un marco de datos que tenga la letra ‘a’ o ‘A’ en su nombre.

Nota: filter() la función también toma una expresión regular como uno de sus parámetros.

# importing pandas as pd
import pandas as pd
  
# Creating the dataframe 
df = pd.read_csv("nba.csv")
  
# Using regular expression to extract all
# columns which has letter 'a' or 'A' in its name.
df.filter(regex ='[aA]')

Producción :

La expresión regular ‘[aA]’ busca todos los nombres de columna que tienen una ‘a’ o una ‘A’ en su nombre.

Publicación traducida automáticamente

Artículo escrito por Shubham__Ranjan y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *