Python | Serie Pandas.str.len()

Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.

El método de Pandas str.len() se utiliza para determinar la longitud de cada string en una serie de Pandas. Este método es solo para series de strings.
Dado que este es un método de string, .str debe tener el prefijo cada vez antes de llamar a este método. De lo contrario, dará un error.

Sintaxis: Serie.str.len()

Tipo de retorno: Serie de valores enteros. Los valores NULL también pueden estar presentes dependiendo de la serie de llamadas.

Para descargar el CSV utilizado en el código, haga clic aquí.

En los siguientes ejemplos, el marco de datos utilizado contiene datos de algunos jugadores de la NBA. La imagen del marco de datos antes de cualquier operación se adjunta a continuación.

Ejemplo #1: Cálculo de la longitud de la serie de strings (dtype=str)

En este ejemplo, la longitud de la string de la columna Nombre se calcula utilizando el método str.len(). El dtype de la serie ya es una string. Por lo tanto, no hay necesidad de conversión de tipos de datos. Antes de realizar cualquier operación, se eliminan las filas nulas para evitar errores.

# importing pandas module 
import pandas as pd
  
# reading csv file from url 
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
   
# dropping null value columns to avoid errors
data.dropna(inplace = True)
  
# creating new column for len
# passing values through str.len()
data["Name Length"]= data["Name"].str.len()
  
# display
data

Salida:
como se muestra en la imagen de salida, se devuelve la longitud de cada string en la columna de nombre.

Nota:

  • Este método no cuenta la longitud de las series enteras o flotantes. Dará un error ya que no es una serie de strings. La serie debe convertirse primero (se muestra en el siguiente ejemplo)
  • No hay ningún parámetro para manejar valores nulos. Un valor nulo también devolvería un valor nulo en la string de salida.

 
Ejemplo #2:
En este ejemplo, la longitud de la columna de salario se calcula usando el método str.len(). Dado que la serie se importa como float64 dtype, primero se convierte en string mediante el método .astype().

# importing pandas module 
import pandas as pd
  
# reading csv file from url 
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
   
# dropping null value columns to avoid errors
data.dropna(inplace = True)
  
# converting to string dtype
data["Salary"]= data["Salary"].astype(str)
  
# passing values
data["Salary Length"]= data["Salary"].str.len()
  
# converting back to float dtype
data["Salary"]= data["Salary"].astype(float)
  
# display
data

Salida:
como se muestra en la salida, la longitud de la serie int o float solo se puede calcular convirtiéndola en string dtype.

Publicación traducida automáticamente

Artículo escrito por Kartikaybhutani y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *