Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.
El método de Pandas str.len()
se utiliza para determinar la longitud de cada string en una serie de Pandas. Este método es solo para series de strings.
Dado que este es un método de string, .str debe tener el prefijo cada vez antes de llamar a este método. De lo contrario, dará un error.
Sintaxis: Serie.str.len()
Tipo de retorno: Serie de valores enteros. Los valores NULL también pueden estar presentes dependiendo de la serie de llamadas.
Para descargar el CSV utilizado en el código, haga clic aquí.
En los siguientes ejemplos, el marco de datos utilizado contiene datos de algunos jugadores de la NBA. La imagen del marco de datos antes de cualquier operación se adjunta a continuación.
Ejemplo #1: Cálculo de la longitud de la serie de strings (dtype=str)
En este ejemplo, la longitud de la string de la columna Nombre se calcula utilizando el método str.len(). El dtype de la serie ya es una string. Por lo tanto, no hay necesidad de conversión de tipos de datos. Antes de realizar cualquier operación, se eliminan las filas nulas para evitar errores.
# importing pandas module import pandas as pd # reading csv file from url data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv") # dropping null value columns to avoid errors data.dropna(inplace = True) # creating new column for len # passing values through str.len() data["Name Length"]= data["Name"].str.len() # display data
Salida:
como se muestra en la imagen de salida, se devuelve la longitud de cada string en la columna de nombre.
Nota:
- Este método no cuenta la longitud de las series enteras o flotantes. Dará un error ya que no es una serie de strings. La serie debe convertirse primero (se muestra en el siguiente ejemplo)
- No hay ningún parámetro para manejar valores nulos. Un valor nulo también devolvería un valor nulo en la string de salida.
Ejemplo #2:
En este ejemplo, la longitud de la columna de salario se calcula usando el método str.len(). Dado que la serie se importa como float64 dtype, primero se convierte en string mediante el método .astype().
# importing pandas module import pandas as pd # reading csv file from url data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv") # dropping null value columns to avoid errors data.dropna(inplace = True) # converting to string dtype data["Salary"]= data["Salary"].astype(str) # passing values data["Salary Length"]= data["Salary"].str.len() # converting back to float dtype data["Salary"]= data["Salary"].astype(float) # display data
Salida:
como se muestra en la salida, la longitud de la serie int o float solo se puede calcular convirtiéndola en string dtype.
Publicación traducida automáticamente
Artículo escrito por Kartikaybhutani y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA