Creando un marco de datos de la serie Pandas

La serie es un tipo de lista en pandas que puede tomar valores enteros, valores de string, valores dobles y más. Pero en Pandas Series devolvemos un objeto en forma de lista, con un índice que comienza de 0 a n , donde n es la longitud de los valores en serie. Más adelante en este artículo, discutiremos los marcos de datos en pandas, pero primero debemos comprender la diferencia principal entre Series y Dataframe . Las series solo pueden contener una lista única con índice, mientras que el marco de datos puede estar compuesto por más de una serie o podemos decir que un marco de datos es una colección de series que se pueden usar para analizar los datos. 

Código #1: Creando una Serie simple 

Python3

#importing pandas library
import pandas as pd
 
#Creating a list
author = ['Jitender', 'Purnima', 'Arpit', 'Jyoti']
#Creating a Series by passing list variable to Series() function
auth_series = pd.Series(author)
#Printing Series
print(auth_series)

Producción:

0    Jitender
1     Purnima
2       Arpit
3       Jyoti
dtype: object

Verifiquemos el tipo de Serie: 

Python3

print(type(auth_series))

Producción:

<class 'pandas.core.series.Series'>

  Código n.º 2: creación de marcos de datos a partir de varias series 

Python3

#Importing Pandas library
import pandas as pd
 
#Creating two lists
author = ['Jitender', 'Purnima', 'Arpit', 'Jyoti']
article = [210, 211, 114, 178]
#Creating two Series by passing lists
auth_series = pd.Series(author)
article_series = pd.Series(article)
#Creating a dictionary by passing Series objects as values
frame = { 'Author': auth_series, 'Article': article_series }
#Creating DataFrame by passing Dictionary
result = pd.DataFrame(frame)
#Printing elements of Dataframe
print(result)

Producción:

     Author  Article
0  Jitender      210
1   Purnima      211
2     Arpit      114
3     Jyoti      178

Explicación: Hemos creado dos listas ‘autor’ y artículo’ que se han pasado a las funciones Series() para crear dos Series. Después de crear la Serie, creamos un diccionario y pasamos los objetos de la Serie como valores del diccionario y las claves del diccionario se servirán como Columnas del marco de datos.

   

Código #3: Cómo agregar una nueva columna al marco de datos

Python3

#Importing pandas library
import pandas as pd
#Creating Series
auth_series = pd.Series(['Jitender', 'Purnima', 'Arpit', 'Jyoti'])
article_series = pd.Series([210, 211, 114, 178])
#Creating Dictionary
frame = { 'Author': auth_series, 'Article': article_series }
#Creating Dataframe
result = pd.DataFrame(frame)
#Creating another list
age = [21, 21, 24, 23]
##Creating new column in the dataframe by providing s Series created using list
result['Age'] = pd.Series(age)
#Printing dataframe
print(result)

Producción:

     Author  Article  Age
0  Jitender      210   21
1   Purnima      211   21
2     Arpit      114   24
3     Jyoti      178   23

Explicación: Agregamos una serie más denominada externamente como la edad de los autores, luego agregamos directamente esta serie en el marco de datos de pandas. Recuerde una cosa si falta algún valor, por defecto se convertirá en valor NaN, es decir, nulo por defecto.   

Código # 4: valor faltante en el marco de datos 

Python3

#Importing pandas library
import pandas as pd
#Creating Series
auth_series = pd.Series(['Jitender', 'Purnima', 'Arpit', 'Jyoti'])
article_series = pd.Series([210, 211, 114, 178])
#Creating Dictionary
frame = { 'Author': auth_series, 'Article': article_series }
#Creating Dataframe
result = pd.DataFrame(frame)
#Creating another list
age = [21, 21, 24]
##Creating new column in the dataframe by providing s Series created using list
result['Age'] = pd.Series(age)
#Printing dataframe
print(result)

Producción:

     Author  Article   Age
0  Jitender      210  21.0
1   Purnima      211  21.0
2     Arpit      114  23.0
3     Jyoti      178   NaN

Código n. ° 5: creación de un marco de datos usando el diccionario de la serie 

  

Python3

#Importing pandas library
import pandas as pd
#Creating dictionary of Series
dict1={'Auth_Name':pd.Series(['Jitender', 'Purnima', 'Arpit', 'Jyoti']),
       'Author_Book_No': pd.Series([210, 211, 114, 178]),
         'Age': pd.Series([21, 21, 24, 23]) }
  
#Creating Dataframe
df = pd.DataFrame(dict1)
#Printing dataframe
print(df)

Producción:

   Auth_Name  Auth_Book_No  Age
0  Jitender           210   21
1   Purnima           211   21
2     Arpit           114   24
3     Jyoti           178   23

Explicación: aquí, hemos pasado un diccionario que se ha creado usando una serie como valores y luego pasamos este diccionario para crear un marco de datos. Podemos ver que al crear un marco de datos usando el diccionario, las claves del diccionario se convertirán en Columnas y los valores se convertirán en Filas.

Código n. ° 6: agregar un índice explícito al marco de datos 

Python3

#Importing pandas library
import pandas as pd
#Creating dictionary of Series
dict1={'Auth_Name':pd.Series(['Jitender', 'Purnima', 'Arpit', 'Jyoti']),
       'Author_Book_No': pd.Series([210, 211, 114, 178]),
         'Age': pd.Series([21, 21, 24, 23]) }
  
#Creating Dataframe
df = pd.DataFrame(dict1,index=['SNo1','SNo2','SNo3','SNo4'])
#Printing dataframe
print(df)

Producción:

          Auth_Name     Author_Book_No  Age
SNo1       NaN             NaN          NaN
SNo2       NaN             NaN          NaN
SNo3       NaN             NaN          NaN
SNo4       NaN             NaN          NaN

Explicación: Aquí podemos ver que después de proporcionar un índice al marco de datos explícitamente, ha llenado todos los datos con valores NaN ya que hemos creado este marco de datos usando Series y Series tiene sus propios índices predeterminados (0,1,2), es por eso que cuando los índices de tanto el marco de datos como la serie no coinciden, obtuvimos todos los valores de NaN. Podemos rectificar este problema proporcionando los mismos valores de índice para todos los elementos de la Serie. Vamos a ver cómo podemos hacer esto.

Python3

#This code is provided by Sheetal Verma
#Importing pandas library
import pandas as pd
#Creating dictionary of Series
dict1={'Auth_Name':pd.Series(['Jitender', 'Purnima', 'Arpit', 'Jyoti'],index=['SNo1','SNo2','SNo3','SNo4']),
       'Author_Book_No': pd.Series([210, 211, 114, 178],index=['SNo1','SNo2','SNo3','SNo4']),
         'Age': pd.Series([21, 21, 24, 23],index=['SNo1','SNo2','SNo3','SNo4']) }
  
#Creating Dataframe
df = pd.DataFrame(dict1,index=['SNo1','SNo2','SNo3','SNo4'])
#Printing dataframe
print(df)

Producción:

      Auth_Name       Author_Book_No  Age
SNo1  Jitender             210        21
SNo2   Purnima             211        21
SNo3     Arpit             114        24
SNo4     Jyoti             178        23

Publicación traducida automáticamente

Artículo escrito por Jitender_1998 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *