Veamos cómo leer archivos de Excel en objetos de marco de datos de Pandas usando Pandas .
Código n. ° 1: lea un archivo de Excel usando el método read_excel() de pandas.
Python3
# import pandas lib as pd import pandas as pd # read by default 1st sheet of an excel file dataframe1 = pd.read_excel('SampleWork.xlsx') print(dataframe1)
Producción :
Name Age Stream Percentage 0 Ankit 18 Math 95 1 Rahul 19 Science 90 2 Shaurya 20 Commerce 85 3 Aishwarya 18 Math 80 4 Priyanka 19 Science 75
Código n.º 2: Leer hojas específicas usando ‘sheet_name’ del método read_excel().
Python3
# import pandas lib as pd import pandas as pd # read 2nd sheet of an excel file dataframe2 = pd.read_excel('SampleWork.xlsx', sheet_name = 1) print(dataframe2)
Producción :
Name Age Stream Percentage 0 Priya 18 Math 95 1 shivangi 19 Science 90 2 Jeet 20 Commerce 85 3 Ananya 18 Math 80 4 Swapnil 19 Science 75
Código #3: Lectura de columnas específicas usando el parámetro ‘usecols’ del método read_excel().
Python3
# import pandas lib as pd import pandas as pd require_cols = [0, 3] # only read specific columns from an excel file required_df = pd.read_excel('SampleWork.xlsx', usecols = require_cols) print(required_df)
Producción :
Name Percentage 0 Ankit 95 1 Rahul 90 2 Shaurya 85 3 Aishwarya 80 4 Priyanka 75
Código #4: Manejo de datos faltantes usando el parámetro ‘na_values’ del método read_excel().
Python3
# import pandas lib as pd import pandas as pd # Handling missing values of 3rd sheet of an excel file. dataframe = pd.read_excel('SampleWork.xlsx', na_values = "Missing", sheet_name = 2) print(dataframe)
Producción :
Name Age Stream Percentage 0 Priya 18 Math 95 1 shivangi 19 Science 90 2 Jeet 20 NaN 85 3 Ananya 18 Math 80 4 Swapnil 19 Science 75
Código n. ° 5: omita las filas iniciales al leer un archivo de Excel usando el parámetro ‘skiprows’ del método read_excel().
Python3
# import pandas lib as pd import pandas as pd # read 2nd sheet of an excel file after # skipping starting two rows df = pd.read_excel('SampleWork.xlsx', sheet_name = 1, skiprows = 2) print(df)
Producción :
shivangi 19 Science 90 0 Jeet 20 Commerce 85 1 Ananya 18 Math 80 2 Swapnil 19 Science 75
Código # 6: establezca el encabezado en cualquier fila y comience a leer desde esa fila, usando el parámetro ‘encabezado’ del método read_excel().
Python3
# import pandas lib as pd import pandas as pd # setting the 3rd row as header. df = pd.read_excel('SampleWork.xlsx', sheet_name = 1, header = 2) print(df)
Producción :
shivangi 19 Science 90 0 Jeet 20 Commerce 85 1 Ananya 18 Math 80 2 Swapnil 19 Science 75
Código #7: Leer varias hojas de Excel usando el parámetro ‘sheet_name’ del método read_excel().
Python3
# import pandas lib as pd import pandas as pd # read both 1st and 2nd sheet. df = pd.read_excel('SampleWork.xlsx', na_values = "Missing", sheet_name =[0, 1]) print(df)
Producción :
OrderedDict([(0, Name Age Stream Percentage 0 Ankit 18 Math 95 1 Rahul 19 Science 90 2 Shaurya 20 Commerce 85 3 Aishwarya 18 Math 80 4 Priyanka 19 Science 75), (1, Name Age Stream Percentage 0 Priya 18 Math 95 1 shivangi 19 Science 90 2 Jeet 20 Commerce 85 3 Ananya 18 Math 80 4 Swapnil 19 Science 75)])
Código #8: Leer todas las hojas del archivo de Excel juntas usando el parámetro ‘sheet_name’ del método read_excel().
Python3
# import pandas lib as pd import pandas as pd # read all sheets together. all_sheets_df = pd.read_excel('SampleWork.xlsx', na_values = "Missing", sheet_name = None) print(all_sheets_df)
Producción :
OrderedDict([('Sheet1', Name Age Stream Percentage 0 Ankit 18 Math 95 1 Rahul 19 Science 90 2 Shaurya 20 Commerce 85 3 Aishwarya 18 Math 80 4 Priyanka 19 Science 75), ('Sheet2', Name Age Stream Percentage 0 Priya 18 Math 95 1 shivangi 19 Science 90 2 Jeet 20 Commerce 85 3 Ananya 18 Math 80 4 Swapnil 19 Science 75), ('Sheet3', Name Age Stream Percentage 0 Priya 18 Math 95 1 shivangi 19 Science 90 2 Jeet 20 NaN 85 3 Ananya 18 Math 80 4 Swapnil 19 Science 75)])