Veamos cómo podemos recuperar los valores únicos del marco de datos de pandas.
Vamos a crear un marco de datos a partir de un archivo CSV. Estamos utilizando los datos anteriores del PIB de diferentes países. Puede obtener el conjunto de datos desde aquí .
# import pandas as pd import pandas as pd gapminder_csv_url ='http://bit.ly/2cLzoxH' # load the data with pd.read_csv record = pd.read_csv(gapminder_csv_url) record.head()
Método #1: seleccione la columna de continente del registro y aplique la función única para obtener los valores que queremos.
# import pandas as pd import pandas as pd gapminder_csv_url ='http://bit.ly/2cLzoxH' # load the data with pd.read_csv record = pd.read_csv(gapminder_csv_url) print(record['continent'].unique())
Producción:
['Asia' 'Europe' 'Africa' 'Americas' 'Oceania']
Método #2: Seleccione valores únicos de la columna de país .
# import pandas as pd import pandas as pd gapminder_csv_url ='http://bit.ly/2cLzoxH' # load the data with pd.read_csv record = pd.read_csv(gapminder_csv_url) print(record.country.unique())
Producción:
['Afghanistan' 'Albania' 'Algeria' 'Angola' 'Argentina' 'Australia' 'Austria' 'Bahrain' 'Bangladesh' 'Belgium' 'Benin' 'Bolivia' 'Bosnia and Herzegovina' 'Botswana' 'Brazil' 'Bulgaria' 'Burkina Faso' 'Burundi' 'Cambodia' 'Cameroon' 'Canada' 'Central African Republic' 'Chad' 'Chile' 'China' 'Colombia' 'Comoros' 'Congo Dem. Rep.' 'Congo Rep.' 'Costa Rica' "Cote d'Ivoire" 'Croatia' 'Cuba' 'Czech Republic' 'Denmark' 'Djibouti' 'Dominican Republic' 'Ecuador' 'Egypt' 'El Salvador' 'Equatorial Guinea' 'Eritrea' 'Ethiopia' 'Finland' 'France' 'Gabon' 'Gambia' 'Germany' 'Ghana' 'Greece' 'Guatemala' 'Guinea' 'Guinea-Bissau' 'Haiti' 'Honduras' 'Hong Kong China' 'Hungary' 'Iceland' 'India' 'Indonesia' 'Iran' 'Iraq' 'Ireland' 'Israel' 'Italy' 'Jamaica' 'Japan' 'Jordan' 'Kenya' 'Korea Dem. Rep.' 'Korea Rep.' 'Kuwait' 'Lebanon' 'Lesotho' 'Liberia' 'Libya' 'Madagascar' 'Malawi' 'Malaysia' 'Mali' 'Mauritania' 'Mauritius' 'Mexico' 'Mongolia' 'Montenegro' 'Morocco' 'Mozambique' 'Myanmar' 'Namibia' 'Nepal' 'Netherlands' 'New Zealand' 'Nicaragua' 'Niger' 'Nigeria' 'Norway' 'Oman' 'Pakistan' 'Panama' 'Paraguay' 'Peru' 'Philippines' 'Poland' 'Portugal' 'Puerto Rico' 'Reunion' 'Romania' 'Rwanda' 'Sao Tome and Principe' 'Saudi Arabia' 'Senegal' 'Serbia' 'Sierra Leone' 'Singapore' 'Slovak Republic' 'Slovenia' 'Somalia' 'South Africa' 'Spain' 'Sri Lanka' 'Sudan' 'Swaziland' 'Sweden' 'Switzerland' 'Syria' 'Taiwan' 'Tanzania' 'Thailand' 'Togo' 'Trinidad and Tobago' 'Tunisia' 'Turkey' 'Uganda' 'United Kingdom' 'United States' 'Uruguay' 'Venezuela' 'Vietnam' 'West Bank and Gaza' 'Yemen Rep.' 'Zambia' 'Zimbabwe']
Método #3:
En este método, puede ver que usamos el marco de datos dentro de la función única como parámetro, aunque seleccionamos la misma columna que arriba para obtener el mismo resultado.
# Write Python3 code here # import pandas as pd import pandas as pd gapminder_csv_url ='http://bit.ly/2cLzoxH' # load the data with pd.read_csv record = pd.read_csv(gapminder_csv_url) print(pd.unique(record['continent']))
Producción:
['Asia' 'Europe' 'Africa' 'Americas' 'Oceania']
Publicación traducida automáticamente
Artículo escrito por Jitender_1998 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA