Extraiga todas las palabras mayúsculas de Dataframe en Pandas

En este artículo, discutiremos varios métodos para extraer palabras mayúsculas de un marco de datos en el módulo pandas . A continuación se muestra el marco de datos que se utilizará para representar varios enfoques:

Python3

# Import pandas library
import pandas
 
# Create dataset
data = [['tom', 'DATAFRAME', '200.00'],
        ['PANDAS', 15, 3.14],
        ['r2j', 14, 'PYTHON']]
 
# Create the pandas DataFrame
df = pandas.DataFrame(data)
 
# Display dataframe
df

Producción:

Método #1: Usar el método ord() en una función explícita

Cree una función explícita para verificar si el argumento de string pasado contiene todos los caracteres en mayúscula o no. En la función, compruebe si cada carácter es una letra mayúscula o no utilizando su valor ASCII. Ahora use esa función explícita en cada elemento del marco de datos para identificar palabras mayúsculas y mostrarlas.

Python3

# Import pandas library
import pandas
 
 
# explicit function to check if string
# contains only uppercase characters
def findCap(s):
    for ele in str(s):
        if ord(ele) < 65 or ord(ele) > 90:
            return 0
    return 1
 
 
# Create dataset
data = [['tom', 'DATAFRAME', '200.00'],
        ['PANDAS', 15, 3.14],
        ['r2j', 14, 'PYTHON']]
 
# Create the pandas DataFrame
df = pandas.DataFrame(data)
 
 
# access each element in
# the dataframe
for i in range(df.shape[1]):
    for ele in df[i]:
 
        # call explicit function
        if findCap(ele):
            print(ele)

Producción:

PANDAS
DATAFRAME
PYTHON

Método #2: Usar los métodos str() e isupper()

Acceda a cada elemento del marco de datos y convierta cada elemento en una string usando str(), luego aplique el método isupper() en cada elemento. Extraiga las palabras mayúsculas del marco de datos y muéstrelas.

Python3

# Import pandas library
import pandas
 
 
# Create dataset
data = [['tom', 'DATAFRAME', '200.00'],
        ['PANDAS', 15, 3.14],
        ['r2j', 14, 'PYTHON']]
 
# Create the pandas DataFrame
df = pandas.DataFrame(data)
 
 
# access each element in the dataframe
for i in range(df.shape[1]):
   for ele in df[i]:
        
       # use isupper()
       if str(ele).isupper():
            print(ele)

Producción:

PANDAS
DATAFRAME
PYTHON

Método #3: Usar el método str() y el módulo regex

Acceda a cada elemento del marco de datos y convierta cada elemento en una string usando str(), luego aplique expresiones regulares para extraer las palabras mayúsculas del marco de datos y mostrarlas.

Python3

# Import required modules
import re
import pandas
 
 
# Create dataset
data = [['tom', 'DATAFRAME', '200.00'],
        ['PANDAS', 15, 3.14],
        ['r2j', 14, 'PYTHON']]
 
# Create the pandas DataFrame
df = pandas.DataFrame(data)
 
 
# access each element in the dataframe
for i in range(df.shape[1]):
   for ele in df[i]:
        if bool(re.match(r'\w*[A-Z]\w*', str(ele))):
              print(ele)

Producción:

PANDAS
DATAFRAME
PYTHON

Publicación traducida automáticamente

Artículo escrito por riturajsaha y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *