S.A.S. | Eliminar filas vacías

Generalmente, cuando importamos datos de fuentes externas como archivos Excel/CSV, carga filas adicionales que están totalmente en blanco. A veces, los valores vacíos en la base de datos también afectan el resultado deseado, por lo que es necesario verificar los casos faltantes y realizar las operaciones correspondientes.

Ejemplo:
Entrada : el conjunto de datos de muestra que se muestra a continuación tiene cuatro variables: 1 carácter y 3 numéricos. Se usaría más adelante en el ejemplo para demostrar cómo eliminar filas vacías.

Nombre fisio química Matemáticas
Shubhash 70 68 66
Sámar 55 85
Ashutosh 54 78 89
varun 50 96 85
Pratiksha 68 93

Crear un conjunto de datos SAS
El código definido a continuación es un conjunto de datos de muestra para realizar una operación de eliminación de vacío.

data outdata;
LENGTH name $12.;
input name $ phys chem maths ;
infile datalines missover;
datalines;Shubhash 70 68 66
    samar 55 . 85 
    ashutosh 54 78 89 
    varun 50 96 85 
    pratiksha . 68 93 
;run;

Producción:

  • Método I: elimina la fila completa donde todas las variables tienen valores en blanco o faltantes

    OPTIONS missing = ' ';
    data readin;
        SET outdata;
        IF missing(cats(of _all_)) 
        THEN 
          DELETE;
    run;

    Nota:

    • La opción del sistema MISSING= se utiliza para mostrar los valores que faltan como un solo espacio en lugar de como el punto predeterminado (.) opciones que faltan = ‘ ‘;
    • La función CATS concatena los valores. También elimina los espacios en blanco iniciales y finales. cats(of _all_) – Concatenar todas las variables
    • faltante(gatos(de _todos_)) – Identifica todas las filas en las que existen valores faltantes en todas las variables.

    Producción:

  • Método II: elimina solo las filas en las que alguna de las variables tiene valores faltantes o en blanco

    data readin;
        SET outdata; 
        IF cmiss(of _character_) 
        OR nmiss(of _numeric_) > 0
         THEN 
          DELETE;
    run;

    En este caso, estamos usando el operador OR para verificar si alguna de las variables tiene valores faltantes. Devuelve 4 observaciones. Echa un vistazo a la salida a continuación:

Publicación traducida automáticamente

Artículo escrito por ShubhamMaurya3 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *