¿Cómo eliminar variables de un conjunto de datos en la programación SAS?

Este tema trata sobre cómo eliminar variables de un conjunto de datos en SAS. Incluye varios métodos para eliminar variables de los datos. En SAS, hay dos formas de descartar variables:

  • DROP = opción de conjunto de datos
  • Declaración DROP

Comencemos con la creación de un conjunto de datos:

DATA outdata; 
   INPUT roll_num gender $ class subj1 subj2 subj3; 
   DATALINES; 
21 F 6 10 17 20
13 F 6 21 25 17
19 F 9 19 12 15
10 M 12 7 21 25
25 F 10 15 22 13
13 F 11 20 22 27
;
proc print;
run;

Producción:

Las principales diferencias entre ambos son las siguientes:

  1. Escenario: cree una nueva variable basada en datos existentes y luego elimine las variables irrelevantes

    Al usar la declaración DROP , podemos ordenar a SAS que elimine variables solo cuando se complete el paso DATA.

    data readin;
    set outdata;
    totalsum = sum(subj1, subj2, subj3);
    drop subj1 subj2 subj3;
    run;

    Producción:

    En el ejemplo anterior, simplemente le pedimos a SAS que sume todos los valores en las variables subj1, subj2 y subj3 para producir una nueva variable totalsum y luego descartar las antiguas variables subj1, subj2 y subj3 .

    Consecuencia de usar DROP = Opción

    data readin;
    set outdata (drop = subj1 subj2 subj3);
    totalsum = sum(subj1, subj2, subj3);
    run;

    Producción:

    Las variables subj1, subj2 y subj3 no están disponibles para su uso después de que el conjunto de datos outdata se haya copiado en el nuevo conjunto de datos readin . Por lo tanto, totalsum solo contendría valores faltantes.

  2. La declaración DROP se puede usar en cualquier parte de los pasos DATA, mientras que la opción DROP = debe seguir a la declaración SET.

    declaración DROP:

    data readin;
    set outdata;
    if gender = 'F';
    drop class;
    run;

    o

    data readin;
    set outdata;
    drop class;
    if gender = 'F';
    run;

    DROP = opción

    data readin;
    set outdata (drop = class);
    if  gender = 'F';
    run;

    Producción:

  3. Escenario: La eliminación de variables mientras se imprime la
    declaración DROP se puede usar solo en los pasos DATA, mientras que la opción DROP = se puede usar tanto en los pasos DATA como en los pasos PROC (para fines de visualización).

    proc print data = outdata (drop = class);
    where gender = 'F';
    run;

    Producción:

Publicación traducida automáticamente

Artículo escrito por ShubhamMaurya3 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *