Variables dummy. Parte I

Variables dummy. Parte I

Partiremos desde esta ilustración gráfica para avanzar en las variables Dummy:

ilustración gráfica de variables Dummy
Ilustración gráfica de variables Dummy

Interpretación alternativa del coeficiente:

δ0= E(Salario|mujeres=1,educ) – E(Salario|mujeres=0,educ)

Esto muestra la diferencia de salario medio entre hombres y mujeres con el mismo nivel de estudios (educ).

Información cualitativa

  • Ejemplos: género, raza, industria, región, grado de clasificación…
  • Una forma de incorporar información cualitativa es utilizar variables dummy.
  • Pueden aparecer como variables dependientes o independientes.

Una única variable independiente ficticia

Salario= β0 + δ0 mujeres + β1 educ +u

  • δ0 = La ganancia/pérdida salarial si la persona es una mujer en lugar de un hombre (manteniendo otras variables fijas).
  • Mujeres = Variable Dummy:
    • 1 si la persona es una mujer.
    • 0 si la persona es un hombre.

Ecuación salarial estimada con desplazamiento del intercepto

Salario = -1,57 – 1,81 mujeres + 0,572 educ + 0,025 exper +0,141 tenencia
(0,72)(026)(0,049)(0,012)(0,021)

n=526, R2 = 0,364

¿Significa eso que las mujeres están discriminadas?

No necesariamente. Ser mujer puede estar correlacionado con otras características de productividad que no se han controlado.

La variable Dummy trampa

Salario = β0 + ɣ0 mujeres + δ0 mujeres + β1 educ + u

Cuando se utilizan variables Dummy, siempre hay que omitir una categoría:

  • Salario = β0 + δ0 mujeres + β1 educ + u <—- La categoría base son los hombres.
  • Salario = β0 + ɣ0 hombres + β1 educ + u <—- La categoría base son las mujeres

Como alternativa, se puede omitir el intercepto:

Salario = ɣ0 hombres + δ0 mujeres + β1 educ + u

Desventajas:

  1. Es más difícil comprobar las diferencias entre los parámetros.
  2. La fórmula de R-cuadrado sólo es válida si la regresión contiene un intercepto.

4 comentarios sobre “Variables dummy. Parte I

  1. Hola, muchas gracias por compartir, pudieras ayudarme y dándome una breve definición o explicación de que es la variable dummy y cómo se utiliza, saludos y gracias

  2. Si omito una categoría ¿Cómo después interpretó su coeficiente y la significancia de esta variable omitida si ya no aparece en la regresión?
    Por favor, si me pudiese responder.

    1. Hola, Juan Carlos; gracias por consultar mi página. Verás, al omitir una categoría en una regresión con variables dummy, esta se vuelve la base de comparación. Los coeficientes de las demás categorías muestran la diferencia respecto a esa base. La significancia de la categoría omitida se infiere de la significancia de los otros coeficientes. En el caso concreto, si omites «hombres», el coeficiente de «mujeres» indicaría la diferencia salarial entre mujeres y hombres (la categoría base). Si ese coeficiente es significativo, significa que hay una diferencia salarial significativa entre ambos géneros.

      Javier Parra

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *