Partiremos desde esta ilustración gráfica para avanzar en las variables Dummy:
Interpretación alternativa del coeficiente:
δ0= E(Salario|mujeres=1,educ) – E(Salario|mujeres=0,educ)
Esto muestra la diferencia de salario medio entre hombres y mujeres con el mismo nivel de estudios (educ).
Información cualitativa
- Ejemplos: género, raza, industria, región, grado de clasificación…
- Una forma de incorporar información cualitativa es utilizar variables dummy.
- Pueden aparecer como variables dependientes o independientes.
Una única variable independiente ficticia
Salario= β0 + δ0 mujeres + β1 educ +u
- δ0 = La ganancia/pérdida salarial si la persona es una mujer en lugar de un hombre (manteniendo otras variables fijas).
- Mujeres = Variable Dummy:
- 1 si la persona es una mujer.
- 0 si la persona es un hombre.
Ecuación salarial estimada con desplazamiento del intercepto
Salario = | -1,57 | – 1,81 mujeres | + 0,572 educ | + 0,025 exper | +0,141 tenencia |
(0,72) | (026) | (0,049) | (0,012) | (0,021) |
n=526, R2 = 0,364
La variable Dummy trampa
Salario = β0 + ɣ0 mujeres + δ0 mujeres + β1 educ + u
Cuando se utilizan variables Dummy, siempre hay que omitir una categoría:
- Salario = β0 + δ0 mujeres + β1 educ + u <—- La categoría base son los hombres.
- Salario = β0 + ɣ0 hombres + β1 educ + u <—- La categoría base son las mujeres
Como alternativa, se puede omitir el intercepto:
Salario = ɣ0 hombres + δ0 mujeres + β1 educ + u
Desventajas:
- Es más difícil comprobar las diferencias entre los parámetros.
- La fórmula de R-cuadrado sólo es válida si la regresión contiene un intercepto.
Hola, muchas gracias por compartir, pudieras ayudarme y dándome una breve definición o explicación de que es la variable dummy y cómo se utiliza, saludos y gracias
Hola Manuel, me alegra mucho saber que te puede haber servido esta entrada concreta y el conjunto de entradas relacionadas con las variables dummy. Quizá te pueda ayudar con tu duda esta entrada a modo de introduccción que aprovecho para compartirte (https://www.javierparra.net/contenidos/introduccion-a-las-variables-ficticias-o-variables-dummy/).
Recibe un cordial saludo.
Javier Parra
Si omito una categoría ¿Cómo después interpretó su coeficiente y la significancia de esta variable omitida si ya no aparece en la regresión?
Por favor, si me pudiese responder.
Hola, Juan Carlos; gracias por consultar mi página. Verás, al omitir una categoría en una regresión con variables dummy, esta se vuelve la base de comparación. Los coeficientes de las demás categorías muestran la diferencia respecto a esa base. La significancia de la categoría omitida se infiere de la significancia de los otros coeficientes. En el caso concreto, si omites «hombres», el coeficiente de «mujeres» indicaría la diferencia salarial entre mujeres y hombres (la categoría base). Si ese coeficiente es significativo, significa que hay una diferencia salarial significativa entre ambos géneros.
Javier Parra