En primer lugar, se estima un modelo logit para obtener la probabilidad de que el estudiante i sea usuario muy intensivo ( Pr(MuyIntensivo i ) ) en base a diferentes variables explicativas (Ecuación 3). Estas variables de control engloban todas aquéllas mostradas en la Ecuación 2 (y se muestran en el vector X de la Ecuación 3) —es decir, el género, el nivel socio-económico, la situación de repetición y de inmigración, la introducción tardía a las TIC, el tamaño de la escuela, la ratio ordenadores/ estudiante, el índice de bullying, y la titularidad de la escuela (pública o no)— , además del peso final de cada estudiante ( sw ). Este enfoque sigue la línea de DuGoff et al. (2014), en el que se propone que el modelo logit no se pondere por los pesos muestrales, sino que éstos se incluyan como una variable adicional del modelo. 30
Estas ponderaciones permiten sobre-representar a aquellos individuos que, dadas sus características, tienen una alta probabilidad de ser usuarios muy intensivos pero no reportan serlo en base al cuestionario TIC. Por el contrario, si sus características implican una probabilidad baja (predicha por el modelo) de ser usuario muy intensivo y el estudiante no reporta serlo, su ponderación será cercana a uno. Del mismo modo, si el modelo predice una probabilidad alta de ser usuario muy intensivo y éste es, efectivamente, el caso, la ponderación asignada también será cercana a uno. Por último, cuando el usuario es realmente muy intensivo pero sus características predicen una probabilidad baja, esta persona también estará sobre-representada. La Figura 21 representa visualmente el mecanismo de esta herramienta estadística. Siguiendo el enfoque de DuGoff et al. (2014), las ponderaciones finales aplicadas al modelo son el producto de los pesos muestrales y los pesos IPW, calculados como se detalla en (3), (4) y (5) previamente. Con estas ponderaciones finales, se estima el impacto medio en matemáticas entre el usuario muy intensivo y el resto de usuarios, con el fin de captar si la brecha existente en matemáticas disminuye o se mantiene cuando se aplican estas ponderaciones. Si esta brecha en la nota media estimada disminuye al aplicar las ponderaciones, serían entonces las características de los usuarios muy intensivos las que provocaban un peor resultado en matemáticas, en lugar de ser el propio uso de las TIC el causante de esa diferencia. Si, por el contrario, la brecha se mantiene, se puede concluir que las diferencias encontradas en las calificaciones de matemáticas no son el resultado de las características propias del grupo, sino que es la alta frecuencia del uso de las TIC la que provocaría que las notas en matemáticas disminuyeran. Esta es precisamente la pregunta que se responde a continuación.
FIGURA 21.
Usuarios TIC no muy intensivos pero con características similares a muy intensivos Usuarios TIC no muy intensivos y con
Esquema de la metodología estadística para el análisis de causalidad
características muy diferentes a muy intensivos Usuarios TIC muy intensivos, con características similares a muy intensivos (primera figura) y con características diferentes a muy intensivos (segunda)
Resto de usuarios
Pr(MuyIntensivo i )=f(X i ,sw i )
(3)
Población total
Una vez estimado el modelo, se predice la probabilidad de ser usuario muy intensivo ( P i ).
Estas predicciones se utilizan para crear los pesos de probabilidad inversa ( w i ) (IPW) de la siguiente manera:
, si MuyIntensivo i = 1
—1 Pi
w i =
(4)
, si MuyIntensivo i = 0 —1— 1– P i
w i =
(5)
Población ponderada
30 – La inclusión de los pesos muestrales como variable independiente en el modelo de puntuaciones de propensión puede reflejar factores relevantes, como las características demográficas y geográficas de los individuos, y, en algunos casos, variables relacionadas con la probabili- dad de responder al cuestionario (DuGoff et al., 2014).
96
97
Made with FlippingBook - Online Brochure Maker