En Metodología, frecuentemente usamos algoritmos para considerar una
exposición (por ejemplo , absentismo escolar) y determinar su relación
al comportamiento problemático (por ejemplo , la delincuencia juvenil) . Son útiles
a la hora de expresar una cantidad (magnitud) del riesgo de comportamiento problemático para las personas que son
expuestas a determinados agentes.
Supongamos un ejemplo con los datos siguientes:
Tabla de Absentismo escolarxComportamientos-delictivos
Delincuentes No delincuentes
Si-absentismo 2 (a) 8 (b)
No-absentismo 10 (c) 990 (d)
El riesgo se expresa en modelos de probabilidad, de una exposición dada causando
un comportamiento. Es decir, la probabilidad de comportamiento problemático en los expuestos con respecto a la probabilidad de
comportamiento problemático en los que no han sido expuestos.
A esto, se conoce como el riesgo relativo (RR).
RR(delincuente en el grupo con absentismo/delincuente en el grupo no absentista)=(2/10)/(10/990)=19,8 Otra forma de calcular el RR es en forma de un Odd Ratio (OR), que es una razón de dos probabilidades, las probabilidades del comportamiento (evento ) en el grupo expuesto dividido por las probabilidades del comportamiento en el grupo no expuesto .
ODD(delincuente en el grupo con absentismo)=2/8 = 0,25
ODD(delincuente en el grupo no absentista)=10/990 = 0,01
OR = (a/b)*(c/d) = (2/8)*(10/990)=0,25*0,01= 25
La OR es interpretada también como una medida de la magnitud de asociación en los que tienen y los que no tienen la característica
en cuestión dentro de una población específica (Prasad et al. , 2008).
Si el OR es mayor de 1.00 , el riesgo es mayor en el grupo expuesto (dirección positiva). Si el OR es menor que 1,00 , el riesgo es menor en el grupo expuesto (dirección negativa). Si el OR es igual a 1.00 , el riesgo es el mismo en ambos grupos (el valor nulo, indica que no hay diferencia).
Por supuesto estos son los valores muestrales, en caso de intentar generalizar a la población deberemos hace uso de los intervalos confidenciales (IC). Estos
cuantifican el grado de imprecisión de nuestas estimaciones.
La formula clásica suele expresarse como:
LI=ln(OR)-exp(1,96*SQRT[1/a+1/b+1/c+1/d])
LS=ln(OR)+exp(1,96*SQRT[1/a+1/b+1/c+1/d])
Por otra parte, recordar que si el intervalo contiene el valor nulo (1) eso significa que el resultado no es estadísticamente significativo en contraste de hipótesis.
La formula clásica suele expresarse como:
LI=ln(OR)-exp(1,96*SQRT[1/a+1/b+1/c+1/d])
LS=ln(OR)+exp(1,96*SQRT[1/a+1/b+1/c+1/d])
Por otra parte, recordar que si el intervalo contiene el valor nulo (1) eso significa que el resultado no es estadísticamente significativo en contraste de hipótesis.
En R existen múltiples librerías que nos permiten operar con este tipo de algoritmos, para nuestros datos
del ejemplo anterior usaremos la conocida como "epitools".
library(epitools)
absentismo<-c("Si","No")
comportam<-c("Delinc","Normativo")
datos <- matrix(c(2, 8,
10, 990),2,2,byrow=TRUE)
dimnames(datos) <- list("Absentismo escolar" = absentismo, "Comportamiento" = comportam)
oddsratio(datos) #defecto
Obteniendo como resultado tanto el OR como su IC.
$measure
odds ratio with 95% C.I.
Absentismo escolar estimate lower upper
Si 1.00000 NA NA
No 25.44639 3.18587 122.6702
$p.value
two-sided
Absentismo escolar midp.exact fisher.exact chi.square
Si NA NA NA
No 0.005674576 0.005527475 3.434574e-08
Referencias.
*Prasad, K., Jaeschke, K., Wyer, P., Keitz, S., & Guyatt, G.(2008). Tips for teachers of evidence-based medicine:Understanding odds ratios and their relationship to risk ratios. Journal of General Internal Medicine, 23, 635-640.