sábado, 28 de febrero de 2015

Odds Ratio en R

En Metodología, frecuentemente usamos algoritmos para considerar una exposición (por ejemplo , absentismo escolar) y determinar su relación al comportamiento problemático (por ejemplo , la delincuencia juvenil) . Son útiles a la hora de expresar una cantidad (magnitud) del riesgo de comportamiento problemático para las personas que son expuestas a determinados agentes.

Supongamos un ejemplo con los datos siguientes: 
Tabla de Absentismo escolarxComportamientos-delictivos 
                        Delincuentes    No delincuentes 
Si-absentismo     2 (a)                8 (b) 
No-absentismo 10 (c)            990 (d) 

El riesgo se expresa en modelos de probabilidad, de una exposición dada causando un comportamiento. Es decir, la probabilidad de comportamiento problemático en los expuestos con respecto a la probabilidad de comportamiento problemático en los que no han sido expuestos. A esto, se conoce como el riesgo relativo (RR).
RR(delincuente en el grupo con absentismo/delincuente en el grupo no absentista)=(2/10)/(10/990)=19,8 

Otra forma de calcular el RR es en forma de un Odd Ratio (OR), que es una razón de dos probabilidades, las probabilidades del comportamiento (evento ) en el grupo expuesto dividido por las probabilidades del comportamiento en el grupo no expuesto .
ODD(delincuente en el grupo con absentismo)=2/8 = 0,25 
ODD(delincuente en el grupo no absentista)=10/990 = 0,01 
OR = (a/b)*(c/d) = (2/8)*(10/990)=0,25*0,01= 25 

La OR es interpretada también como una medida de la magnitud de asociación en los que tienen y los que no tienen la característica en cuestión dentro de una población específica (Prasad et al. , 2008).

Si el OR es mayor de 1.00 , el riesgo es mayor en el grupo expuesto (dirección positiva). Si el OR es menor que 1,00 , el riesgo es menor en el grupo expuesto (dirección negativa). Si el OR es igual a 1.00 , el riesgo es el mismo en ambos grupos (el valor nulo, indica que no hay diferencia). 

Por supuesto estos son los valores muestrales, en caso de intentar generalizar a la población deberemos hace uso de los intervalos confidenciales (IC). Estos cuantifican el grado de imprecisión de nuestas estimaciones.
La formula clásica suele expresarse como:
LI=ln(OR)-exp(1,96*SQRT[1/a+1/b+1/c+1/d])
LS=ln(OR)+exp(1,96*SQRT[1/a+1/b+1/c+1/d])

Por otra parte, recordar que si el intervalo contiene el valor nulo (1) eso significa que el resultado no es estadísticamente significativo en contraste de hipótesis. 

En R existen múltiples librerías que nos permiten operar con este tipo de algoritmos, para nuestros datos del ejemplo anterior usaremos la conocida como "epitools".

library(epitools)
absentismo<-c("Si","No")
comportam<-c("Delinc","Normativo")
datos <- matrix(c(2,   8,
                               10, 990),2,2,byrow=TRUE)
dimnames(datos) <- list("Absentismo escolar" = absentismo, "Comportamiento" = comportam)
oddsratio(datos) #defecto

Obteniendo como resultado tanto el OR como su IC.
$measure
                  odds ratio with 95% C.I.
Absentismo escolar estimate   lower    upper
                Si  1.00000      NA       NA
                No 25.44639 3.18587 122.6702

$p.value
                  two-sided
Absentismo escolar  midp.exact fisher.exact   chi.square
                Si          NA           NA           NA
                No 0.005674576  0.005527475 3.434574e-08

Referencias.
*Prasad, K., Jaeschke, K., Wyer, P., Keitz, S., & Guyatt, G.(2008). Tips for teachers of evidence-based medicine:Understanding odds ratios and their relationship to risk ratios. Journal of General Internal Medicine, 23, 635-640.