I. Barrio Beraza, A. Iparraguirre Letamendia, M. X. Rodríguez Álvarez, I. Arostegui Madariaga
Un modelo predictivo requiere una buena capacidad discriminativa entre individuos con y sin el evento de interés. El parámetro más utilizado para medir la capacidad discriminativa en un modelo de regresión logística es el área bajo la curva ROC (AUC). El AUC obtenido en la misma muestra utilizada para desarrollar el modelo está sobre-estimado. Con el objetivo de corregir este optimismo, se han propuesto diferentes alternativas como el split validation, cross validation o bootstrap. En este trabajo comparamos estos tres métodos mediante un estudio de simulación para un modelo de regresión logística con dos covariables continuas en el que conocemos el AUC teórico. Los resultados muestran que el método que mejor se aproxima al AUC teórico es el bootstrap. Sin embargo, cuando la variable predictiva es categórica, el método boostrap clásico no corrige el optimismo. Por lo tanto, proponemos una alternativa al boostrap clásico para corregir el optimismo en presencia de variables categóricas.
Palabras clave: Modelos predictivos, AUC, sobre-estimación, bootstrap
Programado
X04 Pausa Café. Sesión Posters. Reunión TEST - Edificio 1
7 de septiembre de 2016 11:40
Edificio 1