I. Barrio Beraza, A. Iparraguirre Letamendia, M. X. Rodríguez Álvarez, I. Arostegui Madariaga

Un modelo predictivo requiere una buena capacidad discriminativa entre individuos con y sin el evento de interés. El parámetro más utilizado para medir la capacidad discriminativa en un modelo de regresión logística es el área bajo la curva ROC (AUC). El AUC obtenido en la misma muestra utilizada para desarrollar el modelo está sobre-estimado. Con el objetivo de corregir este optimismo, se han propuesto diferentes alternativas como el split validation, cross validation o bootstrap. En este trabajo comparamos estos tres métodos mediante un estudio de simulación para un modelo de regresión logística con dos covariables continuas en el que conocemos el AUC teórico. Los resultados muestran que el método que mejor se aproxima al AUC teórico es el bootstrap. Sin embargo, cuando la variable predictiva es categórica, el método boostrap clásico no corrige el optimismo. Por lo tanto, proponemos una alternativa al boostrap clásico para corregir el optimismo en presencia de variables categóricas.

Palabras clave: Modelos predictivos, AUC, sobre-estimación, bootstrap

Programado

X04 Pausa Café. Sesión Posters. Reunión TEST - Edificio 1
7 de septiembre de 2016  11:40
Edificio 1


Otros trabajos en la misma sesión

Análisis estadístico de la influencia cultural en la relación laboral-familiar en Kenia, España e Islandia.

S. Belope Nguema, L. Escot Mangas, J. A. Fernández Cornejo, M. L. Vicente Hernanz

Modelo de frontera estocástica sobre diferencias con ineficiencias gamma

A. Shatla, C. E. Carleos Artime, N. O. Corral Blanco

Modelización de datos de accidente mediante EPPM

A. Conde Sánchez, A. J. Sáez Castillo, A. M. Martínez Rodríguez, J. Rodríguez Avi, M. J. Olmo Jiménez

Bisemivalues and binomial bisemivalues: Study and characteritzation

M. Domènech Blàzquez, J. M. Giménez Pradales, M. A. Puente del Campo

Efecto del logro de resultados en categoría junior sobre el rendimiento en edades absolutas en natación.

I. Yustres Amores, L. Fernández Morales, J. M. González Ravé, R. Martín Martín

Filtro fusión distribuido en sistemas multisensor con matrices aleatorias correladas

I. García-Garrido, J. Linares-Pérez, R. Caballero-Águila

Modelización espacio-temporal de la localización de las viviendas vendidas en Zaragoza durante el periodo 2006-2014

L. Paci, M. A. Beamonte, A. E. Gelfand, P. Gargallo Valero, M. Salvador Figueras

Analysis of marked point patterns with replication

J. A. González, J. Mateu, B. M. Lagos-Álvarez

Un nuevo algoritmo para el problema de reposición dinámica de inventarios con capacidades de almacenaje

J. M. Gutiérrez Expósito, M. Colebrook Santamaría, B. Abdul-Jalbar Betancor, J. Sicilia Rodríguez

Nuevo algoritmo de filtrado para compensar la pérdida aleatoria de medidas

J. Linares-Pérez, A. Hermoso-Carazo, R. Caballero-Águila

La distribución CTP: Un estudio de simulación

M. J. Olmo Jiménez, J. Rodríguez Avi, A. Conde Sánchez, A. M. Martínez Rodríguez, A. J. Sáez Castillo

Corrección de la no respuesta total por sustituciones secuenciales en campo

G. L. Infante González, M. M. Muñoz Conde, J. Muñoz García, R. Pino Mejías

Simulación de señales aleatorias cuaternión Cη-propias

J. Navarro Moreno, R. M. Fernández Alcalá, J. C. Ruiz Molina, J. D. Jiménez López, J. A. Espinosa Pulido

Diseños óptimos para modelos polinómicos fraccionarios

I. M. Ortiz Rodríguez, I. Martínez López, C. Rodríguez Torreblanca

Designing accelereted failure time models

M. J. Rivas López, J. López Fidalgo

Ajuste de datos reales mediante procesos de difusión lognormales no homogéneos

P. Román Román, J. J. Serrano Pérez, F. Torres Ruiz

Principios de primas en teoría de riesgo: Un análisis de robustez Bayesiana

M. Sánchez Sánchez, A. Suárez Llorens, M. Á. Sordo Díaz

Subsampling decomposition of heterogeneous data from clinical cohorts

J. M. Sánchez Santos, F. J. Campos Laborie, J. De Las Rivas

Designing the temperature acceleration factor

M. T. Santos Martín, J. M. Rodríguez Díaz, M. J. Rivas López

Un modelo funcional para el TRI de series financieras

M. J. Valderrama Bonnet, M. Escabias Machuca, Ó. González Frutos

Minería de datos en Series Temporales Fuzzy

E. Vercher González, J. D. Bermúdez Edo, A. Rubio Fornes

Simulación del consumo de electricidad en hogares con técnicas de análisis de datos funcionales

J. A. Moler Cuiral, F. Mallor Giménez, H. Urmeneta Martín-Calero


Últimas noticias

  • 22/06/16
    Programa SEIO 2016 y X Jornadas de Estadística Pública

    El Programa del XXXVI Congreso Nacional de la SEIO y las X Jornadas de Estadística Pública ya está disponible en la página web.

    Puede acceder desde aquí.

  • 16/06/16
    Fecha límite para hacer la inscripción con la tarifa reducida.
  • 25/05/16
    Alojamiento en Residencias Universitarias

    La Universidad de Castilla-La Mancha ofrece a los asistentes al XXXVI Congreso Nacional de Estadística e Investigación Operativa y de las X Jornadas de Estadística Pública la posibilidad de alojamiento en el Colegio Mayor Gregorio Marañon, situado en el centro histórico de Toledo.

    Para ver más información pulse aquí.

Organizan

Política de cookies

Usamos cookies solamente para poder idenfiticarte y autenticarte dentro del sitio web. Son necesarias para el correcto funcionamiento del mismo y por tanto no pueden ser desactivadas. Si continúas navegando estás dando tu consentimiento para su aceptación, así como la de nuestra Política de Privacidad.

Adicionalmente, utilizamos Google Analytics para analizar el tráfico del sitio web. Ellos almacenan cookies también, y puedes aceptarlas o rechazarlas en los botones de más abajo.

Aquí puedes ver más detalles de nuestra Política de Cookies y nuestra Política de Privacidad.