J. Martín-Fernández, M. Vives-Mestres, R. Kenett

Association rule (AR) mining is one of the major techniques to detect and extract useful information from large databases with unstructured semantic data. Measures of interestingness are appropriate indices for measuring the strength of an AR. Because any AR can be expressed by a contingency table, compositional techniques are an appropriate approach to define these measures. Compositions are vectors whose elements, called parts, provide relative information about a whole. There is a general agreement among researchers that the geometry of the simplex is based on log-ratio coordinates. We introduce log-ratio measures and analyse its major properties. A contrast to confirm the significance of an AR and the interpretation of the effects between the itemsets are given. The relation between these measures and other common measures facilitates the interpretation of negative and positive effects between itemsets. An example illustrates the performance of these measures of interestingness.

Palabras clave: compositional data, multivariate analysis, log-ratio, simplex

Programado

M08.2 Grupo de Análisis Multivariante y Clasificación IV
6 de septiembre de 2016  15:20
0.09 - Aula de proyectos 2


Otros trabajos en la misma sesión

Un enfoque paramétrico para el tratamiento de ceros de conteo en conjuntos de datos composicionales

M. Comas-Cufí, J. Martín-Fernández, G. Mateu-Figueras, J. Palarea-Albaladejo

Environmental application of a compositional CUSUM control chart

M. Vives-Mestres, P. Daunis-i-Estadella, J. A. Martín-Fernández


Últimas noticias

  • 22/06/16
    Programa SEIO 2016 y X Jornadas de Estadística Pública

    El Programa del XXXVI Congreso Nacional de la SEIO y las X Jornadas de Estadística Pública ya está disponible en la página web.

    Puede acceder desde aquí.

  • 16/06/16
    Fecha límite para hacer la inscripción con la tarifa reducida.
  • 25/05/16
    Alojamiento en Residencias Universitarias

    La Universidad de Castilla-La Mancha ofrece a los asistentes al XXXVI Congreso Nacional de Estadística e Investigación Operativa y de las X Jornadas de Estadística Pública la posibilidad de alojamiento en el Colegio Mayor Gregorio Marañon, situado en el centro histórico de Toledo.

    Para ver más información pulse aquí.

Organizan

Política de cookies

Usamos cookies solamente para poder idenfiticarte y autenticarte dentro del sitio web. Son necesarias para el correcto funcionamiento del mismo y por tanto no pueden ser desactivadas. Si continúas navegando estás dando tu consentimiento para su aceptación, así como la de nuestra Política de Privacidad.

Adicionalmente, utilizamos Google Analytics para analizar el tráfico del sitio web. Ellos almacenan cookies también, y puedes aceptarlas o rechazarlas en los botones de más abajo.

Aquí puedes ver más detalles de nuestra Política de Cookies y nuestra Política de Privacidad.