marzo/abril 2014
    Mediciones sucesivas

    Los Intervalos de Predicción Estadísticos

    Aplicación de Intervalos a los Datos de Atributos

    P: ¿Cuáles son las consideraciones con respecto a los intervalos de predicción estadística cuando se sabe que la distribución subyacente se basa en los datos de los atributos?

    R. En nuestros dos artículos DataPoints anteriores, discutimos los intervalos estadísticos no paramétricos que no dependen de una distribución estadística subyacente.1.2. Este artículo se refiere a los intervalos de predicción para la siguiente observación cuando tenemos un grupo de datos y nuestros datos pertenecen al tipo atributo. Hay dos casos comunes. El Caso 1 se da cuando el tipo de datos que tenemos está regido por la distribución binomial, y el Caso 2 ocurre cuando los datos están regidos por la distribución de Poisson. Los intervalos presentados son aproximados y se basan en una distribución normal aproximada. Deberían resultar útiles para la mayoría de los casos en que la observación inicial de muestras es como mínimo de cinco eventos para el caso binomial, y de 10-15 o más para el caso Poisson. La teoría completa ha sido resumida previamente por Hahn, Meeker y Nelson (ver Referencias 3 y 4). De igual manera que en procedimientos de estimación de intervalo debatidos con anterioridad, seguimos suponiendo que todas las muestras son una representación aleatoria de una población o de un proceso en un estado de control estadístico. 

    INTERVALOS DE PREDICCIÓN PARA LA DISTRIBUCIÓN BINOMIAL

    Para los datos de tipo atributo, la distribución binomial es una de las más importantes y más ampliamente aplicadas en toda la práctica estadística. Se usa cuando hay una probabilidad de "evento" fija p, un tamaño de muestra n una variable aleatoria r igual a la cantidad de ítems en la muestra que tienen la característica definida para el "evento". La probabilidad p se llama probabilidad de "éxito" pero no es necesario que sea un tipo de evento deseable. En el contexto de intervalo de predicción, el valor de p es desconocido. Para n objetos en una muestra, uno puede observar como mínimo 0 y como máximo n  "éxitos". A menudo, un evento de "éxito" está relacionado con un atributo de calidad como por ejemplo no cumplir con un requisito. Los profesionales también llaman a esto tipo de muestreo pasa/no pasa. 

    El problema puede plantearse de la siguiente manera. Tenemos una muestra inicial de tamaño n  y se han observado r "eventos" entre n inspecciones. En una futura muestra de tamaño m, observaremos cierta cantidad de eventos y. Es recomendable construir un intervalo que contenga y con alguna confianza indicada, por ejemplo C. El intervalo se llama intervalo de predicción para la observación futura y. Supongamos que = r/n es la estimación del promedio de proceso desconocido p, basada en el tamaño inicial de la muestra n. Y m es el tamaño futuro de la muestra, y el coeficiente de confianza es C = 1 - α. La siguiente fórmula se utiliza para construir el intervalo de predicción de dos lados para la cantidad de eventos futuros.

    (1)

    En la Ecuación 1, la cantidad Zα/2 es un cuantil seleccionado de una distribución normal estándar que deja un área de α/2 a la derecha deZα/2. De este modo, si se desea un 95% de confianza, α = 0.05 y Z0.025 = 1.96. La Ecuación 1 surge del hecho que la estimación tendrá una distribución normal en aplicaciones repetidas, siempre que el número de eventos observados en la muestra inicial sea cinco o más. Para obtener más detalles, ver Referencia 3 ó 4.

    EJEMPLO 1

    Una medición de la calidad para una determinada operación en una gran empresa es medir la cantidad de lotes de material rechazados por la operación de inspección de recepción de la empresa. Esta información se mide y se informa a la gerencia mensualmente. El registro reciente indica que el último mes siete de 107 envíos fueron rechazados. El mes próximo, la empresa espera recibir 84 lotes. Suponiendo que la calidad de los lotes entrantes siga siendo la misma, ¿qué cantidad y de lotes rechazados anticipamos que ocurrirá en las inspecciones del mes próximo con un 90% de confianza? En este caso, n = 107, m = 84, = 7/107 = 0.0654, α = 0.1 y Z0.05 = 1.645. Usando la Ecuación 1, el intervalo de predicción resultante para y es:

    5.42 ± 4.95  o alrededor de 0.47 a 10.37.

    Redondeamos este resultado a números enteros como 0≤ y ≤ 11. Así, podemos esperar entre 0 y 11 mientras el proceso siga en control estadístico, y el promedio de proceso desconocido p no cambie.

    INTERVALOS DE PREDICCIÓN PARA LA DISTRIBUCIÓN DE POISSON

    Para la distribución de Poisson, las observaciones se hacen en una región de inspección que puede basarse en tiempo, área, espacio, cantidad de objetos o alguna otra descripción de región. La cantidad de eventos que observamos puede ser cualquier número entero como mínimo 0. El parámetro desconocido en esta distribución es el índice de ocurrencia de eventos λ. Si se observan r eventos en una región inicial de tamaño s, la estimación de este índice es λ = r/s. En una región de inspección futura de tamaño t, observaremos algún número y de eventos. Se desea construir un intervalo de predicción para la variable y.   

    En este método, suponemos que r es como mínimo 10-15 o más. Esto garantiza que la estadística se distribuirá aproximadamente de manera normal. Seguimos utilizando un coeficiente de confianza de C = 1 - α. El intervalo de predicción para y, la cantidad de eventos futuros en la región de tamaño t, se construye según la Ecuación 2 a continuación.

    (2)

    EJEMPLO 2

    Una compañía que está planificando futuros reemplazos de ciertos componentes usados en torres de telefonía celular, desearía usar los datos de los últimos dos años para hacer una predicción para el año próximo. En los últimos 24 meses han sido necesarios 29 reemplazos. Si todo sigue igual, ¿cuántos reemplazos podemos esperar para el año próximo con una confianza del 95%?

    En este caso, los datos actuales provienen de un intervalo de longitud s = 24 meses. La cantidad de eventos observada en este periodo es r = 29. La proporción estimada es por lo tanto λ = 29/24 = 1.208 eventos por mes. El periodo futuro es t = 12 meses y la confianza deseada es C = 95%. El valor de Z es Z0.025 = 1.96. Usando la Ecuación 2, el intervalo de predicción se construye como:

    14.5 ± 4.7  o alrededor de 9.8 a 19.2.

    Redondeamos este resultado a números enteros como 10≤ y ≤ 19. De este modo, podemos esperar aproximadamente entre 10 y 19 reemplazos en los próximos 12 meses en la medida que el proceso siga bajo control estadístico y no cambie el promedio (índice) del proceso. Es importante destacar que al trabajar con índices, s, t y la estimación del índice deben estar expresados en la misma unidad para poder usar la Ecuación 2. En este ejemplo, las unidades eran meses.

    Aquellos lectores interesados en la serie de tres partes de los autores sobre intervalos estadísticos basados en la distribución normal deben consultar las columnas DataPoints sobre intervalos estadísticos en la edición de Standardization News de ASTM, de julio/agosto. 2011, Sept./Oct. 2011 y Nov./Dic. 2011.5-7

    Referencias
    1. Luko, S.N. y Neubauer, D.V., “Statistical Intervals: Nonparametric, Part 1,” ASTM Standardization News, Vol. 41, Núm. 6, Nov./Dic. 2013, pág. 20-21.
    2. Luko, S.N. y Neubauer, D.V., “Statistical Intervals: Nonparametric, Part 2,” ASTM Standardization News, Vol. 42, Núm. 1, enero/febrero 2014, pág. 12-13.
    3. Hahn, G. J., y Meeker, W. Q., Statistical Intervals: A Guide for Practitioners, Wiley Interscience, John Wiley and Sons Inc., New York, N.Y., 1991. 
    4. Hahn, G.J. y Nelson, Wayne, “A Survey of Prediction Intervals and Their Applications,” Journal of Quality Technology, Vol. 5, Núm. 4, octubre 1973. 
    5. Luko, S.N. y Neubauer, D.V., “Statistical Intervals, Part 1,” ASTM Standardization News, Vol. 39, Núm. 4, julio/agosto 2011, pág. 18-20.
    6. Luko, S.N. y Neubauer, D.V., “Statistical Intervals, Part 2,” ASTM Standardization News, Vol. 39, Núm. 5, septiembre/octubre 2011, pág. 14-15.
    7. Luko, S.N. y Neubauer, D.V., “Statistical Intervals, Part 3,” ASTM Standardization News, Vol. 39, Núm. 6, noviembre/diciembre 2011, pág. 18-19.

    Stephen N. Luko, de United Technologies Aerospace Systems, con sede en Windsor Locks, Connecticut, es miembro de ASTM y ex presidente del Comité E11 sobre calidad y estadísticas. En la actualidad, se desempeña como presidente del Subcomité E11.30 sobre control estadístico de la calidad.

    Dean V. Neubauer, de Corning Inc., Corning, Nueva York, es miembro de ASTM; se desempeña como presidente del Comité E11 sobre calidad y estadísticas, es presidente del Subcomité E11.90.03 sobre publicaciones, y también coordina la columna DataPoints (Mediciones).