Standardization News Search

Magazines & Newsletters / ASTM Standardization News

feature

noviembre/diciembre 2012
Mediciones sucesivas

El concepto del error estándar

Medición de un error aleatorio en un dato estadístico informado

: ¿Qué es el error estándar y cómo se lo utiliza en la práctica? 

R: Uno de los conceptos más útiles en la práctica estadística es justamente el de "error estándar". Este término fue definido originalmente por el estadístico británico Udny Yule a comienzos del siglo XX. La norma E2586 de ASTM, Práctica para calcular y usar estadísticas básicas, define el error estándar como "la desviación estándar de la población de valores de una estadística muestral en un muestreo repetido o su estimación". El término incertidumbre está estrechamente relacionado con el error estándar y en las últimas décadas se la he dedicado bastante atención. El error estándar mide el error aleatorio en un dato estadístico informado: el tipo de error causado por la variación aleatoria del muestreo al repetir una prueba en las mismas condiciones. La incertidumbre es un concepto más amplio que incluye componentes adicionales de error potencial además del error aleatorio. La norma E2655 de ASTM, Guía para informar la incertidumbre de los resultados de pruebas y Uso del término incertidumbre de la medición en métodos de prueba de ASTM, describe el uso del concepto de incertidumbre tal como se lo aplica al resultado de una prueba.  

En general,  las personas que toman las decisiones y los usuarios que utilizan los datos suelen estar más preocupados por los datos estadísticos que por las mediciones individuales en un grupo de datos. Los usuarios de datos desean ver promedios, varianzas, rangos, proporciones, valores máximos o mínimos, percentilos u otras estadísticas. Lo que a menudo no logran apreciar totalmente es que las estadísticas también se comportan de una manera aleatoria, similar a la de las mediciones individuales, y esto se mide con el error estándar. Cuando se informa la media de una muestra, no se informa el promedio "verdadero" sino una estimación. La estadística muestral puede resultar levemente superior o inferior al valor verdadero desconocido. El error estándar de la media mide la diferencia que puede existir entre la media verdadera y la estadística que se informa. En términos más generales, podemos hablar del "error estándar de la estimación" cada vez que se informa una cantidad estadística estimada. Cuando se calcula un dato estadístico único, es posible calcular el error estándar de la estimación. En general, cuanto mayor sea el tamaño de la muestra, menor será el error estándar de una cantidad estimada.  

Para ver cómo funciona esto, analicemos una media muestral. A partir de una muestra de tamaño n, se calculan la media muestral y la desviación estándar. En realidad hay una media verdadera, μ, y una desviación estándar verdadera σ, y son desconocidas. La muestra nos brinda las estimaciones y S. Si hiciéramos muestras repetidamente de la población/proceso del cual se toma la muestra y calculáramos la media muestral una y otra vez, la desviación estándar de la distribución de medias sería el error estándar verdadero de la media. En teoría, esta es la Ecuación 1:

(1)

Debido a que solo tenemos una media estimada, y no conocemos el verdaderos σ, solo podemos estimar el error estándar como:

(2)

El error en un resultado informado se llama error de muestreo, y se mide como desviación absoluta del valor verdadero desconocido. Por lo tanto, para una media, el error muestral puede considerarse como la desviación | - μ| . Alrededor del 68% de las veces el error muestral tendrá como máximo el tamaño de un error estándar, y en el 95% de los casos, el de 2 errores estándar. Esto puede expresarse más concisamente de la siguiente manera:

(3)

(4)

De este modo, el usuario de una estadística obtiene una idea de la magnitud de la diferencia que pudo haberse verificado en la práctica, la manera en que el tamaño de la muestra afecta el posible error de una estimación y con qué probabilidad aproximada (confianza). En este caso, estamos considerando un tamaño de muestra de 20 o más y estamos usando la teoría de la distribución normal. Algunos lectores también reconocerán en esto una cierta similitud con la construcción de un intervalo de confianza para una media desconocida. En la norma E2586 de ASTM se tratan los intervalos de confianza y se ha publicado un artículo de DataPoints sobre este tema.1

Ejemplos

Consideremos que en una muestra de tamaño n = 20 se determinó que la media muestral y la desviación estándar eran 162 y 11,5 respectivamente. El error estándar estimado de la media surge de la Ecuación 2: 11,5/4,47 = 2,57. De este modo, el potencial de error en el resultado informado no es superior a ±2,57 (68% de confianza) o no más de 2(2,57) = ±5,14 (a 95% de confianza). 

Uno de los recursos estadísticos más utilizados es una proporción simple. Hay una muestra de objetos de tamaño n, y se observa cada objeto para identificar la ocurrencia de un atributo. Cada objeto tiene o no tiene el atributo. Esta es la situación, por ejemplo, en los muestreos de control de calidad o en las encuestas de opinión pública. La estadística, indicada , es la proporción en la muestra que tiene ese atributo.  La proporción verdadera y desconocida de todos los objetos es p. El error estándar teórico de la estimación es:

(5)

En la práctica no conocemos nunca el valor verdadero de p, de modo que reemplazamos la estadística y obtenemos una estimación del error estándar. Utilizando la Ecuación 5, el error estándar estimado es:

(6)

Cuando esta técnica se utiliza en una encuesta política o una investigación de mercado, la cantidad 2SE()se menciona como margen de error de la encuesta. Supongamos que en una muestra de n = 200 componentes de metal inspeccionados, se clasificaron 23 como defectuosos. La estimación de la proporción defectuosa del proceso es = 23/200 = 0,115 o 11,5%. 

El error estándar de esta estimación, usando la Ecuación 6, es 0.0226 o 2,26%. En caso de querer reclamar una confianza de aproximadamente 95% en el posible error en el resultado, deberíamos informarlo utilizando dos errores estándar o como 11,5% ±4,52%. De todos modos, debería informarse al menos el error estándar (2,26%) junto con la estimación. 

En la E2586 de ASTM están disponibles las fórmulas de error estándar para varios casos comunes. En la bibliografía sobre ciencias estadísticas pueden consultarse otros casos y métodos. 

Referencias
1. Stephen N. Luko y Dean V. Neubauer, “Statistical Intervals, Part 1: The Confidence Interval,” ASTM Standardization News, Vol. 39, Núm. 4, julio/agosto 2011.

Stephen N. Luko, de Hamilton Sundstrand, Windsor Locks, Connecticut, es el anterior presidente del Comité E11 sobre calidad y estadísticas y es miembro de ASTM International.

Dean V. Neubauer, de Corning Inc., Corning, Nueva York, es miembro de ASTM; se desempeña como vicepresidente del Comité E11 sobre calidad y estadísticas, es presidente del Subcomité E11.30 sobre control estadístico de la calidad y del E11.90.03 sobre publicaciones, y también coordina la columna DataPoints (Mediciones).