Magazines & Newsletters / ASTM Standardization News

feature

Enero/Febrero 2009
Mediciones sucesivas

Tamaño de las muestras

Q: ¿Cuántos artículos debo incluir como muestras de un lote para determinar el valor promedio de una cierta propiedad de dicho lote?

A:La cantidad de artículos que se tomarán como muestras es un compromiso entre la precisión con la que se debe obtener el promedio y el costo del muestreo y las pruebas de todos los artículos en la muestra.

La Práctica E122 de la ASTM, Práctica para calcular el tamaño de una muestra para estimar, con precisión especificada, el promedio para la característica de un lote o proceso, ofrece una fórmula para el tamaño de la muestra basada en la desviación estándar de los valores correspondientes a los artículos en el lote y la precisión requerida del valor promedio:

en la cual es la desviación estándar de la propiedad en el lote y es la precisión requerida del valor promedio. El objetivo es que el error en el promedio debido al muestreo sea ciertamente inferior a .

El principio que subyace a esta fórmula es la distribución del promedio de n cantidad de artículos de una muestra aleatoria de una población (en este caso, los valores propietarios de los artículos en el lote). Si la población tiene una media μ y una desviación estándar , entonces la ley de los grandes números y su extensión, el teorema del límite central, nos dice que cuando se toma una muestra aleatoria de n cantidad de artículos de una población:

  • El valor esperado del promedio es igual a la media μ de la población,
  • La desviación estándar del promedio es igual a , y
  • El patrón de distribución del promedio se asemeja a una curva de Gauss.

La distribución gaussiana, o normal, es la conocida "curva en forma de campana" de probabilidad y estadística. Para una cantidad aleatoria con una distribución gaussiana, los valores estarán dentro de una desviación estándar aproximadamente dos tercios de las veces, dentro de dos desviaciones estándar aproximadamente un 95 por ciento de las veces y dentro de tres desviaciones estándar el 99,7 por ciento de las veces. El último grado de seguridad es aquél al que apunta el factor 3 en la fórmula de tamaño de la muestra.

Lo que tiene una notable falta de influencia en el tamaño de la muestra requerida para una determinada exactitud es el tamaño del lote o población. La precisión del promedio no depende del tamaño de la población a menos que el lote sea tan pequeño que la cantidad a la que se realizará la muestra sea una fracción importante de todos los artículos.

En efecto, las estrategias de muestreo a menudo toman muestras de mayor tamaño en poblaciones mayores. Por ejemplo, la regla de la raíz cuadrada de N más uno es una indicación tradicional. Al tomar muestras de mayor tamaño para lotes más grandes no se contradice la fórmula del tamaño de la muestra. Cuanto más grande es el lote, más importante puede ser lograr una determinación precisa del valor medio. Dicho de otro modo, el valor en la fórmula de tamaño de la muestra se hace más pequeño.

Tampoco tiene mucha influencia en el tamaño de la muestra requerida el patrón de distribución de la propiedad en el lote. La propiedad no debe tener una distribución normal para que la distribución normal se aplique al promedio. Los valores propietarios en cuestión pueden tener un sesgo hacia uno de los lados o ser rectangulares (forma de caja). La distribución del promediodepende estrechamente de la media del lote y de la desviación estándar.

Resulta crítico que la muestra sea una muestra representativa aleatoria, ya que de ello depende la noción de que el promedio de la muestra tenga una distribución estadística. Si, por ejemplo, tomamos una muestra al azar de cinco artículos, esos cinco le darán solo una fotografía de una pequeña parte del lote, y no se aplica ninguna de las teorías de distribución.

La desviación estándar del lote cumple la función clave. Esto resulta inoportuno, ya que puede no saberse al planificar el muestreo. Si se han obtenido muestras de un material similar anteriormente, una buena proyección es tener en cuenta las desviaciones estándar de los muestreos previos. Si es posible realizar la muestra en dos etapas, otra estrategia eficaz es tomar una muestra inicial n1 de artículos, en donde n1 es el tamaño de la muestra requerida basado en una estimación aproximada de la desviación estándar del lote, y que puede ser tan reducida como 5 a 10. Luego, calcular la desviación estándar, s, de esta muestra inicial, y utilizarla con la precisión requerida, , del promedio para determinar el tamaño n=(3s/)2 para la muestra combinada. En el segundo paso de muestreo, tomar la muestra de la cantidad n2 adicional =n -artículos n1 requeridos.

Si tiene más información sobre el lote, por ejemplo sabe que contiene corridas que difieren en su valor promedio o que las unidades del lote tienen diferente tamaño, entonces esta información puede aprovecharse para diseñar un plan de muestreo que sea más exacto que una muestra aleatoria más sencilla. La ASTM E1402-08, Terminología relacionada con el muestreo, describe los tipos de planes de muestreo que utilizan la información adicional.

Muy a menudo, la cantidad de unidades determinadas utilizando la fórmula de tamaño de la muestra será mayor a la de la muestra que pueda obtener y medir. Cuando esto sucede, recuerde que los tamaños de la muestra son siempre un compromiso entre la precisión y el costo. Puede suavizar el requerimiento de la precisión aumentando . En algunas variaciones de la fórmula de tamaño de la muestra también se reemplaza el 3 por un número más pequeño, 2 o una cifra de la tabla de Student. Al hacerlo, se aumenta la posibilidad de exceder el error de muestreo .

También puede ajustarse el tamaño de la muestra para que se adapte a un número conveniente para el muestreo y las pruebas. Por ejemplo, usted puede considerar que necesita 28 artículos de un lote, pero la prueba se realiza mejor en grupos de diez. Entonces, 30 muestras será la cantidad de unidades a las que se hará la muestra.

Peter Fortini de Wyeth Biotech es miembro del Comité E11 sobre Calidad y estadísticas.

Dean Neubauer es el coordinador de la columna y presidente de las publicaciones del E11.90.03.