Lección 15: Tamaño de la muestra

"Se debe hacer todo tan sencillo como sea posible,

 pero no más sencillo."

Albert Einstein

 

Uno de los problemas más difíciles que enfrenta el investigador cuando trabaja con el muestreo probabilístico, es la determinación del tamaño de muestra, ya que el objetivo primordial al determinarlo, es tener información representativa, válida y confiable de la población de estudio al mínimo costo.

Para obtener más exactitud en la información es necesario seleccionar una muestra mayor; sin embargo, el sólo hecho de contar con una muestra grande no garantiza su representatividad.

El tamaño de la muestra estará relacionado con los objetivos de la investigación o estudio y las características de la población, además de los recursos y el tiempo de que se dispone.

Los datos de una investigación, pueden ser analizados bien como Estimación de parámetros o mediante contraste de hipótesis.

Por ejemplo, si el objetivo del estudio es conocer la prevalencia de de diabéticas en un grupo de mujeres embarazadas de un determinado centro de salud, o conocer el porcentaje de fumadores en una empresa de vigilancia,  lo que se desea conocer es una proporción y, en este caso, se habla de «estimación de parámetros».

En Ciencias de la Salud y Ciencias Sociales, los estimadores de uso más frecuente son la proporción muestral (po) para estimar la proporción en la población (p) y la media muestral (Ẋ) para estimar la media poblacional (µ).

Con el uso de estimadores, se busca conocer la proporción poblacional, es decir, la  proporción de diabéticas entre todas las embarazadas, o la proporción de fumadores entre todos los vigilantes,  a partir del estudio de un solo grupo de ellos (una muestra).

Los datos que se obtienen de dicha muestra, llamados «estadísticos», sirven para conocer los datos de la población, llamados «parámetros»; por eso, es necesario determinar el tamaño de muestra necesario, para la estimación de parámetros con un alto grado de precisión.

Por el contrario, cuando el objetivo del estudio planteado es, por ejemplo, conocer la efectividad de la aplicación de dos fungicidas X e Y, sobre la incidencia de Alternaria sp en cítricos, ya no se habla de un «estudio paramétrico», sino que es  necesario escoger un diseño experimental en el que interesa conocer si hay diferencias entre los dos tratamientos (Fungicida X y Fungicida Y) y por lo tanto será necesario plantear un  «contraste de hipótesis».

En ambos casos, estimación de parámetros o contraste de hipótesis, lo que se hace es una «inferencia», es decir, trasladar los datos obtenidos en la muestra a la población de la cual se ha extraído dicha muestra, mediante la aplicación de la estadística inferencial.

En el proceso de recogida de datos, se pueden cometer dos tipos de errores: «error aleatorio» y «error sistemático o sesgo».

Ø  Error aleatorio: El error aleatorio es el derivado de trabajar con muestras y se puede cuantificar, está relacionado con la precisión. A medida que se aumenta el tamaño de la muestra, este error disminuye, hasta el punto de que si se estudia a toda la población el error aleatorio desaparece.

Ø  Error sistemático o sesgo: Está relacionado con la representatividad de la población. Si la muestra estudiada reúne características diferentes a las que se producen en la población, aunque se aumente el tamaño de la muestra, este error se mantiene y se obtendrán valores diferentes en la muestra a los que realmente se dan en la población. Este error está relacionado con la validez  (Fuentelzals G, 2004).

 

15.1 Estimación de Parámetros: Estimación Puntual y Estimación por Intervalos

Estimar un parámetro supone  proponer un valor para el mismo a partir de la  muestra; un estimador del porcentaje poblacional sería el porcentaje de vigilantes fumadores obtenido de la muestra de vigilantes de una determinada empresa de vigilancia y sería por lo tanto, una estimación "Puntual" y por lo tanto es muy probable que no corresponda realmente al  valor del parámetro en la población total de vigilantes.

Para evitar éste tipo de error, resulta mejor la estimación por intervalos; en donde se determina un rango de valores que contendrá el valor del parámetro con una cierta confianza o seguridad, que habitualmente es del 95%.

Al determinar un intervalo de confianza (IC), en éste caso 95%, se podrá estar seguro que el parámetro es representativo de la población y que solo hay un 5% de probabilidad de que no lo sea.

La afirmación hecha mediante un «intervalo de confianza» (IC) es preferible a la hecha por estimación puntual, ya que permite cuantificar la magnitud del error asociado a la estimación.

Al realizar estimaciones,  es necesario tener en cuenta  el «error estándar», que está relacionado con la calidad de la estimación. El error estándar mide la desviación estándar de una muestra poblacional en relación a otra, siendo la "desviación estándar" la distancia que separa a un dato de la media poblacional.

Ejemplo: En el caso de lechones de engorde, se ha estudiado una muestra de 100 lechones  que tienen una media de peso al destete de 6,5 kl y una desviación estándar (DE) de 1,5; si se estudia otra muestra de 100 se puede encontrar una media de 5,4 y una DE de 0,8; en otra muestra se pueden encontrar valores de 4,8 y  1, respectivamente, etc., y así se podrían estudiar muestras diferentes hallando valores similares pero no iguales. En este caso, en la segunda muestra, los datos se encuentran más cercanos a la media poblacional pues se presenta el menor valor de DE.

El error estándar mide la variabilidad entre las diferentes medias de las muestras; es decir, mide la dispersión imaginaria que presentarían las distintas medias obtenidas en las muestras estudiadas. Para estimar el error estándar, se  utilizan fórmulas diferentes según se pretenda calcular el «error estándar de una media» (EEM) o el «error estándar de una proporción» (EEP).

Ø  Error estándar de una media (EEM): Depende de la variabilidad de la propia variable, reflejada en su desviación estándar, y del tamaño de la muestra estudiada. Cuanto mayor sea la variabilidad de la variable (mayor DE), mayor variabilidad tendrá la muestra (EEM más elevado). Cuanto mayor sea el número de individuos estudiados, menor será el EEM  (Fuentelzals G, 2004).

 

Donde n= tamaño de muestra

 

Ø  Error estándar de una proporción (EEP): Cuando la variable es cualitativa, no hay un valor medio que se pueda cuantificar, por tanto, se trata de cuantificar la dispersión de los porcentajes obtenidos en diferentes muestras.

En la fórmula intervienen la proporción de sujetos que presentan la característica (p0) y la proporción de los que no la presentan (1- p0), expresado en tanto por uno, además del tamaño de la muestra estudiada. 1- p0 se sustituye muchas veces por q, ya que 1= p+q, por tanto, q= 1-p.

 

 

 

La amplitud del intervalo de confianza  IC está directamente relacionada con ese error que, en el caso de una media o una proporción, por ejemplo, es la mitad de dicha amplitud. El error está determinado por el tamaño de la muestra, por lo que el tamaño «muestral» mínimo estará en función del error máximo que se considere admisible.

El error de la estimación ha de ser suficientemente pequeño para considerar que la estimación es precisa, lo que determina que el intervalo de confianza sea suficientemente estrecho  (Fuentelzals G, 2004).

El grado de error máximo aceptable en los resultados de la investigación puede ser hasta un 10%; normalmente lo más aconsejable es trabajar con variaciones del 2 al 6%, ya que variaciones superiores al 10% reducen demasiado la validez de la información, sin embargo, la revisión de literatura, las características propias de cada disciplina, los resultados de investigaciones similares, las pruebas piloto, son las que en gran parte definen el grado de error que es aceptable.

Ø  Intervalo de confianza de una proporción: La fórmula para calcular el intervalo de confianza al 95% de una proporción es:

 

 

Si se sustituye el EEP por su valor, visto anteriormente:

 

Donde:

po: es la prevalencia esperada del parámetro que se ha de estimar.

Zα: es el nivel de confianza elegido, determinado por el valor de α .

 

Para una confianza del 95% (α= 0,05), que es la utilizada habitualmente, este valor en la curva normal o Z es de 1,96; aunque se pueden usar otros valores:

 

X = σ :  66% de confianza - cuyo valor correspondiente en la tabla de la curva

normal o Z es de 1.64.

 

X = 2 σ : 95% de confianza- cuyo valor correspondiente en la tabla de la curva

normal o Z es de 1.96.

 

X = 3 σ :  99% de confianza- cuyo valor correspondiente en la tabla de la curva

normal o Z es de 2.58.

 

El más usual es 2 σ, Pero se puede asumir cualquier valor para el nivel de confianza entre el 66 y el 99%, para este efecto se consultan los valores correspondientes en la tabla de Z. Pero como se mencionó antes, los valores más usuales están entre el 90 y 95%.

 

 

Ø  Intervalo de confianza de una media: La fórmula para calcular el intervalo de confianza al 95% de una media es la siguiente:

 

Si se sustituye el EEM por su valor, queda:

 

15.2 Cálculo del tamaño de la muestra para estimar una proporción

El intervalo de confianza para estimar una proporción está determinado por la estimación puntual (po) y por la amplitud o anchura de dicho intervalo, denominada «precisión» (d).

      Donde:

 

Despejando n, se obtiene la fórmula para calcular el número de observaciones o individuos necesarios para estimar una proporción, es decir el tamaño de muestra:

 

Por tanto, es evidente que las dos cosas más importantes que determinan el intervalo de confianza y que se han de tener en cuenta para calcular el tamaño de la muestra son  la anchura del intervalo o precisión (d= 1/2 de la amplitud del IC) y la confianza o seguridad establecida (1-α). Ambas, al igual que el valor de p , han de ser determinadas a priori por el investigador, con base a la información bibliográfica previamente consultada acerca de otros estudios similares o con los resultados de la prueba piloto.

 

Fuentelzals G (2004), ilustra el cálculo del tamaño de muestra con el siguiente ejemplo:

 

¿Cuántas mujeres será necesario estudiar para estimar la prevalencia de dolor lumbar en una población de embarazadas?

 

Con un nivel de confianza del 95% (a= 0,05; Za= 1,96), un error máximo admitido del 8% (la amplitud del IC será 16%) y un valor de prevalencia conocido por la bibliografía del 20%.

 

El nivel de prevalencia equivale a p = 0,2   y q = (1-p) entonces  q= 0,8

 

El tamaño de muestra deberá ser entonces de 96 mujeres.

 

El tamaño de la muestra dependerá de los valores que se introduzcan en la fórmula, de modo que, para una mayor precisión (IC más estrecho), se necesitará un mayor tamaño de la muestra, al igual que si se desea trabajar con un nivel de confianza mayor.

Cuando el tamaño de la población es infinito, es decir no se conoce, se debe asumir que la probabilidad de que el evento ocurra es igual a probabilidad de que no ocurra. En este caso p = 0,5 y q = 0,5.

Si se asume que el nivel de confianza es del 95% y el valor de Z = 1,96 se aproxima a 2, se tiene una formula resumida para hallar n en poblaciones infinitas:

 

15.3 Cálculo del tamaño de la muestra para estimar una media

Siguiendo el mismo razonamiento que para la estimación, se obtiene la fórmula para calcular el tamaño de la muestra necesario para estimar una media:

 

 

Donde la precisión es: 

 

Por tanto, la fórmula resultante para el cálculo del tamaño de muestra será:

 

Ejemplo: ¿Cuántas plantas enteras de cebolla de un cultivo determinado, será necesario muestrear para estimar el contenido  promedio de azufre , en un estudio en donde se pretende evidenciar la relación entre contenido de S en bulbo y días de conservación en pos cosecha?

Estableciendo un nivel de confianza del 95% y una precisión de 5 (la diferencia entre la media de contenido foliar de azufre de la población y la de la muestra, será  5 ppm); faltaría por conocer la DE.

Se supone que se ha obtenido a partir otras investigaciones de nutrición en cebolla  y que es de 20.

 

Por lo que el número de plantas que deben muestrearse será mínimo de 62.

Estas formulas permiten calcular el tamaño de muestra cuando se considera que el muestreo será aleatorio.

 

Sin embargo, otros diseños de experimentos pueden hacer uso de muestreos no aleatorios como los muestreos estratificados. En éste caso, se tiene en cuenta el llamado «efecto de diseño», por el que se ha de multiplicar el valor calculado.

 

En el muestreo aleatorio este valor es 1. Generalmente, este valor está entre 1,5 y 3.  Así, un valor igual a 2, por ejemplo con un muestreo estratificado, significa que para obtener la misma precisión habrá que estudiar al doble de individuos que con muestreo aleatorio. Si se necesitaban 200 individuos en un muestreo aleatorio, se deberán estudiar 400 (200 × 2) en un muestreo estratificado  (Fuentelzals G, 2004).

 

Otro aspecto que debe tenerse en cuenta es el de las pérdidas que se prevén, es decir, los sujetos de los cuales no se tendrá información. Para cuantificarlas se  usa la siguiente fórmula:

 

  

Donde:

nc= tamaño de la muestra, teniendo en cuenta las pérdidas

n= tamaño de la muestra, sin tener en cuenta las pérdidas

pe= porcentaje esperado de pérdidas

 En el caso de las plantas de cebolla, si se estima que podría haber un porcentaje de pérdidas de bulbos durante el cultivo del 10% por enfermedades, entonces:

 

La muestra será de 70 plantas, previendo que un 10% de ellas podrían perderse durante el experimento.

15.4 Cálculo del tamaño de la muestra para Contraste de hipótesis

 

Es el caso de los estudios con un diseño experimental, en los que se hace una intervención en dos grupos, la habitual al «grupo control» y la que se pretende evaluar al «grupo experimental», o sobre una misma población cuando se prueban diferentes tratamientos teniendo como referencia un testigo (población de control).

Lo que desea el investigador es conocer si hay diferencias entre los dos grupos, o entre los tratamientos aplicados a un grupo, para lo que plantea un contraste de hipótesis, con la comparación de medias o proporciones, dependiendo del tipo de variables.

Se plantean así dos tipos de hipótesis: la nula y la alternativa. En la primera se establece que no hay diferencias entre los dos grupos para la variable de interés; en la segunda,  se plantea que si hay diferencias entre los grupos o tratamientos, que es la que se pretende encontrar con el estudio.

Para calcular el tamaño de la muestra en estos casos, hay que tener en cuenta los errores que se pueden cometer, Error a o de tipo I (rechazar la hipótesis nula cuando es cierta) y error b o de tipo II (no rechazar la hipótesis nula cuando es falsa).

El primer caso se refiere a la seguridad del estudio, y, por tanto, al riesgo de cometer un error a. En el segundo caso, se habla de la potencia o poder estadístico (1-b), que es el riesgo de cometer un error b.

Los valores utilizados habitualmente son a= 0,05 (nivel de confianza del 95%) y b= 0,20 (potencia del 80%).

 

También es preciso establecer la magnitud de la diferencia que se pretende encontrar entre los dos grupos, es decir, la diferencia entre las dos proporciones o las dos medias, así como una idea del valor de los parámetros de la variable de estudio (proporción o desviación estándar), que puede obtenerse de la bibliografía o a partir de la prueba piloto.

Se debe indicar si los grupos son «independientes» o «apareados», es decir, si son dos grupos diferentes o es un mismo grupo al que se le han realizado dos mediciones.

Por último, se ha de decidir si la hipótesis será «unilateral» o «bilateral». En el primer caso, se supone que un parámetro será mayor en un grupo que en el otro (o menor, dependiendo de si el efecto de la intervención es reducir el valor de la variable).

En el contraste bilateral, el parámetro puede ser mayor o menor en cualquiera de los dos grupos de estudio  (Fuentelzals G, 2004).

 

Ø  Comparación de proporciones: Para calcular el tamaño de la muestra necesario en cada grupo de estudio, los valores que se han conocer  son:

 

ü  riesgo α deseado (habitualmente 0,05),

ü  riesgo β (habitualmente 0,20),

ü  proporción en el grupo control y

ü  proporción en el grupo experimental y decidir si el contraste es bilateral o unilateral.

La fórmula utilizada es:

 

Donde:

Zα es el valor Z correspondiente al riesgo α fijado;

Zβ es el valor Z correspondiente al riesgo β fijado;

p1 es el valor de la proporción en el grupo control;

p2 es el valor de la proporción en el grupo experimental,

y p es la media aritmética de las dos proporciones, p1 y p2 (p1 + p2/2)

 En particular, para una seguridad de un 95% y un poder estadístico del 80% se tiene que:

 

 

Como ejemplo, supongamos que se desea estudiar la existencia de una asociación entre el consumo de tabaco y el hecho de sufrir un infarto de miocardio.

Para poner en evidencia dicha asociación y cuantificar su magnitud, se diseña un estudio de casos y controles en el que se investigará el consumo de tabaco de una serie de pacientes que han padecido un infarto de miocardio (casos) y una serie de pacientes sanos (controles).

La medida más utilizada para cuantificar la asociación entre la exposición y la presencia de enfermedad es el "odds ratio" (OR) y su cálculo se estima mediante el cociente de las dos cantidades anteriores.

La interpretación del OR es la siguiente: si el OR es igual a 1, la exposición no se asocia con la enfermedad, mientras que si el OR es menor de 1 la exposición tiene un efecto protector (es decir, la exposición disminuye la probabilidad de desarrollar la enfermedad).

Por último, si el valor del OR es mayor de 1, la exposición aumenta las posibilidades de desarrollar la enfermedad. De cualquier modo, las estimaciones del OR se deben realizar con su 95% intervalo de confianza para poder confirmar o rechazar la asociación de la exposición con la enfermedad.

Siguiendo con el ejemplo, se cree que alrededor de un 40% de los controles son fumadores y se considera como diferencia importante entre ambos grupos un OR de 4. Con estos datos, podemos calcular el tamaño de muestra necesario en cada grupo para detectar un OR de 4 como significativamente diferente de 1 con una seguridad del 95% y un poder del 80%. De acuerdo con lo expuesto con anterioridad, conocemos los siguientes parámetros:

a.    Frecuencia de exposición entre los controles (p2): 40%

b.    OR previsto (w): 4

c.    Nivel de seguridad( Zα): 95%

d.    Poder estadístico: 80%

De acuerdo con estos datos, se estima que la frecuencia de exposición (p1) entre los casos vendrá dada por:

 

 

Esto es, se estima que aproximadamente un 73% de los casos son fumadores. Una vez hallado p1, podemos calcular n.

Se requieren 35 individuos de cada grupo para detectar como significativo un OR de 4.

Ø  Comparación de medias: En este caso, los valores que se han conocer son:

a)    riesgo α deseado (habitualmente 0,05),

b)    riesgo β (de manera habitual 0,20),

c)    variancia o DE de la variable

d)    valor mínimo de la diferencia que se ha de detectar. Y decidir también si el contraste es bilateral o unilateral.

 La fórmula que se emplea para calcular el tamaño de la muestra en este caso es:

Zα es el valor Z correspondiente al riesgo α fijado;

Zβ es el valor Z correspondiente al riesgo β fijado;

S es la desviación estándar,

y d es el valor mínimo de la diferencia que se desea detectar.

 

 

Ejemplo: Se desea conocer el tamaño de la muestra necesario para un estudio cuyo objetivo es conocer el efecto de las raciones proteicas suministradas a vacas lecheras, sobre el porcentaje de urea en leche.  

Se planteará un diseño experimental con dos grupos de vacas. A un grupo se le suministrará una dieta balanceada  y al grupo testigo  se le dejará la dieta habitual que hace el propietario del hato.

Interesará conocer si existen diferencias en la media de los niveles de urea en leche obtenidos en los dos tratamientos.

Se asume un riesgo α= 0,05, un riesgo β= 0,20, una DE  de 4,03  y la diferencia mínima de las medias que se considera relevante entre los dos grupos, que es de 2 mg.dl-1de urea en leche. El tipo de contraste planteado es unilateral, y para datos independientes.
 
Es decir que deberán seleccionarse 50 vacas en cada grupo de muestreo.