El cálculo del tamaño de la muestra no es una simple operación aritmética, sino una función matemática que expresa la relación entre diversas condicionantes estadísticas y logísticas.
Para determinar el tamaño ideal, el investigador debe definir los siguientes factores estadísticos principales:
- Nivel de confianza (Z): Es el grado de certeza o seguridad de que los resultados obtenidos en la muestra representan fielmente a la población total. Cuanta más confianza se desee, mayor será el número de sujetos necesarios. El estándar más utilizado por los investigadores es un nivel de confianza del 95%.
- Margen de error o precisión (c o d): Es el porcentaje máximo de error o imprecisión que se está dispuesto a aceptar en los resultados. Cuanto menor sea el margen de error aceptado (por ejemplo, exigir un error del 1% en lugar del 5%), se requerirá un tamaño de muestra mucho mayor.
- Variabilidad o proporción esperada (p y q): Se refiere a la dispersión esperada de los datos o a la probabilidad de que el fenómeno ocurra. Si no existen estudios previos y se desconoce este dato, se asume un criterio conservador de máxima variabilidad (p=0.5 y q=0.5, o 50%), lo cual garantiza que la muestra calculada sea lo suficientemente grande y segura.
- Tamaño de la población (N): Es necesario conocerlo cuando se investiga una población finita (conocida). Sin embargo, si la población es infinita o muy grande (generalmente por encima de 100,000 individuos), la probabilidad matemática demuestra que el tamaño de la población deja de influir de manera significativa en el cálculo y la muestra se estabiliza (usualmente alrededor de 385 sujetos para un 95% de confianza y 5% de error).
Una vez definidos estos valores, se aplican fórmulas estadísticas específicas dependiendo del tipo de población. Por ejemplo:
Para una población infinita, la fórmula es:
Para una población finita, la fórmula es:
Nomenclatura de las variables:
: Tamaño de la muestra.
: Tamaño de la población.
: Nivel de confianza.
: Probabilidad a favor (proporción esperada).
: Probabilidad en contra (
).
: Margen de error (precisión).
Además de la teoría matemática, el tamaño ideal debe contemplar factores prácticos y logísticos:
Pérdidas esperadas: Es muy recomendable adicionar entre un 10% y un 20% al cálculo inicial de participantes para compensar pérdidas, abandonos o encuestas inválidas durante el proceso.
Viabilidad: El tamaño ideal de la muestra suele encontrarse en un punto de equilibrio entre el poder estadístico y la practicidad, considerando el tiempo, el presupuesto y los recursos humanos disponibles para contactar a los participantes.
Hoy en día, para evitar cálculos manuales complejos y prevenir errores, es aconsejable apoyarse en calculadoras de tamaño de muestra o software estadístico especializado, en los cuales el investigador solo debe ingresar el nivel de confianza, el margen de error y el tamaño de la población para obtener la cifra exacta al instante.
Las diferencias fundamentales entre el muestreo probabilístico y el no probabilístico radican en la forma en que se seleccionan los participantes, la capacidad de generalizar los resultados y los recursos necesarios. A continuación se detallan las principales diferencias:
1. Método de selección y probabilidad
Muestreo probabilístico: La selección se realiza de manera completamente aleatoria. En este método, todos los miembros de una población tienen una probabilidad igual, conocida y distinta de cero de ser seleccionados.
Muestreo no probabilístico: La selección no depende del azar, sino del juicio subjetivo del investigador, la conveniencia o la accesibilidad de los participantes. En consecuencia, no todos los miembros de la población tienen la oportunidad de ser incluidos en el estudio.
2. Representatividad y generalización de resultados
Muestreo probabilístico: Es el estándar para los estudios cuantitativos. Al ser altamente representativo, permite calcular el error muestral y realizar inferencias estadísticas válidas y generalizables para toda la población.
Muestreo no probabilístico: Es ideal para investigaciones cualitativas, estudios exploratorios o pruebas piloto. Dado que la muestra no es estrictamente representativa, sus resultados no se pueden generalizar estadísticamente al resto de la población.
3. Riesgo de sesgo
Muestreo probabilístico: Al depender de métodos aleatorios (como generadores de números), minimiza el sesgo de selección del investigador, garantizando resultados más imparciales.
Muestreo no probabilístico: Presenta un mayor riesgo de sesgo e introduce un alto grado de ambigüedad, ya que la muestra puede estar fuertemente influenciada por las nociones del investigador o por encuestados que distorsionen los datos.
4. Recursos, coste y viabilidad
Muestreo probabilístico: Suele ser más difícil, costoso y requiere más tiempo para llevarse a cabo. Generalmente, exige contar de antemano con un listado completo (marco muestral) de toda la población, lo cual es inmanejable en muchos escenarios.
Muestreo no probabilístico: Destaca por ser práctico, rápido y rentable. Es la técnica elegida cuando el investigador tiene limitaciones de tiempo o presupuesto, o cuando intenta acceder a poblaciones difíciles de localizar sin un marco muestral disponible.
5. Tipos de técnicas asociadas
Dentro del probabilístico se encuentran métodos como el aleatorio simple, aleatorio estratificado, sistemático y por conglomerados.
Dentro del no probabilístico se utilizan los muestreos por conveniencia, intencional (o por juicio), de bola de nieve y por cuotas.