Contenido ▼
Estimación puntual
Un estimador $\hat{\theta}$ es una función de la muestra que aproxima un parámetro desconocido $\theta$.
Propiedades deseables
Insesgadez: $E[\hat{\theta}] = \theta$. El estimador no sobreestima ni subestima en promedio. Consistencia: $\hat{\theta} \to \theta$ cuando $n \to \infty$. Con más datos, el estimador converge al valor real. Eficiencia: Entre todos los estimadores insesgados, el eficiente tiene la menor varianza.Estimadores comunes
| Parámetro | Estimador | Insesgado |
|---|---|---|
| Media $\mu$ | $\bar{X} = \frac{1}{n}\sum X_i$ | Sí |
| Varianza $\sigma^2$ | $S^2 = \frac{1}{n-1}\sum(X_i - \bar{X})^2$ | Sí |
| Proporción $p$ | $\hat{p} = X/n$ | Sí |
La varianza muestral usa $n-1$ (corrección de Bessel) para ser insesgada.
Distribución muestral de $\bar{X}$
Si $X_1, \ldots, X_n$ son i.i.d. con media $\mu$ y varianza $\sigma^2$, entonces:
$$\bar{X} \sim \mathcal{N}\!\left(\mu,\, \frac{\sigma^2}{n}\right) \quad \text{(para } n \text{ grande, por el TCL)}$$
El error estándar de $\bar{X}$ es $\text{SE} = \sigma/\sqrt{n}$.
Intervalos de confianza para la media
Un intervalo de confianza al $(1-\alpha)\times 100\%$ es un rango que contiene al parámetro verdadero con esa probabilidad en muestreos repetidos.
$\sigma$ conocida — distribución Normal
$$\bar{X} \pm z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}$$
donde $z_{\alpha/2}$ es el cuantil de la Normal estándar. Para el 95%: $z_{0.025} = 1.96$.
$\sigma$ desconocida — distribución $t$
$$\bar{X} \pm t_{\alpha/2,\, n-1} \cdot \frac{S}{\sqrt{n}}$$
La distribución $t$ de Student con $n-1$ grados de libertad tiene colas más pesadas que la Normal. Cuando $n \geq 30$ la diferencia es pequeña.
import numpy as np
from scipy import stats
data = [12.1, 11.8, 13.0, 12.5, 11.9, 12.7, 12.3]
n = len(data)
xbar = np.mean(data)
s = np.std(data, ddof=1)
# IC 95% con t de Student
t_crit = stats.t.ppf(0.975, df=n-1)
margin = t_crit * s / np.sqrt(n)
print(f"Media: {xbar:.3f}")
print(f"IC 95%: ({xbar - margin:.3f}, {xbar + margin:.3f})")
Intervalo de confianza para una proporción
$$\hat{p} \pm z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}$$
Válido cuando $n\hat{p} \geq 5$ y $n(1-\hat{p}) \geq 5$.
from statsmodels.stats.proportion import proportion_confint
# 45 éxitos en 120 ensayos
ic = proportion_confint(45, 120, alpha=0.05, method='normal')
print(f"IC 95%: {ic}")
Tamaño de muestra
Para estimar $\mu$ con margen de error $E$ y confianza $(1-\alpha)$:
$$n = \left(\frac{z_{\alpha/2}\,\sigma}{E}\right)^2$$
Para estimar $p$ (sin conocimiento previo, usar $\hat{p} = 0.5$ es conservador):
$$n = \frac{z_{\alpha/2}^2\, \hat{p}(1-\hat{p})}{E^2}$$