Probabilidad. Intervalos de confianza.

En un estudio de mercado sobre el porcentaje de disco duro ocupado por los juegos, entre los usuarios de ordenadores personales, se obtuvieron los siguientes resultados:

34 45 47 49 31 30 24 33 35 40 45 47 50 42 40 51 46 59 42 46

Suponiendo normalidad en los datos:

a) Encuentra un intervalo de con anza para la media del porcentaje que ocupan los juegos en el disco duro del ordenador.

b) ¿Qué tamaño muestral se necesitará para que el error de estimación del intervalo anterior sea de 1 %?

Necesito una explicación del desarrollo, así como la solución.

Respuesta
1

Tendremos que usar la fórmula del intervalo de confianza para la media dada una muestra de menos de 30 elementos y desconociendo la desviación estándar. La teoría dice que es:

$$\begin{align}&I=\left(\overline {x}-\frac{s_{n-1}}{\sqrt n}t_{\alpha/2}\;, \;  \overline {x}+\frac{s_{n-1}}{\sqrt n}t_{\alpha/2}\right)\\ &\\ &\text{n es el tamaño de la muestra}\\ &\overline x \text{ es la media muestral}\\ &s_{n-1} \text{ es la cuasi desviación típica muestral}\\ &\alpha \text{ es el error permitido, usualmente 0.1, 0.05 o 0.01}\\ &t_{\alpha/2} \text{ es el valor que hace que la t de Student con n-1}\\ &\text{ grados de libertad para ese valor tenga una probabilidad de  }\\ &\text{ }\alpha/2\text{ por la derecha}\\ &\end{align}$$

No les habría costado nada darnos la media muestral y la cuasi desviación típica muestral

n=20

x barra = (34+45+47+49+31+30+24+33+35+40+45+47+50+42+40+51+46+59+42+46)/20 = 876/20 = 41.8

El cálculo de la varianza o la cuasi varianza por la definición es muy largo y facilita equivocarse, se hace con

V(Y) = E(Y²) - [E(Y)]² = (Suma cuadrados)/n - (x barra)²

Suma cuadrados = 34² + 45² + ....+46² = 36318

V(Y) = (36318 / 20) - 41.8² = 1815.9 - 1747.24 = 68.66

Y una vez calculada la varianza la cuasi varianza se calcula multiplicando por n y dividiendo entre (n-1)

S²(n-1) = 68.66 · 20 / 19 = 72.27368421

Y la cuasi desviación típica muestral es la raíz cuadrada de la cuasi varianza

Sn-1 = 8.501393075

Vamos a calcular el intervalo de confianza para el 95%, debían habernos dicho si querían el 90%, 95% o 99% que son los usuales

El error permitido es 0.05

Ahora buscaremos el valor t de Student. Aquí hay que tener mucho cuidado con el manejo de las tablas o fórmulas. Yo lo he hallado en una tabla del libro haciendo que por la derecha quede 0.025 mientras que en la fórmula de la hoja de cálculo tuve que poner DISTR.T.INV(0,05;19) para que me diera lo mismo, un lío.

El valor es 2.09302

Y con esto ya tenemos todos los datos para calcular el intervalo

$$\frac{S_{n-1}}{\sqrt{20}}·t_{0.025=}\frac{8.501393075}{\sqrt{20}}· 2.09302=3.978766726$$

Y el intervalo de confianza al 95% es

I = (41.8 - 3.978766726, 41.8 + 3.978766726) =

(37.82123327, 45.77876673)

Y eso es todo de momento, me extendí demasiado y no puedo terminar la segunda parte ahora. Mando lo hecho para poder apagar el ordenador sin que se pierda, porque de nada sirve guardar el texto en un fichero, luego tienes que hacer mil arreglos cuando lo pegas para que quede bien. Esta página tiene un horrible sistema de pegado para textos grandes y si se ha usado el editor de fórmulas ni te cuento.

Espera que lo termine.

Mientras tanto voy asimilando la primera parte, toma el tiempo que necesites... ; )

He tardado porque no recuerdo haber hecho ningún problema de este tipo y lo que he encontrado en internet no era del todo contundente, pero voy a intentar resolverlo.

Se supone que el 1% de error será por arriba o por abajo, lo que sumamos o restamos a la media para calcular el intervalo de confianza es el termino del error.

Hagámoslo un 1% de la media, entonces deberá ser

e <= 41.8 / 100 = 0.418

Que como podemos ver es una cantidad mucho más pequeña que el 3.9787... que es lo que sumábamos y restábamos par obtener el intervalo de confianza. Eso quiere decir que se precisarán más de 20 muestras y muchas más.

Las tablas de la t de Student llegan hasta los 29 grados de libertad, porque para muestras mayores de 30 se usa la distribución normal.

Entonces el término de error que usaremos no será el de la t de Student sino el de una distribución normal. Y la estimación que daremos para la desviación estándar seguirá siendo la cuasi desviación que calculamos para las 20 mediciones. No disponemos de más mediciones para así usar una acorde al n que debemos calcular. La cuasi desviación es más precisa cuantas más medíciones pero no crece o disminuye en función del número de mediciones.

El valor para la distribución normal que deja por encima una probabilidad de 0.025 es 1.96

$$\begin{align}&\frac{S_{n-1}}{\sqrt n}·z_{0.025} \le \epsilon\\ &\\ &\\ &\frac{8.501393075}{\sqrt n} 1.96 \le 0.418\\ &\\ &\frac{8.501393075\times 1.96}{0.418} \le \sqrt n\\ &\\ &39.863 \le \sqrt n\\ &\\ &1589.958 \le n\end{align}$$

Luego se necesita una muestra de tamaño n=1590 para garantizar que el error de estimación del intervalo sea menor que el 1% (todo ello con un nivel de confianza del 95% que es el qu hemos tomado).

Es lógico por la gran varianza que presenta la muestra.

Y eso es todo.

Añade tu respuesta

Haz clic para o

Más respuestas relacionadas