Ejercicio estadística con teorema de Chebyshev

Vi tu perfil en inicio y aprovechando que estás disponible quisiera hacerte una pregunta sobre probabilidad y estadística :S un ejercicio que capaz sea sencillo pero no me ha salido.. Acá va:
Suponga que lanza 500 veces un dado balanceado de 10 lados (0, 1, 2, ..., 9). Con el teorema de Chebyshev, calcule la probabilidad de que la media de la muestra, POR, esté entre 4 y 5.
Te agradecería mucho si me lo respondes, y además te mando la solución del ejercicio (en inglés), lo que no entiendo es por qué la media es 4.5, qué fórmula utilizó para sacar la desviación y de donde sacó la fórmula para despejar 'k'... Te agradecería mucho una explicación detallada,
n = 500, m = 4.5 and de = 2.8733. Solving m + k(d/?500) = 5 we obtain
k = 5 - 4.5/(2.87333/?500)
= 0.5/0.1284 
= 3.8924. 
So, P(4 <= X <= 5) <= 1 - 1/k^2 = 0.9340.

3 Respuestas

Respuesta
1
La media es 4.5 porque el dado es balanceado (yo prefiero el término "equilibrado") y por tanto las diez caras tienen idéntica probabilidad de salir, 1/10. Así, la media aritmética es 0*(1/10)+1*(1/10)+2*(1/10)+...+9*(1/10) = (1+2+...+9)/10 = 4.5.
Por su parte la desviación típica es la raíz cuadrada de (0-4.5)^2*(1/10)+(1-4.5)^2*(1/10)+...(9-4.5)^2*(1/10) = (1^2+2^2+...+9^2)/10 - 4.5^2
A mí esta raíz me da d=2.872281323 o sea que debe haber algún error de redondeo en la solución en inglés.
Ahora debemos estudiar la variable "media de la muestra de 500 lanzamientos". Por el Teorema Central del Límite esta variable sigue una distribución normal de media 4.5 y desviación típica d/raíz(500) = 0.128452325
El teorema de Chebyshev aplicado a este problema nos dice que Prob(4.5-k*0.128 <= X <= 4.5+k*0.128) >= 1-1/k^2.
Lo que queremos es calcular Prob(4 <= X <= 5). Por tanto, despejamos k a partir de las expresiones anteriores, por ejemplo con 4.5+k*0.128 = 5.
Una vez tengamos k, 1-1/k^2 nos dirá una cota inferior para la probabilidad pedida.
La solución en inglés pone al final "<=" donde debería poner ">=".
Por otro lado, habiendo ya utilizado el Teorema Central del Límite, parece mucho más natural (y preciso) emplear la distribución normal para calcular Prob(4<= X <= 5). Pero bueno, si en el ejercicio piden utilizar el teorema de Chebyshev, pues habrá que utilizarlo.
Respuesta
2
La verdad es que llevo varios dís intentando entender esto de Chebyshev porque aparecen varias preguntas de ello, peor no lo he conseguido. A ver si consigo entenderlo yo también y te digo de que va.
De momento contesto dudas menores que tienes.   La media es 4,5. Si tomas los 10 valores que pueden salir en el dado y lo divides por 10 te dará la media:
media = (0+1+2+3+4+5+6+7+8+9)/10 = 45/10 = 4,5
La desviación standard es la media de la varianza y la varianza es:
La suma de valores-media al cuadrado partido por numero datos, o
suma de valores al cuadrado partido por numero datos - media al cuadrado
Es más sencillo el segundo método:
varianza = (0+1+4+9+16+25+36+49+64+81)/10 - 4,5^2 =
= 285/10 - 20,25 = 28,5 -20,25 = 8,25
Desviación estandar = sqrt(8,25) = 2,8722813
Fíjate que la solución tiene un pequeño error en los decimales de la desviación standard.
La fórmula es esta:

tal como aparece en la wikipedia.
http://es.wikipedia.org/wiki/Desigualdad_de_Chebyshov
Se ve que hace k=(X- media)/(desviacion/sqrt(500))
para hallar valores en la tabla de la distribución normal.
Pero no tengo del todo claro lo que hace.
Si logro entenderlo ya te lo diría.
Muchísimas gracias, me sirvió de mucha ayuda lo de la media y varianza ya que el ejercicio me parecía medio confuso, si logras saber de dónde proviene la fórmula que despeja que te agradecería aún más, si no avisame que finalizo la pregunta y te doy lo mismo el puntaje máximo. Gracias por tu paciencia
Veamos si logro explicarlo. Yo te había dado la media y desviación estándar para la variable aleatoria de tirar un solo dado. Pero las que tenemos que usar son las de una nueva variable, la media muestral, que se define como la media de 500 lanzamientos.
http://e-stadistica.bio.ucm.es/mod_intervalos/intervalos4.html
Esta nueva variable, que llamaremos de nuevo POR porque en este editor no se pueden poner rayitas arriba, tiene como valor esperado la media de la variable de tirar un solo dado. Y como varianza la varianza de un solo dado dividida por n=500. Y por tanto la desviación standard, que es la raíz cuadrada de la varianza, es la desviación estándar de tirar un solo dado dividida por la raíz cuadrada de 500.
Al final del proceso que viene ahora habremos despejado ese valor de que en la fórmula de Chebyshev.
La P(4<= X <= 5) es lo mismo que P(|X - media| < 0,5)
porque siendo 4,5 la media
|X - 4,5| < 0,5 ==> (de manera fácilmente demostrable que) 4 <= X <= 5
Pero vemos que la desigualdad de Chevishev se usa el signo mayor.
P(|X-4,5|> k(desviacion))
Si ponemos P(|X-media|>0,5) estamos calculando la probabilidad complementaria a la que queremos calcular. Simplemente al final se resta de 1 y tenemos la que queremos.
Podemos concatenar las dos desigualdades e arriba para encontrar el valor de que más grande que las cumpla.
0,5 >|X - 4,5| > k(desviacion)
Esta desviación es la original de lanzar un solo dado dividida por sqrt(500). Ayer ya la habíamos calculado y era 2,8722813 que dividivida por sqrt(500) es
desviación = 2,8722813 / 22,36068 = 0,1284523
y en la desigualdad queda
0,5 > k · 0,1284523 ==>
k < 0,5/0,1284523 = 3,8924948
Tomamos para que el mayor valor que puede tomar porque ajustará mejor la probabilidad
k = 3,8924948
Ahora calculmos el 1/(k^2) que es la otra parte de la desigualdad de Chebyshed
1/(3,8924948^2) = 0,0630506
Con todo esto lo que tenemos es:
P(|X-media|>0,5) <= 0,0630506  ahora hallamos la probabilidad del complementario
P(|X-media|<=0,5) > 1 - 0,0630506 = 0,9369493
P(4 <= X <= 5) > 0,9369493
Y eso es lo que qeríamos calcular, la estimación para la media de 500 lanzamientos que nos da la desigualdad de Chevished.
Y eso es todo. Espero que te sirva y lo hallas entendido. Yo también me quedo más tranquilo por haber conseguido entenderlo algo. No olvides puntuar para cerrar la pregunta.
Respuesta
1
Puedes ver las fórmulas en
http://www.ditutor.com/distribucion_binomial/distribuciones_discretas.html
La media es 4.5 puesto que el dado esta balanceado si tiene 10 lados del 0 al 9 por tanto la media es (0+1+2+3+4+5+6+7+8+9)/10=45/10=4,5
La desviación es 
RaizCuadrada(0^2*1/10 + 1^2*1/10 + 2^2*1/10+ .... + 9^2*1/10 - Media^2)
Debe salirte lo que pone 2,8722813
La que la obtienes despejando. ¿Me falta el símbolo? delante de 500
k(d/?500)=5-m 
k = (5 - m)/(d/?500) sustituyes y te debe dar el valor.
Me falta el final que es 1 - probabilidad de salir fuera de 4,5 +- 0,5
Muchas gracias por tu ayuda :) el símbolo ese es una raíz cuadrada, ¿solo me queda saber de dónde viene la fórmula de la que despeja k? ¿Y esa parte de 5-m de la ultima parte.. Qué dato es ese 5?
La fórmula de que la saca del teorema de Chebyshev.
Lo que utiliza es que la media es 4.5 y como quieres la probabilidad entre 4 y 5 puedes utilizar el teorema puesto que tienes 4.5 - 0.5 y 4.5 +0.5
P (µ - ? ? < X < µ + ? ?) ? 1 - 1-?2

Añade tu respuesta

Haz clic para o

Más respuestas relacionadas