Continuamos con el desarrollo de este trabajo
Bueno ahora, nos proporcionan los reportes mensuales de los últimos tres años…
2007 2008 2009
151 156 154 152 157 155 153 159 158
152 150 152 157 158 159 158 157 155
152 151 155 156 152 155 159 154 153
152 154 150 159 158 150 156 158 157
Ahora has un estudio descriptivo…pero ahora para datos AGRUPADOS…
Entonces que debemos de hacer… EVALUAR MEDIDAS SESGO
1 Respuesta
Valero ¿podemos continuar con el tema que tan valiosamente me hs estado ayudando a resolver? Saludos cordiales. Oscar
Si Oscar, luego continuo, pero ahora tengo que hacer otras faenas no de aquí que me llevarán alguna hora.
Perdona por la tardanza pero es que esta pregunta no es inmediata para mí. Sobre las medidas de sesgo tengo experiencia casi nula. Entonces si puedes dime cuales utilizáis.
Hay una sencilla que es
$$\begin{align}&As=\frac{\overline x-Moda}{\sigma}\end{align}$$
pero hay otras más precisas como el coeficiente de asimetría de Fisher y el coeficiente de asimetría de Pearson.
Yo el que he utilizado alguna vez es el coeficiente de Fischer
$$\begin{align}&\text{para datos sueltos es:}\\&\\&\gamma_1=\frac{\frac{\sum_{i=1}^nX_i}{n}}{\sigma^3}=\frac{\sum_{i=1}^nX_i}{n·\sigma^3}\\&\\&\text{y para datos agrupados}\\&\\&\gamma_1=\frac{\sum_{i=1}^n n_i·X_i}{\sigma^3·N}\\&\\&\text{donde }N=\sum_{i=1}^n{n_i}\end{align}$$
llevo un pequeño lío con la notación de datos sueltos y agrupados pero espero la estés entendiendo.
Entonces eso, dime que medida utilizáis. Además si me dices el de Fischer intentaré variar la fórmula de calculo para no tener que calcular cubos de restas sino hacerlo con cubos de los datos que si hay que hacerlo a mano se agradece mucho.
El de Fisher me va bien y a mano también me sirve por igual. Gracias en miles experto y quedo atento de tu ayuda
$$\begin{align}& \end{align}$$
Espera que me lie y lo escribí mal. Voy a operar con el de datos sueltos y luego lo transformo para datos agrupados.
$$\begin{align}&\gamma_1=\frac{\sum_{i=1}^{n}(X_i-\overline x)^3}{n\sigma^3}=\\&\\&\frac{1}{\sigma^3}\left(\frac{\sum_{i=1}^nX_i^3}{n}-\frac{3\sum_{i=1}^nX_i^2·\overline x}{n}+\frac{3\sum_{i=1}^n X_i\overline x^2}{n}-n·\frac{\overline x^3}{n}\right)=\\&\\&\frac{1}{\sigma^3}\left(\frac{\sum_{i=1}^nX_i^3}{n}-3\overline x· \frac{\sum_{i=1}^nX_i^2}{n}+3 \overline x^2 ·\frac{\sum_{i=1}^n X_i}{n}-\overline x^3\right)=\end{align}$$
Pero con los sumatorios de los cuadrados y los normales se puede hacer algo. Dejo ya de poner los límites de los sumatorios que gastan muchos recursos del ordenador
$$\begin{align}&Como \\&\\&\sigma^2=\frac{\sum X_i^2}{n}-\overline x\implies\\&\\&\frac{\sum X_i^2}{n}=\sigma^2+\overline x\\&\\&y \\&\\&\frac{\sum X_i}{n}= \overline x\\&\\&\text{entonces la expresión queda en}\\&\\&\gamma_1=\frac{1}{\sigma^3}\left(\frac{\sum_{i=1}^nX_i^3}{n}-3\overline x·(\sigma^2+\overline x)+3 \overline x^2 ·\overline x-\overline x^3\right)=\\&\\&\frac{1}{\sigma^3}\left(\frac{\sum_{i=1}^nX_i^3}{n}-3\overline x·\sigma^2-3\overline x^3+3 \overline x^3 -\overline x^3\right)=\\&\\&\frac{1}{\sigma^3}\left(\frac{\sum_{i=1}^nX_i^3}{n}-3\overline x·\sigma^2 -\overline x^3\right)\\&\\&\text{Y para datos agrupados será:}\\&\\&\gamma_1=\frac{1}{\sigma^3}\left(\frac{\sum_{i=1}^n n_iX_i^3}{N}-3\overline x·\sigma^2 -\overline x^3\right)\end{align}$$
Bueno, ya tenemos la fórmula en la que se usa la suma de los cubos de los datos y datos calculados antes como la media y la desviación. Ha quedado uno poco complicada, luego si prefieres usa la original, al fin y al cabo si lo haces con Excel no le va a costar mucho más.
Lo que es interesante a mano era haber empezado con una columna donde estuvieran los ni·Xi, la tenía que haber construido cuando pedían la media.
Luego la columna ni·(Xi)^2 se obtiene mujltiplicando esa por Xi, la columna ni·(Xi)^3 multiplicando la segunda por Xi y así sucesivamente. Así se ahorran muchas operaciones a mano.
·
Y no hay forma de obtener dos resultados iguales por eso estoy tardando tanto.
Con un paquete llamado rk-teachig de R me da -0.1205
Con una calculador estadística online me da -0.1239622
Y yo con la fórmula original y la deducida da -0.12572064
¿Luego no sé cuál será? Pero si la fórmula del coeficiente es la que he escrito el resultado es el mío. Pero es que en estadística hay un lio inmenso con las medidas de población (las que se dividen entre n) y las muestrales (las que se dividen entre n-1) hay está probablemente el problema.
Bueno con mis calculos era
$$\begin{align}&\gamma_1=\frac{1}{\sigma^3}\left(\frac{\sum_{i=1}^n n_iX_i^3}{N}-3\overline x·\sigma^2 -\overline x^3\right)=\\&\\&\\&\frac{1}{2,88193608^3}\left(\frac{133766292}{36}-3·154,83333333·2,88193608^2-154,83333333^3 \right)=\\&\\&-0,1257115739\end{align}$$
Con esos mismos datos para Excel es
-0.12572064
Luego o me estoy volviendo loco o Excel no calcula muy bien.
Una tercera variante de esa cuenta hecha con Maxima
-0.12571088287135
No llegaremos nunca a saber la respuesta exacta de mi método, aunque sí bastante aproximada.
Y esta es la tabla hecha por Excel, aunque como te digo no me gusta el resultado que ha dado
Y eso es todo lo que puedo hacer y he trabajado mucho.
Ahora que lo pienso. Hay operaciones muy malas de calcular. Por ejemplo operaciones de 20 cifras donde se simplifican las 19 primeras y todo el resultado depende de la cifra 20, entonces si esa cifra 20 es de las inexactas para la calculadora puede dar un resultado nada parecido a lo que tenía que dar. Entonces puede que las 5 respuestas que he dado se calculen de la misma forma pero en cada sitio hay precisión distinta y se manifiestan las diferencias en decimales de los primeros.
Hay una calculadora muy buena en Windows 7, voy a meterle todos los datos desde el principio para que haga el mejor cálculo posible.
Y el resultado que da es
-0,12572063738396526570702927579346
Luego la mejor aproximación era la de Excel, mejor que la de mi calculadora de mano y Máxima.
Y era una operación de esas porque el paréntesis tenía números muy grandes como
133766292/33 = 4953524
Mientras que el resultado del paréntesis era
-3.0092592
Entonces 6 de los decimales que se habían usado en las cuentas estaban de sobra, los 6 últimos decimales del resultado del parénteisis estaban colocados a cero o a sabe Dios qué cosa al terminar de operarlo, con lo cual se perdía mucha precisión.
Pues hasta mañana, pero con la curtosis con los exponentes elevados a la cuarta puede haber mucho más peligro que con la asimetría.
Olvídate de casi todo lo que he hecho salvo de la fórmula de la definición del coeficiente de Fisher.
Lo que he hecho está bien a nivel teórico pero en la practica va mal porque introduce errores de precisión en las operaciones, cuando hay números grandes los cubos son grandes y chupan cifras innecesarias de la calculadora. Mientras que si se hace con la fórmula original, en la que los cubos son de los valores con la media restada, esos cubos son más pequeños y ocupan menos cifras enteras dando lugar a más cifras decimales y se obtiene mayor precisión.
Entonces lo que haré será en lugar de la columna con los
ni·(Xi)^3
Pondré la columna con
Ni·(Xi-media)^3
De esta forma se pueden hacer las cuentas con cualquier calculadora normal y salen bien las cuentas.
$$\begin{align}&\gamma_1=\frac{\sum_{i=1}^n n_i·X_i}{\sigma^3·N}=\\&\\&\frac{-108.3333333}{2.88193608^2·36}=-0.125720637\end{align}$$
De esta forma mucho más fácil y mejor.
Para la parte de los gráficos, espera porque ahora tengo que dejar el ordenador una hora o más. Y aparte los gráficos no son lo mío, si no están en Excel no sabré con que hacerlos.
- Compartir respuesta