Estadistica

Clasificado en Matemáticas

Escrito el en español con un tamaño de 10,42 KB

intervalo marca clase (Xi)media (X)Momentum  en = elevado a la n y n numero momento Pearson
 linf lsup

 

linf-lsup/2

 

 (xi-X)en

(xi-X)enfi

 b2=

momento4 /

(Formula²)²(siendo ó2 la varianza poblacional)

 

5.7. Coeficiente de Apuntamiento de Pearson (B2) y Tablas El coeficiente de apuntamiento de Pearson se basa en el cuarto momento respecto a la media. S

Por ejemplo, para muestras de tamaño 40, la tabla se interpreta así: Si S2 <-0,587 la distribución tiene asimetría negativa Si -0.587< S2 <0,587 la distribución es simétrica Si S2> 0,587 la distribución tiene asimetría positiva Volviendo al

Si B2 > 3 La distribución es MÁS apuntada que la normal (Leptocúrtica) Si B2 = 3 La distribución es IGUALMENTE apuntada que la normal (Mesocúrtica) Si B2 < 3 La distribución es MENOS apuntada que la normal (Platicúrtica)

Para el ejemplo de las estaturas de la muestra de los 40 alumnos, empleando los valores de referencia para n=50, dado que B2 =2,84 (es mayor que 2,15 y menor que 3,99) se concluye que la distribución es igualmente apuntada que la normal (con un riesgo de equivocarse del 10%).

5.5. ESTANDARIZACIÓN DE VARIABLES (Aplicación de Media Arit. y Desv. Estándar)

  

a) Los resultados medios de las notas en las asignaturas señalan que el mejor rendimiento lo obtuvo, el grupo, en Estadística con una nota media de 5,6 puntos. El rendimiento más bajo se aprecia en Computación, donde el grupo obtuvo una nota media de 3,1 puntos. Por lo tanto, Computación es la asignatura que resultó más difícil al curso, siendo Estadística la que resultó más fácil. b) Considerando las notas, se aprecia que Pedro tiene un rendimiento parejo (4,5) en las tres asignaturas, mientras María tiene un rendimiento más variable. Sin embargo, el promedio de las notas es igual para ambos (4,5). c) Considerando los puntajes estandarizados de Pedro se aprecia que tiene un desempeño relativo al curso que es variable. Así, su mejor desempeño lo logró en Computación (Z=1,17) pues su puntaje bruto (4,5) es bastante más alto que el puntaje medio del grupo en esa asignatura (3,1). Su rendimiento relativo más deficiente lo obtuvo en Estadística con (Z =-1,22), pues el puntaje bruto de Pedro (4,5) en esa asignatura es muy inferior al puntaje medio del curso (5,6). d) Se aprecia que María también tiene un desempeño relativo al curso que es variable. Así, su mejor desempeño lo logró en Computación (Z=0,50) y el más deficiente ocurrió en Psicología (Z=-0,15). e) Para resumir los rendimientos relativos de Pedro y María, se pueden calcular los promedios de sus puntajes estandarizados. Se aprecia que María tiene un mejor rendimiento medio (Z2 =0,19) que el logrado por Pedro (Z1 =0,06) a pesar que sus puntajes brutos medios son iguales (4,5).

 

5.7. PUNTAJES ESTANDARIZADOS Y PERCENTILES (Distribucion Normal Estandar) Los puntajes estandarizados pueden asociarse con percentiles. Si la variable que se ha estandarizado queda bien representada por una distribucion Normal (si es asi, se dice que la variable gse distribuye como una Normalh) entonces, pueden emplearse los valores tabulados de las probabilidades acumuladas para la distribucion Normal Estandarizada (que se pueden asociar a las frecuencias absolutas acumuladas). La tabla de la Distribucion Normal (con el titulo de Tabla de la Funcion de Distribucion de la Normal Estandarizada) presenta las probabilidades acumuladas desde Z=-3,90 hasta Z=3,90 en dos paginas. La primera contiene los valores desde Z=-390 hasta Z=0 y la segunda, desde Z=0 hasta Z=3,90. Estadistica 1 . Prof. Alberto Caro M. . v.08 . Pag. 79 En cada tabla se aprecian filas y columnas. En la primera columna (indicada con Z) se presentan los valores de Z con un decimal. En las restantes columnas, senaladas con 0, 1, 2,c, 9 e identifican al segundo decimal de los valores de Z. En el cuerpo de la tabla se presentan los valores de las probabilidades acumuladas asociadas con valores especificos de Z. Por ejemplo, para determinar la probabilidad acumulada hasta Z=1,62 (lo que denota como „U(1,62)) se ubica en la primera columna (Z) la fila correspondiente a g1,6h. En esa fila, avanzar hasta ubicar columna marcada g2h. En la interseccion de fila g1,6h y columna g2h se lee el valor 0,9474 que es la probabilidad acumulada hasta Z=1,62. Luego, „U(1,62)=0,9474

 

6.4. PROPIEDADES DEL COEF. DE PEARSON Las propiedades mas notables del Coeficiente de Correlacion de Pearson son: 1. El valor del coeficientes fluctua entre: -1 . r . 1 2. El valor r>0 significa que las variables estan asociadas directamente (en forma lineal). r=0 significa que las variables no estan asociadas linealmente. r<0 significa que las variables estan asociadas inversamente (en forma lineal). 3. r = } 1 cuando todos los puntos muestrales caen en la recta de prediccion. 4. Mientras mayor es el valor absoluto de r, mas fuerte es el grado de asociacion lineal de las variables. 5. El valor de r no depende de las unidades en que se miden las variables. 6. r es una medida simetrica. Esto es, no importa que se desee la relacion de X con Y o de Y con X puesto que el valor de r sera el mismo. 7. El coeficiente de correlacion es apropiado solo cuando el modelo de relacion lineal entre las variables es apropiado (pues r es proporcional a la pendiente de la ecuacion de regresion que mide la fuerza de la asociacion lineal entre X e Y). Si hay una relacion curvilinea entre las variables, r puede fallar en detectarla. En tal caso, un valor bajo de r no implica que las variables no esten asociadas, solo que la asociacion no es lineal. 8. Cabe hacer notar, que cualquier coeficiente de correlacion puede ser calculado numericamente ante cualquier par de observaciones del tipo (Xi; Yi); no obstante carece de sentido en todos aquellos casos que se prefije de antemano una de las variables - usualmente X - para observar el resultado de la otra variable Y.

 

6.7. SIGNIFICACIÓN DEL COEFICIENTE DE CORRELACIÓN La interpretación del significado del valor del Coeficiente de Correlación "r" es simple cuando tiene los valores 1, -1 o cero. Sin embargo, en otros casos esto no es tan simple. Por ello, para lograr alguna interpretación del valor de "r" se recurre a la Inferencia. Si se considera una población de N datos bivariantes, esto es (Xi;Yi) (i=1,2,..,N), el Coeficiente de Correlación lineal de Pearson se designa con la letra griega ? (ro). Si las variables que conforman la población de pares ordenados son independientes, esto es, no existe alguna relación entre las mismas su Coeficiente de Correlación vale 0 (o sea, ?=0). Sin embargo, si se seleccionan muestras de n datos de esa población, los Coeficientes de Correlación muestrales (r) no necesariamente tendrán el valor 0, si no que pueden tomar otros valores (cercanos o alejados de 0). El problema se plantea, entonces, del modo siguiente. ¿Si se tiene un Coeficiente de Correlación "r" calculado a partir de una muestra de datos bivariantes, puede provenir de una población en que las variables son independientes y, por lo tanto, su Coeficiente de Correlación poblacional ?=0?. Si la respuesta es positiva ello significará que las variables no tienen relación (lineal). Si la respuesta es negativa, ello indicará que existe algún grado de relación (lineal9 entre las variables. En Inferencia se estudian técnica que pueden responder adecuadamente al problema. Sin embargo, también se puede obtener una conclusión al usar la Tabla para la "Valores Críticos del Coeficiente de Correlación de Pearson" (al final de la sección). Dicha tabla entrega, para un valor de "g.l." grados de libertad el valor absoluto máximo del Coeficiente de Correlación muestral "r" que podría observarse siendo el Coeficiente de Correlación poblacional igual a cero (?=0). El valor de g.l. es igual al tamaño de la muestra menos 2, esto es, g.l.=n-2. El riesgo de tomar una decisión incorrecta corresponde al "Nivel de Significación" y se presentan cuatro niveles de riesgo, 0,10 ( o 10%); 0,05 (o 5%); 0,02 (2%) y 0,01 (1%). Por ejemplo, anteriormente se calculó la correlación entre peso y talla para 5 personas obteniéndose r=0,9254. La hipótesis planteada es ¿Existe realmente correlación entre Peso y Talla para la población de la cual se obtuvo la muestra anterior?, o ¿Están asociadas linealmente las variables peso y talla en la población en estudio?. Buscando en la tabla, como n=5 se emplea el valor de g.l=5-2=3. En esa fila y bajo la columna 0,05 (nivel de significación del 5%) se lee 0,878.

La interpretación de lo anterior es (para g.l.=3), siendo r el valor observado de la correlación: Si -0,8780,878 se concluye que ?>0, esto es, existe asociación directa entre las variables. Como en el ejemplo se obtuvo r=0,9254, que es mayor a 0,878, por lo tanto se rechaza la hipótesis que ?=0, concluyéndose que ?>0, esto es, que existe una relación lineal directa entre las variables peso y talla (suponiendo un riesgo del 5% que la conclusión anterior es incorrecta). La tabla presenta los valores de g.l. entre 1 y 30. Después cada 5, cada 10 etc. hasta 250. Si el valor de g.l para un ejemplo particular no se encuentra, se tomará el más próximo.

Entradas relacionadas: