Escrito el 02 de Junio de 2009 en Español y con un tamaño de 5.074 bytes.
REGLA EMPÍRICA: Si el C.V. 35% el conjunto es homogéneo Si el C.V. 35% el conjunto es heterogéneo.
COEFICIENTE DE SESGO SESGO: Grado de asimetría o falta de simetría de una distribución de frecuencias. Se determina por:
REGLAS Si el coeficiente de sesgo es “+” entonces el sesgo de la distribución es positivo.
Si el coeficiente de sesgo es “-“ entonces el sesgo de la distribución es negativo.
Si el coeficiente de sesgo es cero, entonces la distribución es simétrica.
CUANTILES Particionan el área bajo el polígono de frecuencias en más de dos partes, siendo los usuales en cuatro, diez y cien partes.
CUARTILES: Divide la distribución de frecuencias en 4 partes.
DECILES: divide la distribución de frecuencias en 10 partes iguales. PERCENTILES: divide la distribución de frecuencias en 100 partes iguales.
GRÁFICO CIRCULAR Permite representar las frecuencias absolutas o frecuencias relativas porcentuales en un círculo. Se debe determinar la cantidad de grados del círculo correspondiente a cada frecuencia absoluta mediante la proporción
GRÁFICO DE TALLO Y HOJA
Es un procedimiento semi-gráfico para variables cuantitativas.
Los dígitos se separan en dos partes: TALLO: define a una clase y corresponde a cierto número de dígitos contados de izquierda a derecha. HOJA: define la frecuencia absoluta de la clase y corresponde al siguiente dígito desechando los restantes, si existen.
La representación de los datos se realiza usando una columna para los tallos, ordenados en forma ascendente y sin repetir y otra para las correspondientes hojas. Medidas de tendencia central Moda Es la categoria o puntuación que ocurre con mayor frecuencia. Se utiliza con cualquier nivel de medición. Mediana Es el valor que divide a la distribución por la mitad. Esto es, la mitad de los casos caen por debajo de la mediana y la otra mitad se ubica por encima de la mediana. La mediana se utiliza en niveles de medición ordinal, intervalo o razón. Media Es el promedio aritmético de la distribución. Es la suma de todos los valores dividida por el número de casos. Se aplica solo a mediciones de intervalo o de razón (clases individuales). X=3+5+6/3=4,6 MEDIDA DE DISPERSION Son medidas de dispersión o variabilidad de los datos de una serie de valores. Representan la semejanza o diferencia que existen entre los individuos de un colectivo en relación con una cierta variable cuantitativa (edad, ingreso, escolaridad, etc). Las principales son: Varianza Desviación estandar Indice de dispersión Varianza: Promedio de desviaciones elevadas al cuadrado, de cada uno del os valores de una serie respecto de la media aritmética de ella.
Desviació n está ndar, es la raíz cuadrada de la varianza. MEDIDAS DE DISPERSIÓN Cuantifican la dispersión de los datos en torno al centro de los datos.
Las más usuales son: Recorrido, Rango Intercuartílico, Varianza, Desviación Estándar, Coeficiente de Variación VARIANZA Es la de mayor utilidad en aplicaciones estadísticas. Se define según el ordenamiento o agrupación de los datos y su resultado se obtiene como sigue: Datos Individuales o no Agrupados.
Datos Agrupados en Clases Individuales
Datos Agrupados en Intervalos de Clases.
DESVIACIÓN ESTÁNDAR. Se define como la desviación promedio de los datos originales con respecto a su media aritmética. Se denota por:
Contiene aproximadamente el 68% de las observaciones. Contiene aproximadamente el 95% de las observaciones
Contiene aproximadamente el 100% de las observaciones
COEFICIENTE DE VARIACIÓN Entrega el “grado” o “%” de variabilidad de los datos y se utiliza para comparar dos distribuciones en que pueden tener distinta unidad de medida.