Bioestadistica

Clasificado en Matemáticas

Escrito el en español con un tamaño de 10,69 KB

ESTADISTICA son los métodos científicos por medio de los cuales podemos recolectar, organizar, resumir, presentar y analizar datos relativos un conjunto de observaciones y que nos permiten extraer conclusiones válidas y efectuar decisiones lógicas basadas en dichos análisis.
Poblacion: Es cualquier colecció n ya sea de un nú mero finito de mediciones o una colecció n grande, virtualmente infinita, de datos acerca de alguna caracterí stica de interes.
Muestra: Es un subconjunto representativo seleccionado de una població n.
Analisis Univariable: Permite el aná lisis y comprensió n del procesamiento estadí stico de una variable, cuyo OBJETIVO es:“Analizar y sintetizar la informació n contenida en los datos estadí sticos mediante: tablas, grá ficos, resú menes numé ricos”.
Unidad Observable: Es cualquier elemento que podemos extraerle informació n; por ejemplo: una persona, una má quina,…
Variable: Es una caracterí stica o propiedad asociada a una unidad observable de la población.
Cualitativas:(atributos) 2 tipos: Permiten ser tabuladas u ordenadas en tablas que resumen las cualidades o atributos.
Ordinal:
nivel de estudio,rendimiento academico
Nominal: Color de ojos
Cuantitativas: 2 tipos
Discretas : umero grupo familiar ( Se pueden ordenar en clases individuales o en intervalos de clases ) .
Continuas: largo de una mesa ( Se pueden ordenar solo en intervalos de clases. )
Xi: Variable discreta
Nª de obs: frec. de obs
Intervalo de clase: Variable continua
Frec.relativas:(porsetaje de caso o de cada categoria)
fi:frec relativa
N=total de datos
ni:Nª de observaciones de la clase
fi=nªons de la clase/N

Frec relativa % Acumulada
Fi: Ni/N
Ni=frec absoluta Acumulada
N= Total de datos
K:nª de clase
para sakarla Fi%
fi=2n obs clase/28 total datos x 100=Fi%
La variables cualitativas no se deben acumular.
Rango o recorrido = R max-Rmin
N de intervalos
k=1+3.3*log (N)
Amplitud
A=Rx=rango/k=n de intervalos
obs :la amplitud debe ser considerada con la misma cantidad de decimales que tienen los datos
datos=2 decimales A=0.00 2 decimales tambien
limite inferior primer intervalo:
LI=Xmin
Limite superior del ultimo intervalo
UT
0 decimal / 1
1 " /0.1
2 " /0.01
3 " /0.001
Ls(k-s)=LI1+(A*K)-UT(unidad de trabajo)
Ls(k-5)=1.58+(0.05*5)-0.01= 1.82 >/ Xmax
|
Valor de este debe ser mayor al valor max obsevado
Como no alcanzan los datos se aumenta la amplitud
A= 0.05 ~ 0.06
y ahgi kedaria mayor ke la X max
GRÁFICO DE BARRA
Es usado en observaciones cualitativas o cuantitativas discretas.
Sobre cada clase se levanta una barra de altura igual a la frecuencia de la clase.
Eje horizontal: se representan las clases
Eje vertical: las frecuencias absolutas n i

HISTOGRAMA
Se utiliza en variables cuantitativas.
Consiste en un conjunto de rectángulos cada uno de los cuales representa un intervalo de agrupación o clase.
Sus bases son iguales a la amplitud del intervalo y la altura se determina de manera que su área sea proporcional a la frecuencia de cada clase.
Eje horizontal: se representan los intervalos de fronteras “Fi - Fs
Eje vertical: las frecuencias absolutas “ni”
Las frecuencias relativas pueden tambié n presentarse en histogramas o graficas de otro tipo.
POLÍGONO DE FRECUENCIAS
Es un gráfico de línea.
Se construye uniendo con segmentos de recta los puntos medios (marca de clase) de los intervalos adyacentes.
Se utiliza para determinar la forma que sigue la distribución de frecuencias de las observaciones con el propósito de ajustarle alguna función probabilística determinada.

Eje horizontal: se representan las marcas de clases “mi
Eje vertical: las frecuencias absolutas “ni
OJIVA
Es un polígono de frecuencias acumulativas.
Comienza en cero y termina en 100%.
Es un polígono que parte de la frontera inferior del primer intervalo de clase y en cada frontera superior va indicando su frecuencia acumulada.
Eje horizontal: se representan los intervalos de fronteras “Fi - Fs
Eje vertical: las frecuencias absolutas acumuladas “Ni
GRÁFICO CIRCULAR
Permite representar las frecuencias absolutas o frecuencias relativas porcentuales en un círculo.
Se debe determinar la cantidad de grados del círculo correspondiente a cada frecuencia absoluta mediante la proporción

GRÁFICO DE TALLO Y HOJA

Es un procedimiento semi-gráfico para variables cuantitativas.

Los dígitos se separan en dos partes:
TALLO: define a una clase y corresponde a cierto número de dígitos contados de izquierda a derecha.
HOJA: define la frecuencia absoluta de la clase y corresponde al siguiente dígito desechando los restantes, si existen.

La representación de los datos se realiza usando una columna para los tallos, ordenados en forma ascendente y sin repetir y otra para las correspondientes hojas.

Medidas de tendencia central

Moda
Es la categoria o puntuación que ocurre con mayor frecuencia. Se utiliza con cualquier nivel de medición.
Mediana
Es el valor que divide a la distribución por la mitad. Esto es, la mitad de los casos caen por debajo de la mediana y la otra mitad se ubica por encima de la mediana.
La mediana se utiliza en niveles de medición ordinal, intervalo o razón.
Media
Es el promedio aritmético de la distribución.
Es la suma de todos los valores dividida por el número de casos. Se aplica solo a mediciones de intervalo o de razón (clases individuales).
X=3+5+6/3=4,6
MEDIDA DE DISPERSION
Son medidas de dispersión o variabilidad de los datos de una serie de valores.
Representan la semejanza o diferencia que existen entre los individuos de un colectivo en relación con una cierta variable cuantitativa (edad, ingreso, escolaridad, etc).
Las principales son:
Varianza
Desviación estandar
Indice de dispersión
Varianza: Promedio de desviaciones elevadas al cuadrado, de cada uno del os valores de una serie respecto de la media aritmética de ella.

Desviació n está ndar, es la raíz cuadrada de la varianza.
MEDIDAS DE DISPERSIÓN

Cuantifican la dispersión de los datos en torno al centro de los datos.

Las más usuales son:
Recorrido, Rango Intercuartílico, Varianza, Desviación Estándar, Coeficiente de Variación
VARIANZA
Es la de mayor utilidad en aplicaciones estadísticas.
Se define según el ordenamiento o agrupación de los datos y su resultado se obtiene como sigue:
Datos Individuales o no Agrupados.
 
Datos Agrupados en Clases Individuales
 
Datos Agrupados en Intervalos de Clases.
 
DESVIACIÓN ESTÁNDAR.
Se define como la desviación promedio de los datos originales con respecto a su media aritmética.
Se denota por:

Contiene aproximadamente el 68% de las observaciones.
Contiene aproximadamente el 95% de las observaciones

Contiene aproximadamente el 100% de las observaciones

COEFICIENTE DE VARIACIÓN
Entrega el “grado” o “%” de variabilidad de los datos y se utiliza para comparar dos distribuciones en que pueden tener distinta unidad de medida.

REGLA EMPÍRICA:

Si el C.V. 35% el conjunto es
homogéneo
Si el C.V. 35% el conjunto es
heterogéneo.

COEFICIENTE DE SESGO

SESGO:
Grado de asimetría o falta de simetría de una distribución de frecuencias. Se determina por:



REGLAS
Si el coeficiente de sesgo es “+” entonces el sesgo de la distribución es positivo.

Si el coeficiente de sesgo es “-“ entonces el sesgo de la distribución es negativo.

Si el coeficiente de sesgo es cero, entonces la distribución es simétrica.

CUANTILES

Particionan el área bajo el polígono de frecuencias en más de dos partes, siendo los usuales en cuatro, diez y cien partes.

CUARTILES: Divide la distribución de frecuencias en 4 partes.

DECILES: divide la distribución de frecuencias en 10 partes iguales.

PERCENTILES:
divide la distribución de frecuencias en 100 partes iguales.




Entradas relacionadas: