Conceptes Fonamentals d'Estadística Descriptiva

Clasificado en Matemáticas

Escrito el en catalán con un tamaño de 3,79 KB

Mesures de Tendència Central i Posició

Mediana: Representa el valor de la variable central en un conjunt de dades ordenades.

Mitjana: És la suma de tots els valors dividida pel nombre de valors del conjunt.

Coeficient de Correlació de Pearson

El Coeficient de Correlació de Pearson és una mesura de la relació lineal entre dues variables aleatòries quantitatives. A diferència de la covariància, la correlació és independent de l'escala de mesura de les variables. Si el resultat és positiu (+), la correlació és directa. Quan el coeficient de correlació està molt pròxim a 1, la correlació és molt forta. Es calcula com: Covariància / (desviació típica X * desviació típica Y).

Mesures de Dispersió i Variabilitat

El Rang i la Moda

El Rang és el punt més alt a la gràfica; per això, comparteix unitats amb les dades. Permet obtenir una idea de la dispersió de les dades: com més gran és el rang, més disperses estan les dades (calculat com: nº més alt - nº més baix).

La Moda és el valor amb major freqüència en una distribució de dades. Parlem d'una distribució bimodal de les dades adquirides en una columna quan trobem dues modes, és a dir, dues dades que tinguin la mateixa freqüència absoluta màxima. Una distribució trimodal de les dades és aquella en la qual trobem tres modes.

Variància i Covariància

Variància: És l'error quadràtic mig comès quan agafem la mitjana com a mesura central. Indica el grau de dispersió de les dades respecte de la mitjana. Per a freqüències absolutes es defineix com: S² = 1/N * Σ ni (vi - mitjana)² (desviació al quadrat).

Covariància: Mesura del grau de relació entre variables. Si és positiva, es dona quan valors elevats d'una de les variables van acompanyats de valors elevats de l'altra. Si és negativa, s'esdevé quan valors elevats d'una de les variables s'associen amb valors baixos de l'altra. Es calcula sumant totes les opcions de (variable x - mitjana de x) * (variable y - mitjana de y) i dividint per n-1. Si no hi ha covariància, no hi ha coeficient de correlació; si tenen signe positiu o negatiu, el coeficient tindrà el mateix signe.

Desviació Típica

La Desviació Típica és l'arrel quadrada de la variància. La seva funció és retornar les unitats de mesura a la seva escala inicial. Com a mesura de dispersió, es calcula com: Arrel de [Suma de (X - mitjana)² / N].

Classificació de Variables i Freqüències

Tipus de Variables

  • Variables qualitatives: Poden ser nominals (categories) o ordinals (quan els valors són elements d'una escala, com el grau de satisfacció).
  • Variables quantitatives: Poden ser contínues (qualsevol valor numèric real, com la temperatura o el pes) o discretes (valors d'una llista finita o comptable, com cara o creu).

Anàlisi de Freqüències

La Freqüència Absoluta és el nombre de vegades que es repeteix un valor, mentre que la Freqüència Relativa és el percentatge de vegades que apareix. La freqüència acumulada és la suma de les absolutes i l'acumulada relativa és la suma dels percentatges. Per a l'estudi de dues variables quantitatives s'utilitza una taula de correlació; en cas contrari, s'utilitza una taula de contingència.

Entradas relacionadas: