Anàlisi de dades univariants
Clasificado en Tecnología
Escrito el en catalán con un tamaño de 2,49 KB
Dades univariants
Les dades univariants són les que provenen d’una única variable.
Dades qualitatives o categòriques
Si es disposa de dades qualitatives o categòriques, aquestes es poden sintetitzar mitjançant una taula que reculli, per a cada categoria: el nombre de vegades que hi apareix (freqüència absoluta), el percentatge d’aparicions sobre el total d’observacions (freqüència relativa), i els acumulats d’ambdós valors.
Un gràfic que sol ser també força utilitzat per a descriure dades qualitatives és l’anomenat diagrama de Pareto. Aquest gràfic és compost per:
- un diagrama de barres en el qual les categories són ordenades de major a menor freqüència,
- una línia que representa la freqüència relativa acumulada.
Diagrames de Pareto
Els diagrames de Pareto són molt útils per a detectar quan un percentatge reduït de categories (per exemple, un 20% de les categories) acapara o representa un percentatge alt d’observacions (per exemple, un 80% de les dades).
Dades quantitatives
En el cas de dades quantitatives, la representació gràfica o les taules permeten apreciar la forma de la distribució estadística, com ara, la forma com es comporta la variable d’interès.
Quan les observacions generen un nombre elevat de valors diferents, és recomanable agrupar els esmentats valors en classes o intervals disjunts d’igual mida.
Un gràfic que utilitza també intervals per a agrupar les dades a representar és l’histograma, el qual mostra la freqüència (absoluta o relativa) de cada classe, cosa que permet visualitzar de manera aproximada la distribució de les dades.
Estadístics descriptius
Els estadístics descriptius són valors numèrics capaços de proporcionar informació a partir del conjunt de les observacions. Resulten molt útils a l’hora d’entendre el comportament de les dades, ja que un simple valor numèric és capaç de descriure propietats tan rellevants com, ara, el valor mitjà del conjunt de dades, el valor màxim, el valor que es repeteix amb més freqüència.
Grups estadístics descriptius:
- els de centralització, proporcionen informació sobre quins són els valors centrals del conjunt de dades (com ara, el valor mitjà de les dades)
- els de dispersió, expliquen com se situen i varien les dades respecte als valors centrals (com ara, el rang o diferència entre el valor màxim i el valor mínim de les dades)