Statistiek en Data-analyse: Essentiële Begrippen voor Onderzoek

Enviado por Anónimo y clasificado en Otras materias

Escrito el en neerlandés con un tamaño de 11,82 KB

Statistiek en Onderzoek: Fundamentele Begrippen

Basisbegrippen in Statistisch Onderzoek

Populatie:
De verzameling van de hele groep die je onderzoekt.
Steekproef:
Een deel van de populatie die je gaat ondervragen.
Steekproefgrootte / Steekproefomvang:
Het aantal mensen dat je onderzoekt.
Variabele / Veranderlijke:
Wat je onderzoekt.
Data / Gegevens:
De resultaten van het onderzoek.

Grafieken voor Data Visualisatie

Grafieken voor Niet-Gegroepeerde Gegevens

Hierbij worden alle losse cijfers apart weergegeven; elke meting staat er één voor één in.

  • Dotplot: Stippenlijnen die de frequentie van individuele waarden weergeven.
  • Staafdiagram: Gebruikt staven om de frequentie van categorieën te tonen.
  • Schijfdiagram: Een cirkel verdeeld in schijven, die proporties van een geheel weergeven.
  • Strookdiagram: Een horizontale strook verdeeld in segmenten, die proporties van een geheel weergeven.

Grafieken voor Gegroepeerde Gegevens

Hierbij worden gegevens in klassen weergegeven in plaats van elk getal apart.

  • Schijfdiagram: Een cirkel met schijven, bijvoorbeeld voor klassen als [0,40[, [40,80[.
  • Strookdiagram: Een horizontale strook met schijven, bijvoorbeeld voor klassen als [0,40[, [40,80[,...

Histogram en Frequentiepolygoon

  • Histogram: Een soort staafdiagram dat wordt gebruikt bij gegroepeerde gegevens.
    • X-as: Toont klassen (bijv. leeftijden).
    • Y-as: Toont frequentie (hoe vaak iets voorkomt).
    • De staven staan tegen elkaar (zonder tussenruimte).
  • Frequentiepolygoon: Een lijn die de middenpunten van de staven van een histogram verbindt. Punten worden getekend in het midden van elke klas en verbonden met een lijn. Dit laat duidelijk zien hoe de frequentie verandert van klas tot klas.

Representatieve Steekproeven

Een representatieve steekproef is een kleine groep mensen of dingen die een goede afspiegeling is van de hele groep (de populatie).

Belangrijk: Een steekproef moet alle soorten mensen of gegevens uit de hele groep bevatten om een betrouwbaar beeld van de hele groep te geven. Voorbeeld: Je vraagt niet alleen je vrienden, maar ook leerlingen van verschillende leeftijden, klassen en achtergronden.

Voorwaarden voor Representativiteit van een Steekproef

  • Gelijk verdeeld: Deelnemers van de steekproef moeten uit de populatie komen en de verdeling van kenmerken in de populatie weerspiegelen.
  • Onafhankelijk: Iedereen uit de populatie moet evenveel kans maken om in de steekproef te komen, onafhankelijk van eerder geselecteerde deelnemers.

Steekproefbias en Variabiliteit

Random selectie / Aselecte steekproef:
Iedereen maakt evenveel kans om gekozen te worden. Bijvoorbeeld: namen uit een hoed trekken of een computer laten kiezen.
Selectiebias:
Je kiest onbewust of bewust mensen uit een bepaalde groep, waardoor je resultaten niet eerlijk of betrouwbaar zijn.
Steekproefvariabiliteit:
Omdat elke steekproef andere mensen bevat, kunnen de resultaten verschillen. Verschillende steekproeven geven verschillende resultaten omdat je elke keer andere mensen kiest, waardoor je ook andere uitkomsten krijgt.

Kenmerken van een Representatieve Steekproef

  • Gelijk verdeeld
  • Onafhankelijk
  • Aselect

Steekproefdesigns

Enkelvoudige Aselecte Steekproef (EAS)

Random selectie uit de volledige populatie van individuele personen, zonder voorkeur (willekeurig).

Gestratificeerde Steekproef

Eerst wordt de populatie verdeeld in groepen (strata) op basis van gemeenschappelijke kenmerken (bijv. geslacht, leeftijd, woonplaats, onderwijsniveau, inkomen). Daarna worden willekeurig mensen gekozen uit elke groep.

Stappen:

  1. Populatie: Iedereen tezamen.
  2. Strata: Verdelen in groepen met hetzelfde kenmerk.
  3. Willekeurige selectie: Uit elke groep.
  4. Steekproef.

Geclusterde Steekproef

De populatie wordt verdeeld in groepen (clusters), en vervolgens worden willekeurig een paar groepen gekozen. Alle mensen binnen die gekozen groepen worden gebruikt voor de steekproef.

Stappen:

  1. Populatie:
  2. Clusters: Opdelen in natuurlijke groepen (bijv. klassen, wijken, scholen).
  3. Willekeurige selectie van clusters: Je kiest bij toeval een paar van die groepen.
  4. Steekproef.

Getrapte Steekproef

Dit is een steekproef die in meerdere stappen wordt opgebouwd. Eerst worden groepen gekozen, en daarna binnen die groepen nog een selectie van mensen.

Stappen:

  1. Populatie:
  2. Clusters:
  3. Willekeurige selectie van clusters: Bijv. drie scholen kiezen.
  4. EAS in elke cluster: Binnen elke gekozen cluster (bijv. willekeurig 10 leerlingen per school kiezen).

Statistische Samenhang & Causaliteit

Correlatie:
Er is een verband tussen twee dingen; ze veranderen samen, maar de ene veroorzaakt niet per se de andere.
Causaliteit:
Oorzaak en gevolg; de ene gebeurtenis veroorzaakt echt de andere.
Storende veranderlijke:
Een derde factor zorgt ervoor dat twee dingen samen veranderen, zonder dat ze elkaar direct beïnvloeden.

Misleidende Representativiteit in Grafieken

Grafieken kunnen op verschillende manieren misleidend zijn:

  • Vertekeningen verticale as: De as begint niet bij 0, waardoor verschillen groter of kleiner lijken dan ze zijn.
  • Vertekeningen horizontale as: De afstanden op de horizontale lijn kloppen niet, waardoor tijd of cijfers verkeerd lijken.
  • Misleidend perspectief: 3D- of schuine plaatjes maken cijfers moeilijker te begrijpen en kunnen ze groter of kleiner laten lijken.
  • Absolute frequenties verkeerd tonen: Alleen het aantal mensen tonen, niet het percentage, kan de indruk wekken dat iets groter of kleiner is dan in werkelijkheid.
  • Geen eenheden of geen schaalvermelding: Als er geen getallen of eenheden bij een grafiek staan, weet je niet hoe groot iets echt is, wat misleidend kan zijn.

Do's en Don'ts in Onderzoek

  • Transparantie: Vertel duidelijk wie je onderzoekt, hoe je dat doet en wat je wilt weten. Wees eerlijk en open over je resultaten.
  • Steekproefopzet: Kies deelnemers willekeurig, zodat het onderzoek eerlijk en onbevooroordeeld is.
  • Steekproefgrootte: Gebruik genoeg deelnemers. Meer deelnemers geven betrouwbaardere resultaten.
  • Missing data: Controleer of er antwoorden missen en rapporteer daarover. Vul ontbrekende data niet zomaar aan met nieuwe mensen.
  • Uitschieters: Zoek uit waarom sommige waarden heel anders zijn. Als het fouten zijn, corrigeer die dan. Anders laat je ze staan en leg je uit waarom.
  • Cherry picking: Vermijd het bewust selecteren van informatie die je weergeeft en het verzwijgen van andere informatie om een bepaald verhaal te belichten. Gebruik alle data en rapporteer eerlijk.
  • Observationele vs. Experimentele studie:
    • Observationele studie: Je kijkt alleen wat er gebeurt.
    • Experimentele studie: Je verandert bewust iets om het effect te zien.
  • Randomisatie: Verdeel deelnemers willekeurig in groepen voor een eerlijk onderzoek.
  • Samenhang & Oorzaak: Laat verbanden zien, geen oorzaken. Om oorzaken te bewijzen is experimenteel onderzoek beter.

Frequentietabel

Een frequentietabel wordt gebruikt om gegevens in klassen te groeperen.

  • Elke klasse is een interval, bijv. [0,10[, dat data groepeert.
  • De klassenmidden (Mi) is het gemiddelde van de onder- en bovengrens, bijv. 5.
  • Absolute frequentie (Afi): Geeft het aantal gegevens in die klasse. Voorbeeldlijst: 2, 5, 7, 9, 12, 14, 18, 22, 25.
  • Relatieve frequentie (Rfi) in %: Afi / n (waarbij n de totale frequentie is).
  • Klassenbreedte (b): (Grootste gegeven - Kleinste gegeven) / Aantal klassen.

Normale Verdeling

De normale verdeling, ook wel Gauss-curve genoemd, heeft de volgende eigenschappen:

  • Symmetrisch: De verdeling is symmetrisch rond het gemiddelde.
  • Eén top: De verdeling heeft één piek.
  • Klokvormig: De vorm lijkt op een klok.

Standaardafwijking (σ) en Gemiddelde (x̄)

  • Hoe kleiner de standaardafwijking (σ), hoe smaller de berg (de curve).
  • Hoe groter de standaardafwijking (σ), hoe breder en platter de berg (de curve).

Berekening van de Standaardafwijking (Voorbeeld)

  1. Bereken het gemiddelde (x̄): Som van alle getallen / Aantal getallen.
  2. Bereken (x - x̄)² voor elk getal: (getal - uitkomst van stap 1)² = ... (dit voor elk getal doen).
  3. Tel alle uitkomsten van stap 2 bij elkaar op.
  4. Deel de uitkomst van stap 3 door het aantal getallen.
  5. Neem de vierkantswortel van dat getal. Dit is de standaardafwijking (σ).

Empirische en Theoretische Verdeling

Empirische verdeling:
Wat je echt hebt gemeten, bijv. hoe vaak iets gebeurt.
Theoretische verdeling:
Wat je verwacht, bijv. bij een munt 50% kop en 50% munt.

Dichtheidsfunctie

Een wiskundige functie die de verdeling voorstelt als een mooie, vloeiende lijn.

Eigenschappen:

  • Positieve functie.
  • De oppervlakte onder de kromme is gelijk aan 1 (of 100%).

Wiskundige Toepassingen: Lijnen en Functies

Gemiddelde Verandering (Snijlijn) in Interval [x1, x2]

Gegeven: Functie f(x) = -x² + 2x + 3

Gevraagd: Geef de vergelijking van de snijlijn in het interval [-2 (x1), -1 (x2)]

Oplossing:

  1. Bereken de coördinaten van de punten:
    • Voor x1 = -2:

      y1 = -(-2)² + 2 * (-2) + 3

      y1 = -4 - 4 + 3

      y1 = -5

      Punt 1: (-2, -5)

    • Voor x2 = -1:

      y2 = -(-1)² + 2 * (-1) + 3

      y2 = -1 - 2 + 3

      y2 = 0

      Punt 2: (-1, 0)

  2. Bereken de richtingscoëfficiënt (rico) van de snijlijn (a):

    a = Δy / Δx = (y2 - y1) / (x2 - x1)

    a = (0 - (-5)) / (-1 - (-2))

    a = 5 / 1

    a = 5

  3. Stel de vergelijking van de snijlijn op (y = ax + b):

    y = 5x + b

    Gebruik Punt 2 (-1, 0) om b te vinden:

    0 = 5 * (-1) + b

    0 = -5 + b

    b = 5

  4. De vergelijking van de snijlijn is: y = 5x + 5

Vergelijking van een Raaklijn aan een Functie in een Punt

Gegeven: Functie f(x) = -x² + 2x + 3

Gevraagd: Bepaal de raaklijn aan P(-2, f(-2)).

(Verdere stappen voor de berekening van de raaklijn ontbreken in het originele document.)

Entradas relacionadas: