Regressielijnen |
Top Previous Next |
Door middel van een puntenwolk, gebaseerd op gepaarde waarnemingen, kun je nagaan of er een (statistisch) verband tussen de twee variabelen bestaat. Anders gezegd of er tussen die variabelen een zogenaamde correlatie bestaat. Hoe smaller de puntenwolk hoe sterker het verband. De correlatiecoëfficiënt is een maat voor de sterkte van dit verband. Is er geen enkele correlatie dan is de waarde van de correlatiecoëfficiënt gelijk aan nul. Liggen de punten van de puntenwolk precies op een rechte lijn dan is de correlatiecoëfficiënt gelijk aan 1 als de lijn stijgt, en gelijk aan –1 als de lijn daalt. In de praktijk ligt de waarde van de correlatiecoëfficiënt tussen –1 en 1 in. Tabblad Punten Met deze demonstratie kun je bestuderen welke invloed het verplaatsen of toevoegen van een punt aan de puntenwolk heeft op de correlatie. Aan de puntenwolk op het scherm kun je punten toevoegen en verwijderen door klikken met de rechter muisknop. Met de linker muisknop kun je een punt verslepen. Het rode punt is het centrale punt van de wolk, dat is het punt met de coördinaten (x-gemiddeld , y-gemiddeld).
Regressielijn De zwarte lijn in de wolk heet de regressielijn van y op x. De formule van de lijn staat op het scherm. Met behulp van een regressieformule van y op x kun je de waarde van y (bijvoorbeeld het gewicht) voorspellen als de waarde van x (bijvoorbeeld de lengte) bekend is. Door middel van een aankruisvakje krijg je ook de regressielijn van x op y en de formule van deze regressielijn. Deze lijn is groen. De regressielijn van y op x wordt berekend met de methode van de kleinste kwadraten. Je kunt de kwadraten door aanvinken zichtbaar maken. De kwadratensom en de correlatiecoëfficiënt worden vermeld.
Centrale lijn De centrale (rode) lijn die je daarbij ziet is de zogenaamde centrale lijn. Deze lijn is een symmetrie-as van de ovaal die je om de puntenwolk kunt trekken. De richtingscoëfficiënt van deze lijn is het quotiënt van de standaardafwijkingen van de y- en x-waarden van de gepaarde punten.
Tabblad Simulatie Deze optie is bedoeld om te laten zien hoe goed de regressielijn van een steekproef aansluit bij de regressielijn van de populatie. Eerst geef je de regressielijn van de populatie op met behulp van de parameters helling en constante. Ook de spreiding (SD) van de y-waarden om de regressielijn geef je op. Bij een simulatie wordt op zes plaatsen met een vaste x-waarde random een punt geplaatst. De y-coordinaat van elk punt is berekend met een normale verdeling met als gemiddelde de y-waarde van het punt op de groene lijn en als standaarddeviatie de ingevulde SD - waarde. Bij het aldus verkregen zestal punten wordt de regressielijn (op basis van lineaire regressie) getekend in het rood. Bij herhalen van de simulatie worden de “oude” regressielijnen in grijs getekend.
Tempobalk Met de tempobalk kun je de snelheid van de simulaties instellen maar ook tijdens een simulatie veranderen. Met Stap kun je gedetailleerd volgen hoe een experiment verloopt Snel is bedoeld om veel data te maken die je in een bestand kunt bewaren. Onderbreken/Doorgaan Met de spatiebalk kun je de simulatie onderbreken of hervatten
Tabblad Zoeken beste lijn In deze optie kun je proberen zelf de regressielijn te vinden bij een gegeven puntenwolk. Met de knop Nieuwe punten krijg je een nieuwe set punten. Met de schuifbalken kun je de lijn verplaatsen en draaien. Let daarbij op de waarde van de kwadratensom. Met Beste lijn kun je nagaan of je de goede lijn gevonden hebt. |