Archief - 95% betrouwbaarheidsinterval vs p-waarde van een test

Het archief is een bevroren moment uit een vorige versie van dit forum, met andere regels en andere bazen. Deze posts weerspiegelen op geen enkele manier onze huidige ideeën, waarden of wereldbeelden en zijn op sommige plaatsen gecensureerd wegens ontoelaatbaar. Veel zijn in een andere tijdsgeest gemaakt, al dan niet ironisch - zoals in het ironische subforum Off-Topic - en zouden op dit moment niet meer gepost (mogen) worden. Toch bieden we dit archief nog graag aan als informatiedatabank en naslagwerk. Lees er hier meer over of start een gesprek met anderen.

Springstof

Legacy Member
Uit mijn statistische toets (Chi-kwadraat SPSS) komt een significante p-waarde van 0.036. Het 95% betrouwbaarheidsinterval betreft echter 0.995-1.215 en 'raakt' dus 1. Het betreft data over het hebben van een bepaalde risicofactor en het ontwikkelen van een ziektebeeld. Ik ben dus geïnteresseerd in de Odds Ratio.

Is het fout dat de p-waarde in conflict is met het 95% betrouwbaarheidsinterval? Doe ik als ik een dergelijke uitkomst krijg iets fout of klopt het gewoon dat ik een dergelijke uitkomst kan hebben? Dat het bijvoorbeeld statistisch significant is, maar (klinisch) niet relevant?

DaTa

Legacy Member
Een betrouwbaarheidsinterval van 95% kwam volgens mij overeen met een p-waarde van 1,96, dus misschien dat daar je fout zit?

pie-jie

Legacy Member
is het ni zo als p voldoende klein is (<0.05) dat het statistisch significant is? en dat uw betrouwbaarheidsinterval betrekking heeft op t-waardes?

hyperon

Legacy Member
Er is een kans van 3,6% dat je coefficient gelijk is aan 0. Dit is dus klein genoeg om te stellen dat je effect statistisch significant is.
Volgens je analyse is de grootte van je effect 0,995-1,215. Als je daaruit kan afleiden dat het klinisch niet relevant is, so be it.
Ik zie dus geen tegenstrijdigheid.

Ironpole

Legacy Member
Meh, ik kijk gewoon naar het effectief significantieniveau als ik met SPSS werk. Is veel eenvoudiger om te verstaan en geeft u direct antwoord of het significant is of niet.

Troj

Legacy Member
Bedoel je niet het betrouwbaarheidsinterval van de waarde zelf? Want daar bestaat de verwarring volgens mij. De p-waarde is x, het betrouwbaarheidsinterval (95% kans dat...) is y-z. Dat interval duidt niet op die p-waarde maar op de waarde van je variabele.

Springstof

Legacy Member
Bedankt voor de snelle antwoorden. Ik test of het wel of niet hebben van een bepaalde factor de kans op een bepaald ziektebeeld verhoogd. Een van die factoren is roken. Als het 95% betrouwbaarheidsinterval van de Odds Ratio de waarde 1 bevat wil dat toch zeggen dat deelnemers geen verhoogd risico hebben op het ontwikkelen van het ziektebeeld door de factor roken, omdat de standaardkans (de kans niet niet-rokers hebben op het ontwikkelen van het ziektebeeld) 1 is?

Als mijn Odds Ratio 2.1 zou zijn met een 95% betrouwbaarheidsinterval met waarden tussen bijvoorbeeld 1.8 en 2.5 zou hebben dan is daaruit af te leiden dat deelnemers met die factor een 2.1X verhoogd risico hebben op het ontwikkelen van het ziektebeeld ten opzichte van deelnemers zonder deze factor.

In mijn geval is mijn Odds Ratio 1.05 en het 95% betrouwbaarheidsinterval ligt tussen 0.995-1.215. Dus 1 ligt in het betrouwbaarheidsinterval. Dan is de juiste interpretatie toch dat het hebben van de betreffende factor de kans op het ontwikkelen van het ziektebeeld niet verhoogd?

Ik snap alleen niet hoe mijn p-waarde wel significant is, want de juiste interpretatie van mijn p-waarde is toch dat er een significant verband is tussen het ontwikkelen van het ziektebeeld (=y=uitkomstmaat) en het hebben van een bepaalde factor?

Genious

Legacy Member
kan je anders eens je output ergens online plaatsen? want je beschrijving is ietwat verwarrend.
Wat je in je tweede alinea zegt, lijkt fout en zo'n interval zou bij je test nooit voorkomen. (tenzij je nulhypothese niet is dat ze gelijke kans hebben, maar dat is vrij ongewoon om te doen)
Maar wat je in je derde alinea zegt, klopt dan weer.

Springstof

Legacy Member
Ik hoop dat onderstaande afbeelding het wat duidelijker maak en dus bij deze een bewerkte (anoniem gemaakt) printscreen van mijn output. De waarden, die mij verwarren zijn met rood aangegeven:
http://i53.tinypic.com/29386c2.png

(Het zijn andere waarden dan die in mijn openingspost staan (ik heb namelijk bij meer analyses dergelijke resultaten en daar is de afbeelding een voorbeeld van).

hyperon

Legacy Member
Ik denk dat je in de war bent geraakt door de eigen specificatie van je analyse.
De p-waarde gaat na hoe waarschijnlijk het is dat je coefficient gelijk is aan 0, niet 1.
Als ik je specificatie goed kan volgen, wil dit in feite zeggen dat je niet zo vele hebt aan die waarde (een odd-ratio van 0?)

Springstof

Legacy Member
Ik heb andere analyses in mijn output bekeken en ik denk dat ik het door heb. De tabel met risk estimate is waarschijnlijk incompleet. Daar moet namelijk output komen van
=ja vs nee (1.00 vs .00);
=nee (.00)
=ja (1.00)

Bij bovenstaande krijg ik alleen '=nee (.00)' output in de betreffende tabel en de 'ja vs nee (1.00 vs .00)' is relevant. Ik zal kijken of ik er een fout zit in mijn syntax en/of hoe dit verschil in output verklaard kan worden...


Edit: Ik heb het volgens mij door. Er zit geen fout in mijn syntax of andere fout in de analyse. Output komt door:
-0 deelnemers zonder risicofactor A en met ziektebeeld B.

Hierdoor is er dus geen ja vs nee output en is de analyse volgens mij niet bruikbaar om iets aan te tonen. Dit laatste moet ik nog even opzoeken en/of bespreken met mijn begeleider.

Genious

Legacy Member
2 bemerkingen:
1.
ge krijgt het resultaat van verschillende testen terug. het kan dus best zijn dat sommige zaken significant zijn, terwijl anderen het niet zijn, omdat het om verschillende testen gaat.

2.
chi-square is hier niet verantwoord. zoals in de output vermeld, zit je met velden die een lage verwachte frequentie hebben. Dit omdat het event ziektebeeld A=1 slechts heel zelden voorkomt.

gevolg ervan is dat zelfs een heel klein verschil tussen verwachte frequentie en gevonden frequentie een serieuze impact heeft. die 11.769 van uw chi-square komt voor het merendeel uit ziektebeeld A=1 (ongeveer 96% is ten gevolge van de verschillen ginder).

Fischer exact heb ik zelf nooit gebruikt, maar van wat ik op de wiki lees, is het bedoeld voor kleine samples. (en als ik de formule bezie, dan zitten er faculteiten in, wat de waarden extreem snel zal doen exploderen door uw relatief grote sample size)

Je hebt gewoon te weinig mensen in de groep ziektebeeld A=1 om het op zinnige wijze in uw analyse op te nemen lijkt me.

WillieVanillie

Legacy Member
Als je geinteresseerd bent in odds ratios is de output met 'risk estimates' minder relevant, want die geeft nl de Relatieve Risks (bvb. voor ziektebeeld a = 0 is dit (369/369)/(61/63)=1.033) en niet de Odds Ratios (OR zou hier zijn: (369*2)/(61*0), maar dit kan dus niet berekend worden t.g.v. 0 waarde/lege cel in freq tabel). Het 95% CI dat je krijgt slaat dus ook op Relative Risks, en niet op odds ratios

zoals al gezegd is chi2 biassed als de expected counts in 1 of meer cellen lager ligt dan 5. Een oplossing is gewoon Fisher exact te gebruiken (in je standaard spss output)

Andere oplossing is om de Trend test te gebruiken (is hier mogelijk omdat je variabele 'risicofactor B' kan worden gezien als ordinale var ipv nominale var). De Trend test is meer robuust tegen cellen met lage counts (sampling distributie is meer chi2 verdeeld tov pearson chi2 stat bij lage cell counts), en die test heeft ook meer power dan chi2 toets.

Maar ik zou het gewoon op Fisher exact houden: die test is unbiased bij kleine cell counts, en test precies de hypothese die je wil toetsen, nl dat de odds ratio = 1

succes ermee!

Blake

Legacy Member
Springstof zei:
Uit mijn statistische toets (Chi-kwadraat SPSS) komt een significante p-waarde van 0.036. Het 95% betrouwbaarheidsinterval betreft echter 0.995-1.215 en 'raakt' dus 1. Het betreft data over het hebben van een bepaalde risicofactor en het ontwikkelen van een ziektebeeld. Ik ben dus geïnteresseerd in de Odds Ratio.

Is het fout dat de p-waarde in conflict is met het 95% betrouwbaarheidsinterval? Doe ik als ik een dergelijke uitkomst krijg iets fout of klopt het gewoon dat ik een dergelijke uitkomst kan hebben? Dat het bijvoorbeeld statistisch significant is, maar (klinisch) niet relevant?

Kan het niet zijn dat uw Chi-kwadraat test eenzijdig is, dus dat die enkel test of uw statistiek groter is dan 1? In dat geval zou uw tweezijdige p-waarde (verschillend van 1, dus groter of kleiner dan 1) 0.072 zijn. Een betrouwbaarheidsinterval geeft altijd een tweezijdig beeld.
Het archief is een bevroren moment uit een vorige versie van dit forum, met andere regels en andere bazen. Deze posts weerspiegelen op geen enkele manier onze huidige ideeën, waarden of wereldbeelden en zijn op sommige plaatsen gecensureerd wegens ontoelaatbaar. Veel zijn in een andere tijdsgeest gemaakt, al dan niet ironisch - zoals in het ironische subforum Off-Topic - en zouden op dit moment niet meer gepost (mogen) worden. Toch bieden we dit archief nog graag aan als informatiedatabank en naslagwerk. Lees er hier meer over of start een gesprek met anderen.
Terug
Bovenaan