Archief - 95% betrouwbaarheidsinterval vs p-waarde van een test

Springstof · 12 jul 2011

Uit mijn statistische toets (Chi-kwadraat SPSS) komt een significante p-waarde van 0.036. Het 95% betrouwbaarheidsinterval betreft echter 0.995-1.215 en 'raakt' dus 1. Het betreft data over het hebben van een bepaalde risicofactor en het ontwikkelen van een ziektebeeld. Ik ben dus geïnteresseerd in de Odds Ratio.

Is het fout dat de p-waarde in conflict is met het 95% betrouwbaarheidsinterval? Doe ik als ik een dergelijke uitkomst krijg iets fout of klopt het gewoon dat ik een dergelijke uitkomst kan hebben? Dat het bijvoorbeeld statistisch significant is, maar (klinisch) niet relevant?

DaTa · 12 jul 2011

Een betrouwbaarheidsinterval van 95% kwam volgens mij overeen met een p-waarde van 1,96, dus misschien dat daar je fout zit?

pie-jie · 12 jul 2011

is het ni zo als p voldoende klein is (<0.05) dat het statistisch significant is? en dat uw betrouwbaarheidsinterval betrekking heeft op t-waardes?

hyperon · 12 jul 2011

Er is een kans van 3,6% dat je coefficient gelijk is aan 0. Dit is dus klein genoeg om te stellen dat je effect statistisch significant is.
Volgens je analyse is de grootte van je effect 0,995-1,215. Als je daaruit kan afleiden dat het klinisch niet relevant is, so be it.
Ik zie dus geen tegenstrijdigheid.

Ironpole · 12 jul 2011

Meh, ik kijk gewoon naar het effectief significantieniveau als ik met SPSS werk. Is veel eenvoudiger om te verstaan en geeft u direct antwoord of het significant is of niet.

Troj · 12 jul 2011

Bedoel je niet het betrouwbaarheidsinterval van de waarde zelf? Want daar bestaat de verwarring volgens mij. De p-waarde is x, het betrouwbaarheidsinterval (95% kans dat...) is y-z. Dat interval duidt niet op die p-waarde maar op de waarde van je variabele.

Springstof · 12 jul 2011

Bedankt voor de snelle antwoorden. Ik test of het wel of niet hebben van een bepaalde factor de kans op een bepaald ziektebeeld verhoogd. Een van die factoren is roken. Als het 95% betrouwbaarheidsinterval van de Odds Ratio de waarde 1 bevat wil dat toch zeggen dat deelnemers geen verhoogd risico hebben op het ontwikkelen van het ziektebeeld door de factor roken, omdat de standaardkans (de kans niet niet-rokers hebben op het ontwikkelen van het ziektebeeld) 1 is?

Als mijn Odds Ratio 2.1 zou zijn met een 95% betrouwbaarheidsinterval met waarden tussen bijvoorbeeld 1.8 en 2.5 zou hebben dan is daaruit af te leiden dat deelnemers met die factor een 2.1X verhoogd risico hebben op het ontwikkelen van het ziektebeeld ten opzichte van deelnemers zonder deze factor.

In mijn geval is mijn Odds Ratio 1.05 en het 95% betrouwbaarheidsinterval ligt tussen 0.995-1.215. Dus 1 ligt in het betrouwbaarheidsinterval. Dan is de juiste interpretatie toch dat het hebben van de betreffende factor de kans op het ontwikkelen van het ziektebeeld niet verhoogd?

Ik snap alleen niet hoe mijn p-waarde wel significant is, want de juiste interpretatie van mijn p-waarde is toch dat er een significant verband is tussen het ontwikkelen van het ziektebeeld (=y=uitkomstmaat) en het hebben van een bepaalde factor?

Genious · 12 jul 2011

kan je anders eens je output ergens online plaatsen? want je beschrijving is ietwat verwarrend.
Wat je in je tweede alinea zegt, lijkt fout en zo'n interval zou bij je test nooit voorkomen. (tenzij je nulhypothese niet is dat ze gelijke kans hebben, maar dat is vrij ongewoon om te doen)
Maar wat je in je derde alinea zegt, klopt dan weer.

Springstof · 12 jul 2011

Ik hoop dat onderstaande afbeelding het wat duidelijker maak en dus bij deze een bewerkte (anoniem gemaakt) printscreen van mijn output. De waarden, die mij verwarren zijn met rood aangegeven:
http://i53.tinypic.com/29386c2.png

(Het zijn andere waarden dan die in mijn openingspost staan (ik heb namelijk bij meer analyses dergelijke resultaten en daar is de afbeelding een voorbeeld van).

hyperon · 12 jul 2011

Ik denk dat je in de war bent geraakt door de eigen specificatie van je analyse.
De p-waarde gaat na hoe waarschijnlijk het is dat je coefficient gelijk is aan 0, niet 1.
Als ik je specificatie goed kan volgen, wil dit in feite zeggen dat je niet zo vele hebt aan die waarde (een odd-ratio van 0?)

Springstof · 12 jul 2011

Ik heb andere analyses in mijn output bekeken en ik denk dat ik het door heb. De tabel met risk estimate is waarschijnlijk incompleet. Daar moet namelijk output komen van
=ja vs nee (1.00 vs .00);
=nee (.00)
=ja (1.00)

Bij bovenstaande krijg ik alleen '=nee (.00)' output in de betreffende tabel en de 'ja vs nee (1.00 vs .00)' is relevant. Ik zal kijken of ik er een fout zit in mijn syntax en/of hoe dit verschil in output verklaard kan worden...

Edit: Ik heb het volgens mij door. Er zit geen fout in mijn syntax of andere fout in de analyse. Output komt door:
-0 deelnemers zonder risicofactor A en met ziektebeeld B.

Hierdoor is er dus geen ja vs nee output en is de analyse volgens mij niet bruikbaar om iets aan te tonen. Dit laatste moet ik nog even opzoeken en/of bespreken met mijn begeleider.

Genious · 12 jul 2011

2 bemerkingen:
1.
ge krijgt het resultaat van verschillende testen terug. het kan dus best zijn dat sommige zaken significant zijn, terwijl anderen het niet zijn, omdat het om verschillende testen gaat.

2.
chi-square is hier niet verantwoord. zoals in de output vermeld, zit je met velden die een lage verwachte frequentie hebben. Dit omdat het event ziektebeeld A=1 slechts heel zelden voorkomt.

gevolg ervan is dat zelfs een heel klein verschil tussen verwachte frequentie en gevonden frequentie een serieuze impact heeft. die 11.769 van uw chi-square komt voor het merendeel uit ziektebeeld A=1 (ongeveer 96% is ten gevolge van de verschillen ginder).

Fischer exact heb ik zelf nooit gebruikt, maar van wat ik op de wiki lees, is het bedoeld voor kleine samples. (en als ik de formule bezie, dan zitten er faculteiten in, wat de waarden extreem snel zal doen exploderen door uw relatief grote sample size)

Je hebt gewoon te weinig mensen in de groep ziektebeeld A=1 om het op zinnige wijze in uw analyse op te nemen lijkt me.

WillieVanillie · 12 jul 2011

Als je geinteresseerd bent in odds ratios is de output met 'risk estimates' minder relevant, want die geeft nl de Relatieve Risks (bvb. voor ziektebeeld a = 0 is dit (369/369)/(61/63)=1.033) en niet de Odds Ratios (OR zou hier zijn: (369*2)/(61*0), maar dit kan dus niet berekend worden t.g.v. 0 waarde/lege cel in freq tabel). Het 95% CI dat je krijgt slaat dus ook op Relative Risks, en niet op odds ratios

zoals al gezegd is chi2 biassed als de expected counts in 1 of meer cellen lager ligt dan 5. Een oplossing is gewoon Fisher exact te gebruiken (in je standaard spss output)

Andere oplossing is om de Trend test te gebruiken (is hier mogelijk omdat je variabele 'risicofactor B' kan worden gezien als ordinale var ipv nominale var). De Trend test is meer robuust tegen cellen met lage counts (sampling distributie is meer chi2 verdeeld tov pearson chi2 stat bij lage cell counts), en die test heeft ook meer power dan chi2 toets.

Maar ik zou het gewoon op Fisher exact houden: die test is unbiased bij kleine cell counts, en test precies de hypothese die je wil toetsen, nl dat de odds ratio = 1

succes ermee!

coldplayke · 12 jul 2011

...respect.

Blake · 12 jul 2011

Springstof zei:
Uit mijn statistische toets (Chi-kwadraat SPSS) komt een significante p-waarde van 0.036. Het 95% betrouwbaarheidsinterval betreft echter 0.995-1.215 en 'raakt' dus 1. Het betreft data over het hebben van een bepaalde risicofactor en het ontwikkelen van een ziektebeeld. Ik ben dus geïnteresseerd in de Odds Ratio.

Is het fout dat de p-waarde in conflict is met het 95% betrouwbaarheidsinterval? Doe ik als ik een dergelijke uitkomst krijg iets fout of klopt het gewoon dat ik een dergelijke uitkomst kan hebben? Dat het bijvoorbeeld statistisch significant is, maar (klinisch) niet relevant?

Kan het niet zijn dat uw Chi-kwadraat test eenzijdig is, dus dat die enkel test of uw statistiek groter is dan 1? In dat geval zou uw tweezijdige p-waarde (verschillend van 1, dus groter of kleiner dan 1) 0.072 zijn. Een betrouwbaarheidsinterval geeft altijd een tweezijdig beeld.

Archief - 95% betrouwbaarheidsinterval vs p-waarde van een test

Springstof

Legacy Member

DaTa

Legacy Member

pie-jie

Legacy Member

hyperon

Legacy Member

Ironpole

Legacy Member

Troj

Legacy Member

Springstof

Legacy Member

Genious

Legacy Member

Springstof

Legacy Member

hyperon

Legacy Member

Springstof

Legacy Member

Genious

Legacy Member

WillieVanillie

Legacy Member

coldplayke

Legacy Member

Blake

Legacy Member