Mittwoch, 2. Januar 2013

Statistik für den Kühlschrank

Frage: Ein Test (sagen wir für eine bestimmte Krankheit, oder für eine bestimmte Droge) ist zu 99% zuverlässig. Nur auf 1% der Bevölkerung trifft das Kriterium zu (also sie haben die Krankheit, nehmen die Droge, wie auch immer).

Wie groß ist die Wahrscheinlichkeit, dass das Testergebnis bei einer positiv getesteten Person korrekt ist?

Die meisten Leute antworten mit 99%. Hast du das auch gedacht? Denkst du es noch?

Rechnen wir nach!
100 000 Personen, Rechnung jeweils (N * Anteil in N * Wahrscheinlichkeit = X):
Richtig Negative: 98010 (100000 * .99 * .99)
Falsch Positive: 990 (100000 * .99 * .01)
Richtig Positive: 990 (100000 * .01 * .99)
Falsch Negative: 10 (100000 * .01 * .01)
Heißt bei einem negativen Ergebnis besteht die Chance von 1 zu 9801, dass das Ergebnis falsch sein könnte. Sehr verlässlich also. Bei einem positiven Ergebnis jedoch besteht eine Chance von 1 zu 1, oder anders gesagt 50%, dass das Ergebnis falsch sein könnte.

Aus dem Grund werden zum Beispiel beim Verdacht auf schwere Krankheiten auch meist mehrere verschiedene Tests durchgeführt. Die 99% Treffsicherheit aus dem Beispiel sind hier nämlich arg... irreführend. Erstaunlich, was Sprache suggerieren kann.

Kommentare:

  1. Irgendwie habe ich gerade einen Knoten im Kopf.
    Wo ist mein Denkfehler?
    Für mich stellt es sich wie folgt dar:
    Test ist 99%zuverlässig, als 99%richtig, 1%falsch
    Bevölkerung 1%krank, 99%nicht krank
    Test richtig/krank 0,99*0,01*100000 = 990
    Test richtig/nichtkrank 0,99*0,99*100000 = 98010
    Test falsch/krank 0,01*0,99*100000 = 10
    Test falsch/nichtkrank 0,01*0,99*100000 = 990
    Damit komme ich natürlich auf eine andere Ratio :( Anne

    AntwortenLöschen
  2. Hm. Irgendwie stimmen bei den Werten für krank und Nichtkrank die Produkte nicht. Die Endergebisse jedoch schon ;-).

    Wir haben hier drei Faktoren: Die Zuverlässigkeit des Tests (im Beispiel .99 für korrekt, 0.01 für falsch), die Stichprobengröße (im Beispiel immer 100000), und schließlich die Verbreitung in N (0.01 für krank, 0.99 für gesund).

    Bei der Kombi Test falsch / krank hat man also 0.01 (Test falsch) * 0.01 (Anzahl krank) * 100000 = 10
    Bei der kombi Test falsch / nichtkrank hat man also 0.01 (Test falsch) * 0.99 (Anzahl gesund) * 100000 = 990

    Allerdings das Fazit stimmt auch in deiner Rechnung - auch du hast dort
    Test richtig/krank 0,99*0,01*100000 = 990
    vs.
    Test falsch/nichtkrank 0,01*0,99*100000 = 990 (wenn bei einem Nichtkranken der Test falsch ausfällt, zeigt der Test "krank" an)
    Ergo: Genauso viele korrekt identifizierte Kranke und falsch identifizierte Kranke, heißt Wahrscheinlichkeit von 50%, dass das Ergebnis stimmt.

    AntwortenLöschen
  3. Ah, jetzt habe ich zumindest meinen Fehler gefunden. Es ist dein letzter Satz. Hier ist mein Knoten. Aber ein Stück stehe ich immer noch auf dem Schlauch. Wieso der Vergleich dieser beiden Größen...?
    Anne

    AntwortenLöschen
  4. Wieso?

    Oh oh. Wieso- und Warumfragen gehen schnell in Richtung Sinn des Lebens und Ursprung des Universums ;-).

    Meiner Erfahrung nach wird die Korrektheit von Tests bei positiven Ergebnissen massiv überschätzt. In dem Beispiel, wie hoch ist die Wahrscheinlichkeit, dass jemand mit positivem Testergebnis krank ist, bei dem 99% sicheren Test?

    50%, weil es genau so viele korrekt wie falsch identifizierte Kranke gibt.

    Weil es nicht sonderlich intuitiv ist, ignorieren viele Leute den Faktor "Anteil in N" in ihren Schätzungen. Sie gehen dann stattdessen von 99% Wahrscheinlichkeit aus, die der Test ja durchaus auch suggeriert. Nur darum der Vergleich dieser beiden Größen - denn es gibt da einen kleinen Abstand zwischen Theorie (99% Korrektheit) und Praxis (50% Korrektheit, bei einem positiven Testergebnis).

    AntwortenLöschen
  5. na ich denk mal noch bisschen nach. der Knoten ist leider noch nicht geplatzt, obwohl ich deine Argumentation irgendwie auch verstehe... wer weiß. ich werde mal zwischendurch was anderes tun, dann wird es wieder leichter mit dem denken :)
    danke dir für die schnelle Erklärung!

    AntwortenLöschen