Sensitivität, Spezifität und Prävalenz

Mein Mai-Beitrag zur Corona-Krise (nach der Scheiß-App im März und der Corona-App im April) beschäftigt sich mit der Qualität von (medizinischen) Tests.

Einführung:

Um die Ergebnisse eines Tests wie den Covid-19-PCR-Test bewerten zu können, sollte man die Auswirkung der Inzidenz (Krankheitshäufigkeit unter den Getesteten) auf die Zuverlässigkeit von Testergebnissen verstehen. Die ist aber nur wenig intuitiv und widerspricht oft der naiven Überlegung.

Auf dieser Seite habe ich das Thema Schritt für Schritt entwickelt und die Tabellen und Zahlen mit ein wenig JavaScript so verdrahtet, dass Sie die drei Parameter ändern können und dann alle Werte neu berechnet werden. Wenn Sie einen Wert mit der Maus überfahren, leuchtet dieser Wert selbst überall auf der Seite rot auf, die trivial von diesem Wert abhängigen anderen Werte gelb.

Dies ist kein Easy-Reading-Material; eine halbe Stunde sollten Sie sich schon gönnen, damit es klick macht.

Die Seite verträgt mehr Text und Erklärung. Wenn Sie etwas verbessern wollen, nur zu: ich entlasse Seite und Text und Skript und Styles in die Public Domain und gebe alle Rechte daran auf. Kopieren Sie die Seite zu sich und machen Sie was besseres daraus. Sie können natürlich auch einen verbesserten Text an mich senden, damit ich ihn einbauen kann.

Erklärung der Begriffe:

In einer Menge von ? Elementen (Menschen) ist ein Merkmal (Covid-19-Infektion) mit der Häufigkeit ? verteilt. Das heißt: ? Elemente tragen dieses Merkmal (sind infiziert) und ? tragen das Merkmal nicht (sind nicht infiziert).

Das Merkmal selbst (die Infektion) ist nicht unmittelbar sichtbar, es steht aber ein Test (PCR-Test) für dieses Merkmal zur Verfügung.

Dieser Test ist jedoch - wie die meisten Tests - nicht perfekt:

  • False Positive: Der Test meldet „positiv” (infiziert), obwohl ein Element (Mensch) das Merkmal nicht trägt (nicht infiziert ist), und zwar mit einer Rate von ?.
  • False Negative: Der Test meldet „negativ” (nicht infiziert), obwohl ein Element (Mensch) das Merkmal trägt (infiziert ist), und zwar mit einer Rate von ?.

Wie sicher wird positives Merkmal erkannt?

Wie oft wird positives Merkmal als negativ erkannt
(infiziert, aber Test meldet nicht infiziert)?


Wie sicher wird negatives Merkmal erkannt?

Wie oft wird negatives Merkmal als positiv erkannt
(nicht infiziert, aber Test meldet infiziert)?


Welcher Anteil der Menge (Menschen) trägt das Merkmal (ist infiziert)?

Tabellarische Darstellung

Wir multiplizieren Spalten (Merkmal/Erkrankung) und Zeilen (Testergebnisse) aus:

Merkmal
negativ Summe positiv
? ? ?
Summe 100% ? ? ? 100% Summe
Test negativ ? ? ? ? ? Test negativ
Test positiv ? ? ? ? ? Test positiv

Hier ist die Schlüsselstelle: Lassen Sie sich Zeit 🍵 und vollziehen Sie jedes Feld nach.


Zur Erhöhung der Übersichtlichkeit lassen wie die Prozent-Werte weg und vertauschen einige Zeilen und Spalten:

Wahrheitsmatrix
Merkmal
negativ
Merkmal
positiv
Merkmal
Summe
Test negativ ? ? ?
Test positiv ? ? ?
Test Summe ? ? ?

Auswertung eines Testes:

Wir testen ein Element. Was sagt das Testergebnis darüber aus, ob dieses Element das Merkmal trägt?

Testergebnis positiv
Merkmal negativ: ? ? ÷ ? ?
Merkmal positiv: ? ? ÷ ? ?
Summe: ?
Testergebnis negativ
Merkmal negativ: ? ? ÷ ? ?
Merkmal positiv: ? ? ÷ ? ?
Summe: ?
  • Der Test meldet „positiv”:

    Schauen wir uns die Gesamtmenge an:

    • Von den ? Elementen, die das Merkmal tragen, würde der Test ? Elemente als positiv melden (? sind false negative.)
    • Von den ? Elementen, die das Merkmal nicht tragen, würde der Test ? Elemente als positiv melden. Das sind die ? false positives.

    Zusammen würden ? Elemente als positiv gemeldet.

    Der Anteil der Elemente, die das Merkmal tragen, unter den als positiv gemeldeten Elementen ist also (? ÷ ?).

    Meldet der Test also positiv, so liegt das Merkmal mit einer Wahrscheinlichkeit von ? und nicht den erwarteten ? vor.

    Dieser Wert hängt, anders als die Intuition sagt, nicht nur von der Qualität des Testes ab, sondern auch von der Prävalenz, also der Verteilung des Merkmals: Ist die Prävalenz sehr klein, also fast 0, oder sehr groß, also fast 100%, dann versagt auch ein sehr guter Test.

  • Der Test meldet „negativ”:

    Schauen wir uns die Gesamtmenge an:

    • Von den ? Elementen, die das Merkmal tragen, würde der Test ? Elemente als negativ melden. Das sind die ? false negatives.
    • Von den ? Elementen, die das Merkmal nicht tragen, würde der Test ? Elemente als negativ melden. (? sind false positives.)

    Zusammen würden ? Elemente als negative gemeldet.

    Der Anteil der Elemente, die das Merkmal nicht tragen, unter den als negativ gemeldeten Elementen ist also (? ÷ ?).

    Meldet der Test also negativ, so liegt das Merkmal mit einer Wahrscheinlichkeit von ? und nicht den erwarteten ? nicht vor.

    Dieser Wert hängt, anders als die Intuition sagt, nicht nur von der Qualität des Testes ab, sondern auch von der Prävalenz, also der Verteilung des Merkmals: Ist die Prävalenz sehr klein, also fast 0, oder sehr groß, also fast 100%, dann versagt auch ein sehr guter Test.