Feilmatrise

Terminologi og utledninger
innen forvirringsmatriser
tilstand positiv (P) antall reellt positive tilfeller i datene tilstand negativ (N) antall reellt negative tilfeller i datene sann positiv (SP) antall reellt positive tilfeller klassifisert som positive (trefninger) sann negative (SN) antall reellt negative tilfeller klassifisert som negative (korrekt forkastninger) falsk positive (FP) antall reellt negative tilfeller klassifisert som positive (falske alarmer, type-I-feil) falsk negative (FN) antall reellt positive tilfeller klassifisert som negative (bomskudd, type-II-feil) sensitivitet, recall, trefningsrate, eller sann-positiv-rate (SPR) $\mathrm {SPR} ={\frac {\mathrm {SP} }{\mathrm {P} }}={\frac {\mathrm {SP} }{\mathrm {SP} +\mathrm {FN} }}=1-\mathrm {FNR}$ spesifisitet, selektivitet, eller sann-negativ-rate (SNR) $\mathrm {SNR} ={\frac {\mathrm {SN} }{\mathrm {N} }}={\frac {\mathrm {SN} }{\mathrm {SN} +\mathrm {FP} }}=1-\mathrm {FPR}$ presisjon, eller positiv-prediktiv-verdi (PPV) $\mathrm {PPV} ={\frac {\mathrm {SP} }{\mathrm {SP} +\mathrm {FP} }}=1-\mathrm {FOR}$ negativ-prediktiv-verdi (NPV) $\mathrm {NPV} ={\frac {\mathrm {SN} }{\mathrm {SN} +\mathrm {FN} }}=1-\mathrm {FOR}$ bomskuddsrate, eller falsk-negativ-rate (FNR) $\mathrm {FNR} ={\frac {\mathrm {FN} }{\mathrm {P} }}={\frac {\mathrm {FN} }{\mathrm {FN} +\mathrm {SP} }}=1-\mathrm {SPR}$ fall-out, eller falsk-positiv-rate (FPR) $\mathrm {FPR} ={\frac {\mathrm {FP} }{\mathrm {N} }}={\frac {\mathrm {FP} }{\mathrm {FP} +\mathrm {SN} }}=1-\mathrm {SNR}$ falsk-oppdagelsesrate (FOR) $\mathrm {FOR} ={\frac {\mathrm {FP} }{\mathrm {FP} +\mathrm {SP} }}=1-\mathrm {PPV}$ falsk-utelatelsesrate (FUR) $\mathrm {FUR} ={\frac {\mathrm {FN} }{\mathrm {FN} +\mathrm {SN} }}=1-\mathrm {NPV}$ nøyaktighet (NØY) ${\text{NØY}}={\frac {\mathrm {SP} +\mathrm {SN} }{\mathrm {P} +\mathrm {N} }}={\frac {\mathrm {SP} +\mathrm {SN} }{\mathrm {SP} +\mathrm {SN} +\mathrm {FP} +\mathrm {FN} }}$ F1-verdi det harmoniske gjennomsnitt mellom presisjon og sensitivitet $\mathrm {F} _{1}=2\cdot {\frac {\mathrm {PPV} \cdot \mathrm {SPR} }{\mathrm {PPV} +\mathrm {SPR} }}={\frac {2\mathrm {SP} }{2\mathrm {SP} +\mathrm {FP} +\mathrm {FN} }}$ Matthews korrelasjonskoeffisient (MKK) $\mathrm {MCC} ={\frac {\mathrm {SP} \times \mathrm {SN} -\mathrm {FP} \times \mathrm {FN} }{\sqrt {(\mathrm {SP} +\mathrm {FP} )(\mathrm {SP} +\mathrm {FN} )(\mathrm {SN} +\mathrm {FP} )(\mathrm {SN} +\mathrm {FN} )}}}$ Youden-indeks, Informedness, eller Bookmaker Informedness (BM) $\mathrm {BM} =\mathrm {SPR} +\mathrm {SNR} -1$ Markerthet, Markedness (MH) $\mathrm {MK} =\mathrm {PPV} +\mathrm {NPV} -1$ Kilder: Fawcett (2006),^[1] Powers (2011),^[2] and Ting (2011)^[3]

Innenfor maskinlæring og spesifikt statistisk klassifisering er en forvirringsmatrise, også kjent som feilmatrise,^[4] et spesifikt tabelloppsett som visualiserer ytelsen til en algoritme, typisk ved veiledet læring. I ikke-veiledet læring kalles det vanligvis en samsvarmatrise.

Hver rad i matrisen representerer instansene i en faktisk klasse, mens hver kolonne representerer instansene i en predikert klasse (eller omvendt – begge variantene finnes i litteraturen).^[2] Navnet kommer fra at matrisen gjør det enkelt å se om systemet forveksler to klasser (altså ofte feilmerker den ene som en annen).

Det er en spesiell type krysstabell med to dimensjoner ("faktisk" og "predikert"), og identiske sett med "klasser" i begge dimensjoner (hver kombinasjon av dimensjon og klasse er en variabel i krysstabellen).

Referanser

^ Fawcett, Tom (2006). «An Introduction to ROC Analysis» (PDF). Pattern Recognition Letters. 27 (8): 861–874. doi:10.1016/j.patrec.2005.10.010.
^ ^a ^b Powers, David M W (2011). «Evaluation: From Precision, Recall and F-Measure to ROC, Informedness, Markedness & Correlation» (PDF). Journal of Machine Learning Technologies. 2 (1): 37–63.
^ Ting, Kai Ming (2011). Encyclopedia of machine learning. Springer. ISBN 978-0-387-30164-8.
^ Stehman, Stephen V. (1997). «Selecting and interpreting measures of thematic classification accuracy». Remote Sensing of Environment. 62 (1): 77–89. Bibcode:1997RSEnv..62...77S. doi:10.1016/S0034-4257(97)00083-7.

[Fawcett2006-1] Fawcett, Tom (2006). «An Introduction to ROC Analysis» (PDF). Pattern Recognition Letters. 27 (8): 861–874. doi:10.1016/j.patrec.2005.10.010.

[Powers2011-2] Powers, David M W (2011). «Evaluation: From Precision, Recall and F-Measure to ROC, Informedness, Markedness & Correlation» (PDF). Journal of Machine Learning Technologies. 2 (1): 37–63.

[ting2011precision-3] Ting, Kai Ming (2011). Encyclopedia of machine learning. Springer. ISBN 978-0-387-30164-8.

[4] Stehman, Stephen V. (1997). «Selecting and interpreting measures of thematic classification accuracy». Remote Sensing of Environment. 62 (1): 77–89. Bibcode:1997RSEnv..62...77S. doi:10.1016/S0034-4257(97)00083-7.

[1]

[2]

[3]

[4]