Tilfeldig skog
En tilfeldig skog[1] eller tilfeldig beslutningsskog[2]er en ensemblelærings-metode for klassifisering, regresjon og andre oppgaver som fungerer ved å konstruere en mengde beslutningstrær på treningstidspunktet. For klassifiseringsoppgaver er resultatet den klassen som blir valgt av flest trær. For regresjonsoppgaver returneres gjennomsnittlig prediksjon for de enkelte trærne.[3] Tilfeldige beslutningsskoger korrigerer for beslutningstrærs vane med å overtilpasse treningssettet deres.
Ulemper
[rediger | rediger kilde]Mens tilfeldige skoger ofte oppnår høyere nøyaktighet enn et enkelt beslutningstre ofrer de den iboende tolkbarheten som finnes i beslutningstrær. Beslutningstrær er en del av en ganske liten familie av maskinlæringsmodeller som er enkle å tolke sammen med lineære modeller, regelbaserte modeller og oppmerksomhetsbaserte modeller. Denne tolkbarheten er en av de mest ettertraktede egenskapene til beslutningstrær. Det lar utviklere bekrefte at modellen har lært realistisk informasjon fra dataene og gir sluttbrukerne tillit til beslutningene som tas av modellen.[4][5] For eksempel er det ganske trivielt å følge stien som et beslutningstre tar for å ta sin beslutning, men det er mye vanskeligere å følge stiene til titalls eller hundrevis av trær. For å oppnå både ytelse og tolkbarhet tillater noen modellkomprimerings-teknikker å transformere en tilfeldig skog til et minimalt "født-på-nytt"-beslutningstre som gjengir den samme beslutningsfunksjonen.[6] Hvis det fastslås at de prediktive attributtene er lineært korrelerte med målvariabelen kan det hende at bruk av tilfeldig skog ikke øker nøyaktigheten til den basislærende.[6] Ved problemer med flere kategoriske variabler kan tilfeldig skog kanskje ikke øke nøyaktigheten til den basislærende.[7]
Se også
[rediger | rediger kilde]- Beslutnignstrelæring
- Ensemblelæring
- Gradientforsterkning
- Parameterfri statistikk, gren av statistikk som ikke bare er basert på parametriserte familier av sannsynlighetsfordelinger
- Randomisert algoritme, algoritme designet for å bruke tilfeldighet fra hjelpeinnganger som en del av logikken
Referanser
[rediger | rediger kilde]- ^ «Koherensprodukt fra Sentinel, Anvendelser og metoder, Stian Normann Anfinsen, Rapport 2-2022, NORCE Energi og teknologi» (PDF).
- ^ «Sammenligning av kardiologisk og algoritmebasert EKG-tolkning på idrettsutøvere: Kan kunstig intelligens forbedre algoritmene?, Bjørn-Jostein Singstad, Master i Elektronikk, informatikk og teknologi» (PDF).
- ^ (PDF) http://ect.bell-labs.com/who/tkh/publications/papers/odt.pdf.
- ^ Piryonesi, S. Madeh; El-Diraby, Tamer E. (1. februar 2021). «Using Machine Learning to Examine Impact of Type of Performance Indicator on Flexible Pavement Deterioration Modeling». Journal of Infrastructure Systems. 27 (2): 04021005. doi:10.1061/(ASCE)IS.1943-555X.0000602.
- ^ Mal:ElemStatLearn
- ^ a b Tom referanse? (hjelp)
- ^ (Thesis) https://tspace.library.utoronto.ca/handle/1807/97601.