Blast

Fra Wikipedia, den frie encyklopedi
Gå til: navigasjon, søk

BLAST (Basic Local Alignment Search Tool) er en samling programmer for analyse av biologiske sekvensdata. Det blir brukt for å sammenligne DNA- eller proteinsekvenser med data fra store databaser. Disse databasene er som oftest tilgjengelige for alle, men det er også mulig å bruke egne data som ikke er offentlig tilgjengelige.

Bruk[rediger | rediger kilde]

BLAST krever at brukeren gir en sekvens som startpunkt. BLAST sammenligner denne med sekvensene i databasen, og resultatet den gir tilbake er en rekke lokale sammenstillinger. Hver sammenstilling får en score som sier noe om hvor godt resultatet er, det vil si hvor signifikant sammenstillingen er eller om treffet kan skje ved en tilfeldighet. Dette kan brukes til å identifisere en sekvens, om den allerede er i databasen, eller til å finne ut hvilke andre sekvenser den er evolusjonært i slekt med. Dette siste kan hjelpe til med å finne funksjonen til brukerens sekvens.

Algoritmen er basert på matematiske metoder som ble utviklet av Stephen Altschul og Samuel Karlin på 1990-tallet.[1] Idéen bygger på at det er sannsynlig at sammenstillinger med mange treff har små felles biter med stor identitet (likhet). BLAST finner slike biter, og disse blir så forstørret på søk etter bedre og lengre sammenstillinger.

Søkeresultater[rediger | rediger kilde]

Likheten mellom søkesekvensen og databasesekvensene er definert ved hjelp av en score og en e-verdi.

Scoren er en kvantitativ vurdering av likheten mellom søkesekvensen med en kjent sekvens fra databasen. Hvis scoren er høy, er det også mange likheter mellom sekvensene.

E-verdien uttrykker det forventede antall treff som har en score som er minst like høy som den aktuelle verdien. Jo mindre e-verdien er, desto bedre er treffet.

Se også[rediger | rediger kilde]

Referanser[rediger | rediger kilde]

  1. ^ Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ (1990). «Basic local alignment search tool». Journal of Molecular Biology, 215 (3), s. 403–410. doi:10.1006/jmbi.1990.9999. PMID 2231712. 

Litteratur[rediger | rediger kilde]

  • Korf, I., Yandell, M., Bedell, J. BLAST. O'Reilly, Sebastopol, CA, 2003, ISBN 0-596-00299-8
  • McGinnis S., & Madden T.L., (2004) BLAST: at the core of a powerful and diverse set of sequence analysis tools. Nucleic Acids Res. 32:W20-W25, [1]
  • Altschul, S.F., Madden, T.L., Schaffer, A.A., Zhang, J., Zhang, Z., Miller, W. & Lipman, D.J. (1997) Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res. 25:3389-3402. Medline
  • Geer, L.Y., Domrachev, M., Lipman, D.J. & Bryant, S.H. (2002) CDART: Protein Homology by Domain Architecture Genome Res. 2002 12: 1619-1623. PMID 12368255
  • Sansom, C. (2000): Database searching with DNA and protein sequences: an introduction. In: Brief Bioinform. Bd. 1, S. 22-32. PMID: 11466971 PDF

Eksterne lenker[rediger | rediger kilde]

Tutorials: