Paarweise und multiple Alignments
Ein Sequenzalignment zeigt Ähnlichkeiten zwischen zwei (pairwise) oder mehreren (multiple) Sequenzen auf. Solche Ähnlichkeiten kann man nutzen, um Vorhersagen über strukturelle, funktionelle oder evolutionäre Eigenschaften zu machen. Ähnlichkeit zwischen Sequenzen kann sein: Ähnliche Sequenz, ähnliche Eigenschaft, gleiche Domänen, etc
Es gibt viele Anwendungsgebiete für Sequenzealignments:
- Erkennung von Ähnlichkeiten zwischen Sequenzen
- Erkennung von konservierten Bereichen / Motiven
- Erkennung von struktureller Homologie
- Vorhersage von Eigenschaften alignierter Sequenzen, z.B. konservierte Bereiche mit einer bestimmten Struktur oder Funktion
- Rekonstruktion phylogenetischer Bäume
- u.s.w
Methoden um Alignments zu erzeugen (global vs. lokal):
- global
versucht die Sequenzen in kompletter Länge zu alignieren
- lokal
versucht nur Teile der Sequenz zu alignieren die besonders ähnlich sind
Identifizierung konservierter Motive / Domänen
Verschiedene heuristische Methoden:
- Progressive Alignment Strategie Die am weitesten verbreitete Methode. Benutzt einen anfangs erzeugen phylogenetischen Baum, um Schritt für Schritt ein Alignment entlang des Baumes zu berechnen. Diese Methode ist generell eine gute Wahl, jedoch lassen sich Fehler, die in einem frühen Stadium des Alignmentprozesses gemacht wurden nicht mehr rückgaengig machen. Wird z.B. bei ClustalW benutzt
- Iterative Strategie
Garantiert nicht, dass eine optimale Loesung gefunden wird, dafür ist es aber robuster und weniger anfällig in Bezug auf die Anzahl an Sequenzen im Vergleich zu den beiden anderen Methoden. Hat Probleme, wenn versucht wird, eine sehr unähnliche Sequenz mit vielen sehr ähnlichen Sequenzen zu alignieren. - Simultane Alignment Strategie
Sehr rechenaufwändig, liefert aber sehr gute Ergebnisse. Wird bei MSA und DCA – Divide and Conquer – verwendet
Da es sehr viele verschiedene Methoden gibt Alignments zu berechnen, es allerdings derzeit an einem Möglichkeit fehlt, Alignmentmethoden kritisch zu bewerten und damit zu sagen, welches die beste ist, kann man sich wie folgt helfen:
Wenn man wenig Zeit hat und nur einen groben Überblick über die Ähnlichkeiten der Sequenzen braucht, ClustalW oder Muscle nehmen
Wenn man viel Zeit hat, sollte man mehrere Methoden verwenden (z.B. Clustalw und Muscle oder T-Coffee) und anschließend die Ergebnisse vergleichend betrachten.
Links:
Please direct questions and comments to Fabian Schreiber.