Applied Bioinformatics [Alignment]

Solutions

Exercises

Multiple Sequenz Alignment

Aufgabe 1

Möchte man wissen, zu welcher Gruppe ein unbeschriebener Organismus gehört, kann man seine Nukleotidsequenz (bsp. eines bestimmten Gens) nehmen und sie mit bereits beschriebenen Sequenzen vergleichen. Solch eine Analyse umfasst die Berechnung eines Alignments der unbeschrieben Sequenz mit Sequenzen des gleichen Gens von anderen Organismen.

Bei dieser Übung betrachten wir Teile eines Gens amplifiziert von der DNA von 9 basidiomycetischen Pilze. Von diesen 9 sind 7 bereits beschrieben, einer wurde kürzlich beschrieben (unknown 1), ein anderer ist noch gänzlich unbeschrieben (unknown 2).

Die Basidiomyceten beinhalten Spezies verschiedener Genera, einige wurden den Marchandiomyces zugeordnet.

AF289660 Marchandiomyces corallinus
AF289661 Marchandiomyces aurantiacus
AF289663 Hobsonia mirabilis
HVU78043 Helicogloea variabilis
D85647.1 Rhizoctonia zeae
AY757264.1 Sistotrema sernanderi
AY757261.1 Sistotrema eximum
DQ915463.1 Minimedusa sp. ATCC MYA 2993
AF289659 Cf. Marchandiomyces unknown 1
undeposited. Cf. Marchandiomyces unknown 2
AY789390.1 Peziza varia strain (Kontrollgruppe)

alle Pilzsequenzen

Der erste Teil (z.B AF289660) heisst Accession Number und wird genutzt, um Sequenzen eindeutig in einer Datenbank zu identifizieren.

Aufgaben:

  1. Gehe zu GenBank und finde alle Sequenzen anhand ihrer Accession Number.
  2. Gehe zu dem Webinterface von ClustalW und gib die Sequenzen in das vorgesehene Feld ein.
  3. Benutze Standardeinstellungen, um mit ClustalW ein Alignment zu erzeugen.
  4. Schau dir die Score Table an, die dir Auskunft über prozentuale Ähnlichkeit zweier Sequenzen gibt. Wenn nach dem Alignment Score sortierst, kannst du die den unbekannten am nächsten stehenden Sequenzen. Am Ende der Ergebnisseite findest du den Guide Tree (einen phylogenetischen Baum, der die evolutionäre Ähnlichkeit der Sequenzen zueinandern als Baum darstellt). ClustalW berechnet ein Alignment in der Reihenfolge der Sequenzen in diesem Baum.
  5. Erzeuge nun eine reduzierte Version des Alignments, indem du die einzelen Sequenzen bspw. halbierst. Wie verändert sich das Alignment (wenn überhaupt)? Wie verändert sich der Guide Tree?
  6. Versuche nun mittels BLAST für jede der beiden unbekannten Sequenz eine weitere zu finden und aligniere die Sequenzen neu. Was (wenn überhaupt) ändert sich?

Fragen:

  1. Welches (Teil-)Gen beschreibt die Sequenz? Ist es bei allen Organismen das gleiche Gen?
  2. Von Unknown 1 und 2 wurde ursprünglich angenommen, dass sie Spezies des Genus Hobsonia, Marchandiomyces, seien. Letzte Studien zeigten Verwandtschaft zum Genus Sistotrema. Wie ähnlich sind die beiden unbekannten zu den Pilzen (Marchandiomyces, Hobsonia, Sistotrema) oder sind sie sogar ähnlicher zu anderen Organismen (die du durch die BLAST-Suche erhalten hast)?
  3. Aus welchem Grund unterscheiden sich die Sequenzen in der Länge? Warum werden Gaps in das Alignment eingefügt?
  4. Wie wird der Guide Tree und damit das Alignment durch das Hinzufügen von Sequenzen oder durch Änderungen in der Länge verändert?

Aufgbe 2

Berechnen Sie die Kosten des Alignments

G A T T A C A T T A T A
G A T G - - A T A A C -

mit Hilfe der folgenden Substitutionsmatrix

A C G T
A 0 3 1 3
C 0 3 1
G 0 3
T 0

gap open: 3
gap extension: 1


Please direct questions and comments to Fabian Schreiber.