Entwicklung von Zielfunktionen und Optimierungsverfahren für das segmentbasierte Sequenz-Alignment
Projekt MO 1048/1-1 im DFG-Schwerpunkt SPP 1063
Informatikmethoden zur Analyse und Interpretation großer genomischer Datenmengen
Prof. Dr. Burkhard Morgenstern - Prof. Dr. Stephan Waack
Zusammenfassung:
Es sollen (a) neue Zielfunktionen für das segmentbasierte Alignment von DNA- und Proteinsequenzen entwickelt werden; hierauf basierend sollen (b) Optimierungsalgorithmen angepasst bzw. neu entwickelt werden, die in der Lage sind, optimale oder fast-optimale Alignments entsprechend der entwickelten Zielfunktionen zu finden.
Beim segmentbasierten Alignmentverfahren wird die Qualität von paarweisen und multiplen Alignments auf der Basis von lokalen Sequenzähnlichkeiten bewertet. Es wird nach statistisch signifikanten Segment-Ahnlichkeiten zwischen den Input-Sequenzen gesucht (sog. Fragment-Alignments), und ein -- lokales oder globales -- Alignment wird dadurch aufgebaut, dass solche lokalen Fragment-Alignments in ein resultierendes Gesamt-Alignment integriert werden.
Die zentrale Frage bei diesem Ansatz ist, wie die Qualität von lokalen Sequenzähnlichkeiten bewertet werden soll, da dies darüber entscheidet, welche der Fragment-Alignments in das resultierende Alignment aufgenommen werden. Die Beantwortung dieser Frage setzt die Lösung nicht-trivialer statistischer Probleme voraus: Es genügt nicht die statistische Signifikanz von einzelnen Fragment-Alignments zu betrachten, sondern entscheidend ist die Signifikanz des resultierenden Gesamt-Alignments.
Beteiligte Wissenschaftler:
Prof. Dr. Burkhard Morgenstern (Antragsteller und
Projektleiter)
Prof. Dr. Stephan Waack (Mitantragsteller)
Dr. Jan Weyer-Menkhoff (Wiss. Mitarbeiter)
Dipl.-Math. Isabelle Schneider (Wiss. Mitarbeiterin)
Publikationen:
-
D. Pöhler, N. Werner, R. Steinkamp, B. Morgenstern (2005)
Multiple Alignment of Genomic Sequences using CHAOS, DIALIGN and ABC
Nucleic Acids Res., in press. -
J. Weyer-Menkhoff, C. Devauchelle, A. Grossmann,
S. Grünewald (2005)
Integer linear programming as a tool for constructing trees from quartet data
Computational Biology and Chemistry, in press. - A.R. Subramanian, J. Weyer-Menkhoff,
M. Kaufmann, B. Morgenstern (2005)
DIALIGN-T: An improved algorithm for segment-based multiple sequence alignment
BMC Bioinformatics 6, 66. -
B. Morgenstern, N. Werner, S.J. Prohaska, R. Steinkamp,
I. Schneider, A.R. Subramanian, P.F. Stadler, J. Weyer-Menkhoff (2005)
Multiple sequence alignment with user-defined constraints at GOBICS
Bioinformatics 21, 1271-1273. - B. Morgenstern, S.J. Prohaska, N. Werner, J.
Weyer-Menkhoff, I. Schneider, A.R. Subramanian, P.F. Stadler
(2004)
Multiple sequence alignment with user-defined constraints (preprint)
Proceedings of the German Conference on Bioinformatics 2004
Lecture Notes in Informatics P-53, 25-36. - M. Schmollinger, K. Nieselt, M. Kaufmann, B. Morgenstern
(2004)
DIALIGN P: Fast pair-wise and multiple sequence alignment using parallel processors
BMC Bioinformatics 5, 128. - M. Brudno, R. Steinkamp, B. Morgenstern (2004)
The CHAOS/DIALIGN WWW server for Multiple Alignment of Genomic Sequences
Nucleic Acids Res. 32, W41-W44. - M. Brudno, M. Chapman, B. Göttgens, S. Batzoglou, B.
Morgenstern (2003)
Fast and sensitive multiple alignment of large genomic sequences
BMC Bioinformatics 4, 66.
Created by Burkhard Morgenstern. Last modified: April 2005