Lösungen
- Aufgabe 1
- Mit dem GenBank Eintrag erhält man die volle Sequenze ("Range= 1 : 1441")
Mit "CDS" erhält man nur die "Coding Sequence" ("Range = 20 : 1417") - Man erhält 6 AS-Sequenzen:
je nach Start nucleotid erhält man drei verschiedene AS-Sequenzen:
Beispiel:
acggtc...
acg gtc...
cgg tc...
ggt c...
je 3 durch 5'3'Orientierung der Ausgangsequenz die anderen drei in entgegengesetzter Orientierung. - Nur eine der sechs AS-Sequenzen hat ein 'M' (Methionin) relativ am Anfang und ein 'Stop' relativ am Ende Nutzt man die CDS sind 'M' und 'Stop' die begrenzer einer Sequenz.
- Mit dem GenBank Eintrag erhält man die volle Sequenze ("Range= 1 : 1441")
- Aufgabe 2
- Man erhält 99 Geneinträge mit zwei bis drei Einträgen pro Spezies.
- Das Glukokinasegen befindet sich auf Chromosom 7 von der Position 44.150.395 bis 44.195.563.
- Für das Glukokinasegen sind 5 Transcripte bekannt. GCK-001, GCK-002,GCK-201,GCK-003 und GCK-202. Üer den Link "Exon info" erfährt man dass die Transcripte 10 bis 11 Exons enthalten
- Wobei zwei der fünf Transkripte bekannte ENSEMBL-Treanskripte sind.
- Glukokinase ist nach dem Namen ein Enzym, welches Glukose phosphoriliert. Nähere Einzelheiten erhält man, wenn man die GeneOntology Annotation betrachtet (GO-Terme) oder den Link der EC-Nummer verfolgt. Dort erhält man:
ENZYME: 2.7.1.2 Entry 2.7.1.2 Name Glucokinase. AltName
Glucose kinase.
Reaction ATP + D-glucose = ADP + D-glucose 6-phosphate. COMMENT * A group of enzymes found in invertebrates and microorganisms highly specific for glucose.
- Die nicht gefüllten Boxen stellen die 5' bzw. 3' UTR dar, die gefüten Boxen die CDS.
- Die GCK-Gene befinden sich auf dem "Reverse Strand".
- Wählt man auf der Gene Report Seite im Transcript Bereich auf der Genkarte den Feature EST erhält man drei ESTs. Durch Kombination dieser kann man die bekannten Transcripte darstellen.
- Für Maus (Mus musculus) und Ratte (Rattus norvegicus) findet sch je ein orthologes Gen. Bei anderen Organismen, wie S. cerevisiae erhält man mehrere Orthologe.
- Aufgabe 4
- ENTREZ Gene ist eine Datenbank über Gene aus der RefSeq - Datenbank und anderen Datenbanken sequenzierter Gene. Sie enthält nur bekannte Gene mit bekannten Sequenzen.
- UniGene enthält Informationen über Loci und dessen bekannte und möliche Transkripte.
- GEO Profiles enthält Datenüber Genexpressionsexperimente und Profile aus der Gene Expression Omnibus (GEO) Datenbank.
- Aufgabe 5
Üer das ENTREZ erhält man in OMIM Informationen über die Krankheit und das verantwortloiche Gen (Huntingtin , "HTT"). Wieder auf der ENTREZ Seite findet man das Gen mit der GeneID 3064 und kann in der Sektion "Reference assembly" direkt die Sequenz als FASTA und GenBank in beliebigen Formaten exportieren. - Aufgabe 6
Man findet 824.155 Sequenzen für den Schimpansen und nur einen Eintrag für dessen LDHA Gen - Aufgabe 7
- OMIM beschreibt sehr genau das pathologisches Auftreten der 'LACTATE DEHYDROGENASE-A DEFICIENCY'. Bei Swiss-Prot findet man nur einen Verweis, dass 'Defects in LDHA are a cause of exertional myoglobinuria.'.
- Von den 30 Aminosären stimmen alle bis auf die zehnteüberein.
Please direct questions and comments to Martin Haubrock.