close

Anmelden

Neues Passwort anfordern?

Anmeldung mit OpenID

Kirchablättle - kirche

EinbettenHerunterladen
Selektionsanalyse
Klade
DEFGLO_1
DEFGLO_2
AG_1
AG_2
AGL6_1
AGL6_2
TM3_1
TM3_2
AGL12
GpMADS4
StMADS11
Person
Piaszinski, Katja
Goebel, Michele
Hanisch, Lisa
Beyerlein, Anna
Mai, Laura
Müller, Mario
Ißleib, Constantin
Walther, Denise
Dürichen, Hendrike
Köcher, Nadja
Schwind, Anna
Pöllath, Christine
Uhlisch, Franziska
Vorbereitung des Datensatzes
Speichern Sie sich „ihre“ FASTA-Datei von der Praktikums-Webseite. Übersetzen Sie die
Nukleotidsequenzen in Proteinsequenzen mit Hilfe von Transeq. Fertigen Sie Alignments der
Proteinsequenzen an. Übersetzen Sie die Proteinalignments in Nukleotidalignments mit
RevTrans. Wandeln Sie mit RevTrans erhaltene FASTA-Datei in NEXUS-Format um.
Legen Sie für jeden Datensatz einen neuen Ordner in IHREM Verzeichnis auf Linux an:
cd IhrVerzeichnis;
mkdir Selektion;
Kopieren Sie die Nexus-Dateien ihres Datensatzes in den jeweiligen Ordner. Führen Sie einen
Modeltest durch.
Sättigungsanalyse
Kopieren Sie das Ergebnis des Modeltests in die NEXUS-Dateien. Bestimmen Sie die
paarweisen Distanzen zwischen den Sequenzen mit PAUP folgendermaßen:
Öffnen Sie die NEXUS-Datei in PAUP (dabei setzen Sie für NEXUS-Datei den Namen
Ihrer NEXUS-Datei ein):
paup4b10 NEXUS-Datei
Geben Sie folgende Befehle in PAUP ein:
dset distance=ml
savedist file=distance.txt
dset distance=p
dset subst=TI
savedist file=distancesTI.txt
dset subst=TV
savedist file=distancesTV.txt
Kopieren Sie die drei Dateien auf den Windows-Computer. Laden Sie die Daten
folgendermaßen in Microsoft Excel:
Öffnen Sie Excel und wählen Sie im Menü „Daten“, „Aus Text“ und wählen die zuerst
erzeugte Datei aus (distances.txt) und klicken Sie „Importieren“.
Im sich öffnenden „Textkonvertierungs-Assistenten“ klicken Sie „Weiter“, nochmals
„Weiter“ und wählen bei „Schritt 3 von 3“ dann „Weitere…“. Achten Sie darauf, dass bei
„Dezimaltrennzeichen“ ein Punkt und bei „1000er Trennzeichen“ ein Komma gewählt ist.
Wählen Sie „OK“ und dann „Fertig stellen“.
Wiederholen Sie diese Schritte für die Dateien distancesTI.txt und
distancesTV.txt.
Sortieren Sie die alle Daten anhand der Maximum Likelihood Distanzen (Spalte C).
Fügen Sie Überschriften für die Spalten mit den Maximum-Likelihood-Distanzen, den
Transitionen (TI) und den Transversionen (TV) ein. Erstellen Sie ein Punktdiagramm anhand
dieser Daten.
Beurteilen Sie, ob Transitionen oder Transversionen im Datensatz gesättigt sind.
Umwandlung der Formate für PAML
Wandeln Sie die Alignments und Phylogenien ihres Datensatzes folgendermaßen in ein
Format um, das vom Programm PAML gelesen werden kann.
Alignments
Öffnen Sie dazu die FASTA-Datei des Nukleotidalignment. Fügen Sie am Anfang der Datei
eine Zeile mit der Anzahl der Sequenzen und der Länge des Alignments ein.
Phylogenien
Die Phylogenien müssen im Klammerformat (Newick-Format) angegeben werden.
Im Folgenden wird die Newick-Darstellung für eine Phylogenie angegeben:
(
(A, (B, ((C,D), E))),
(((F, (G, H)), I), J)
);
Hier muss ebenfalls in der ersten Zeile angegeben werden, wie viele Taxa betrachtet werden
und wie viele Phylogenien angegeben werden (wir geben genau eine Phylogenie an).
Selektionsanalyse mit PAML
Kopieren Sie die Befehlsdatei für die PAML-Analyse in Ihren Ordner „Selektion“.
cp /home/praktikum/freeratio.ctl /home/praktikum/IhrVerzeichnis/Selektion
cp /home/praktikum/oneratio.ctl /home/praktikum/IhrVerzeichnis/Selektion
Öffnen Sie diese Befehlsdateien mit vi. Tragen Sie unter seqfile und treefile die
Namen Ihrer Sequenzdatei und Ihrer Phylogeniedatei ein.
Starten Sie die Selektionsanalyse. Geben Sie dazu auf der Kommandozeile folgende Befehle
ein.
codeml freeratio.ctl
codeml oneratio.ctl
Likelihood Ratio Tests
Führen Sie einen Likelihood Ratio Test durch, um festzustellen, ob das free-ratio Modell oder
das one-ratio Modell besser zu Ihren Daten passt.
Suchen Sie dazu in der Datei oneratio.mlc folgende Zeile (das Zeichen ‚#‘ steht für eine
Ziffer):
lnL(ntime: ##
np: ##):
-####.######
+0.000000
Kopieren Sie den Likelihood-Wert unter -####.###### in Microsoft Excel, ebenso wie
den Wert, der nach np angegeben ist.
Suchen Sie nun auch in der Datei freeratio.mlc diese Zeile und kopieren Sie die
entsprechenden Werte in das Excel-Dokument.
Berechnen Sie das Doppelte des Absolutwertes der Differenz der beiden Likelihood-Werte:
2ΔlnL oder als Excel-Formel 2*ABS(Likelihood-Wert für freeratio-Modell - LikelihoodWert für oneratio-Modell)
Berechnen Sie die Differenz der Anzahl der Parameter beider Modelle (Differenz der Werte,
die unter np angegeben werden, Δnp).
Berechnen Sie nun den p-Wert des Likelihood Ratio Tests mit folgender Excel-Formel:
CHIVERT(2ΔlnL; Δnp). Ist dieser Wert kleiner als 0.05, so passt das freeratio-Modell
besser zu den Daten als das oneratio-Modell. Ist dieser Wert größer als 0.05, so passt das
oneratio-Modell besser zu den Daten als das freeratio-Modell.
Geschafft!
Sequenzsuche
-
Kombinierter Datensatz kodierender Sequenzen
Reduzierter Datensatz kodierender Sequenzen
Datensatz als Proteinsequenzen
Alignments
-
Proteinalignments (Probcons, Mafft, ClustalW)
Nukleotidalignment im Fasta- und NexusFormat
Substitutionsmodelle
-
Modell für Nukleotidalignment
Modell für Proteinalignment
Phylogenien
-
Neighbour Joining Phylogeny
RAxML Phylogenie
MrBayes Phylogenie
Selektionsanalyse
-
Sättigungsanalyse
Alignment und Phylogenie im PAML-Format
PAML-Analyse und Likelihood Ratio Tests
Zweiter,
reduzierter
Datensatz
Document
Kategorie
Internet
Seitenansichten
10
Dateigröße
1 057 KB
Tags
1/--Seiten
melden