DNA.Lands Trait Prediction Report

(Dieser Blogbeitrag wurde von Richard Aufrichtig, dem User Engagement Coordinator von DNA.Land, und Jie Yuan, einem Doktoranden der Informatik an der Columbia University, verfasst.)

DNA.Land freut sich, seine neueste Funktion vorstellen zu können: den Trait Prediction Report!

Trait Prediction ist unser Versuch, auf der Grundlage von Genomdaten echte Wortmerkmale vorherzusagen. Diese Funktion nutzt die Ergebnisse von Studien, bei denen Zusammenhänge zwischen Einzelnukleotid-Polymorphismen (SNPs) (Bereiche des Genoms, die zwischen Individuen variieren) und biologischen Merkmalen entdeckt wurden, von denen angenommen wird, dass sie eine genetische Komponente haben. Auf der Menüseite für die Trait-Vorhersage werden die verfügbaren Traits und Ihre Vorhersagen angezeigt.

Derzeit sind auf DNA.Land nur zwei Merkmale verfügbar. Es werden jedoch regelmäßig zusätzliche Merkmale hinzugefügt.

Auf genetischen Informationen basierende Vorhersagen von Merkmalen werden durch eine Vielzahl von Faktoren erschwert, unter anderem durch Umwelteinflüsse, Bevölkerungsschichtung und statistische Unsicherheit. Einige der angezeigten Vorhersagen sind möglicherweise ungenau. Um unsere Vorhersagemodelle weiter zu verbessern, bitten wir unsere Benutzer, eine vorläufige Umfrage durchzuführen. Mithilfe dieser Umfragen können wir unsere Vorhersagen verfeinern. Die Umfrage muss abgeschlossen sein, bevor Ihr Bericht angezeigt wird, damit die Antworten nicht verzerrt werden.

Wenn Ihre Vorhersage ungenau ist, bedenken Sie bitte, dass wir die wertvollen Informationen, die Sie in der Umfrage angegeben haben, verwenden, um unsere zukünftigen Vorhersagemodelle zu verbessern.

DNA.Land-Benutzer finden unsere neue Funktion im Bereich "Meine Berichte".

Eine Berichtsseite für jedes Merkmal enthält drei Hauptabschnitte: Abgeleitete Merkmale, Genotypzusammenfassung und Genotypdetails.

Abgeleitete Eigenschaft:

Der erste Abschnitt enthält Ihre vorhergesagte Punktzahl basierend auf der hochgeladenen Genotypdatei und den veröffentlichten Forschungsergebnissen:

In diesem Abschnitt bezieht sich das genetische Vertrauen darauf, inwieweit die derzeit entdeckten genomischen Varianten die Merkmale eines Individuums vorhersagen können. Für die ersten beiden Eigenschaften, die wir eingeführt haben, haben wir speziell Themen von entgegengesetzten Enden dieses Spektrums ausgewählt. Während die Augenfarbe ein hohes genetisches Konfidenzniveau aufweist, ist das genetische Vertrauen des Bildungserfolgs gering.

In fast allen komplexen Merkmalen muss noch ein großer Teil der genetischen Varianten identifiziert werden, von denen angenommen wird, dass sie einen Effekt haben. Diese Vorhersagen stellen also nur unsere beste Schätzung dar, die auf dem aktuellen genomischen Wissen basiert. Beachten Sie, dass die Vorhersage nur die genomische Komponente berücksichtigt. Da fast alle menschlichen Merkmale durch eine Kombination unserer Genome und unserer Umgebung bestimmt werden, kann es sein, dass Ihr Merkmal hauptsächlich von Ihrer Umgebung bestimmt wird.

Genotyp-Zusammenfassung:

Dieser Abschnitt des Berichts zeigt, wie die genetischen Varianten der Genotypdatei an der Bestimmung des vorhergesagten Scores beteiligt sind. Es ist in zwei Unterabschnitte unterteilt: Effektgrößen und SNP-Positionen.

In unserem Bericht wird einem Allel jedes SNP eine Effektgröße zugeordnet. Es ist der Betrag in Standardabweichungen, der sich voraussichtlich ändert, wenn Sie über dieses bestimmte Allel verfügen. Diese Effektgrößen werden basierend auf Ihrem SNP-Profil summiert und dann entsprechend der Bevölkerungsverteilung angepasst, um Ihre endgültige Vorhersage zu erstellen.

BLAUE Balken repräsentieren den maximalen möglichen Effekt.

Wenn sich der BLAUE Balken rechts von der 0,0-Linie befindet, kann der SNP die vorhergesagte Punktzahl erhöhen.
 Wenn sich der BLAUE Balken links von der 0,0-Linie befindet, kann der SNP die vorhergesagte Punktzahl verringern.
 Wenn sich der BLAUE Balken zu beiden Seiten erstreckt, kann der SNP die vorhergesagte Punktzahl sowohl erhöhen als auch verringern.
 Informationen zu BLAUEN Balken stammen aus veröffentlichten Forschungsergebnissen.

ROTE Balken stellen den Beitrag Ihrer Genotypen zum vorhergesagten Score dar.

Wenn sich der ROTE Balken rechts von der 0,0-Linie befindet, wird Ihre Punktzahl im Vergleich zum Durchschnitt erhöht.
 Wenn sich der ROTE Balken links von der 0,0-Linie befindet, wird Ihre Punktzahl im Vergleich zum Durchschnitt gesenkt.
 Informationen in ROTEN Balken stammen aus Ihrer Genotypdatei.

Wenn Sie auf einen der Balken klicken, wird der SNP-Standort im Diagramm rechts angezeigt.

Genotyp-Details:

Dieser Abschnitt enthält eine Tabelle mit detaillierten Informationen zu den wichtigsten genetischen Varianten aus der Genotypdatei.

Unsere Vorhersagen berücksichtigen unterschiedliche Allelfrequenzen zwischen Populationen, um die durch die Bevölkerungsschichtung eingeführten Basen auszugleichen. Die Allelfrequenzen stammen aus dem 1000-Genom-Projekt und sind in fünf große Abstammungskategorien unterteilt. Die Allelfrequenzen aus einer dieser Gruppen werden auf Grundlage Ihrer abgeleiteten Abstammung auf Ihre Vorhersagen angewendet. Diese Spalten sind leer, wenn sie nicht in dem Forschungsbericht enthalten sind, auf dem unsere Bewertungen basieren. Sie basieren nicht direkt auf Ihrer Punktzahl

Odds Ratio: Dies ist eine Darstellung der Effektstärke eines SNP, die häufig in genetischen Fall-Kontroll-Studien verwendet wird. Zum Beispiel kann ein Genetiker eine Studie an zwei Gruppen durchführen: an denen, die Krebs haben, und an denen, die keine haben. Wenn ein bestimmtes Allel eine sehr hohe Quote aufweist, ist die Quote (oder Wahrscheinlichkeit) eines Individuums mit einer oder zwei Kopien des Allels im Vergleich zu einem Individuum, das keine Kopien des Allels aufweist, stark erhöht.

Standardfehler: Diese Werte beziehen sich auf die Effektgrößen der SNPs und stammen aus den Forschungsarbeiten, die diese SNPs melden. Sie geben Aufschluss darüber, wie sicher die Forscher in Bezug auf die jeweilige Effektgröße sind und inwieweit sich diese Effektgröße aufgrund der Messung unterschiedlicher Proben unterscheiden dürfte. Je niedriger der Standardfehler ist, desto sicherer ist die Effektgröße.

P-Wert: Dies ist das Ergebnis eines Hypothesentests zum Wert der Effektgröße eines SNP. Ein niedriger P-Wert bedeutet, dass der SNP eher an der Bestimmung des betreffenden Merkmals beteiligt ist. Ein häufiger P-Schwellenwert, der zur Bestimmung der Signifikanz in genomweiten Assoziationsstudien verwendet wird, ist 5 * 10–8.

Da dies eine neue Funktion ist, sind wir sicher, dass unsere Benutzer Fragen haben werden, mit denen wir nicht gerechnet haben. Wir würden uns sehr über Ihr Feedback freuen! E-Mails mit Fragen senden Sie bitte an info@dna.land. Halten Sie die Augen offen, um in den kommenden Wochen weitere Merkmale zu entdecken!