« L’arbre généalogique humain » comprend 27 millions d’ancêtres


Une visualisation montrant les lignées ancestrales humaines déduites au fil du temps et de l'emplacement géographique.  Chaque ligne représente une relation ancestrale ;  la largeur de la ligne indique la fréquence de la relation.  La couleur indique l'âge estimé de l'ancêtre.

Une visualisation montrant les lignées ancestrales humaines déduites au fil du temps et de l’emplacement géographique. Chaque ligne représente une relation ancestrale ; la largeur de la ligne indique la fréquence de la relation. La couleur indique l’âge estimé de l’ancêtre.
Image: Reproduit, avec permission, de Wohns et al., Une généalogie unifiée des génomes modernes et anciens. Sciences (2022). doi : 10.1126/science.abi8264.

Une équipe de scientifiques a combiné des génomes modernes et anciens pour construire une nouvelle « généalogie de chacun », dans une réalisation qui jette les bases d’études futures sur notre évolution et notre propagation mondiale.

Des milliers et des milliers de modernes et anciens génomes humains ont été intégrés dans une généalogie cohérente et unifiéeselon le nouveau rechercherch publié dans Sciences. Cela s’apparente à un arbre généalogique, mais c’est énorme, car il contient près de 27 millions d’ancêtres, ce qui en fait la plus grande généalogie humaine jamais créée. La nouvelle carte pourrait être utilisée pour étudier l’évolution humaine et même aider à la recherche médicale sur les maladies héréditaires.

« Nous avons essentiellement construit un immense arbre généalogique, une généalogie pour toute l’humanité qui modélise aussi exactement que possible l’histoire qui a généré toutes les variations génétiques que nous trouvons chez les humains aujourd’hui », a déclaré Yan Wong, généticien évolutionniste au Big Data Institute et un co-auteur de l’étude, a expliqué dans une déclaration de l’Université d’Oxford. « Cette généalogie nous permet de voir comment la séquence génétique de chaque personne est liée à l’autre, le long de tous les points du génome. »

Le réseau montre comment les individus du monde entier sont liés les uns aux autres, et il prédit les ancêtres communs, y compris quand ils ont vécu et d’où ils viennent. Il modélise également des événements clés de l’histoire humaine, tels que les migrations humaines hors d’Afrique et les dispersions vers d’autres parties du globe.

Les chercheurs collectent des génomes humains depuis des années, mais le défi a été de donner un sens à tout cela dans une perspective plus large et holistique. Les comparaisons de ces génomes ont été difficiles en raison des méthodes disparates de collecte des données, de la présence de plusieurs bases de données et des écarts en termes de qualité et d’analyse des données. Pour aggraver le problème, chaque génome humain contient des segments d’ascendances multiples, qu’elles proviennent de divers groupes ethniques ou de populations humaines différentes, comme les Néandertaliens et les Dénisoviens. Ces ancêtres existent également sur de vastes échelles de temps, ce qui représente encore un autre défi. Ce qu’il faut, ce sont des algorithmes capables de relever ces défis, et c’est exactement ce que les chercheurs prétendent avoir réalisé.

Pour créer la carte, Wong, avec ses collègues, a appliqué une « méthode d’enregistrement arborescent non paramétrique » aux génomes humains modernes et anciens, le plus ancien dont remontent des centaines de milliers d’années. J’ai contacté Sharon Browning, une biostatisticienne de l’Université de Washington qui n’était pas impliquée dans la recherche, pour lui faire part de cette réalisation.

« Cet article concerne principalement un nouvel outil formidable pour les études génétiques appelé tskit, qui est l’abréviation de » kit de séquence d’arbres «  », a expliqué Browning dans un e-mail. C’est ce qu’on appelle un arbre parce que, « Si vous considérez une petite partie du génome chez un certain nombre d’individus et que vous retracez la descendance, vous revenez finalement à un seul ancêtre, comme » Eve mitochondriale « pour le génome mitochondrial », a-t-elle déclaré. « Cet ancêtre unique est la racine de l’arbre, et l’ensemble d’individus que vous considérez sont les extrémités des branches de l’arbre. » Browning a déclaré que l’arbre a un aspect différent selon les parties du génome en raison de la recombinaison (lorsque l’échange de matériel génétique entraîne une variation), et que tskit est « utilisé pour déduire les arbres le long du génome séquencé ».

Une reconstruction du visage d'un Néandertalien au Musée national des antiquités de Leiden, aux Pays-Bas.

Une reconstruction du visage d’un Néandertalien au Musée national des antiquités de Leiden, aux Pays-Bas.
photo: Bart Maât / ANP / AFP (Getty Images)

En effet, les algorithmes fonctionnent en prédisant où les ancêtres communs doivent être présents dans l’arbre généalogique évolutif, en examinant la variation génétique. Et parce que les génomes sont géolocalisés, il prédit où vivaient ces ancêtres communs.

« Essentiellement, nous reconstruisons les génomes de nos ancêtres et les utilisons pour former un vaste réseau de relations », a déclaré Anthony Wilder Wohns, auteur principal de l’étude et chercheur au Institut Big Dataa déclaré dans le communiqué d’Oxford. « Nous pouvons alors estimer quand et où ces ancêtres ont vécu. La puissance de notre approche est qu’elle fait très peu d’hypothèses sur les données sous-jacentes et peut également inclure des échantillons d’ADN modernes et anciens.

Browning a déclaré qu’une version antérieure de tskit était prometteuse, mais qu’elle s’est avérée avoir des limitations importantes. Les chercheurs ont maintenant abordé les limites, « fournissant un outil qui devrait être extrêmement utile dans de nombreux types d’études différents », a-t-elle déclaré. À quoi elle a ajouté: «Bien que les auteurs fournissent quelques applications, y compris leur visualisation cool de l’origine des ancêtres humains, la portée des applications possibles est très large, et je m’attendrais à voir une vague d’activités de la part des chercheurs les développant. ”

Browning a averti que les arbres estimés par tskit « ne viennent pas avec des mesures d’incertitude », elle s’attend donc à ce que les résultats soient utiles pour poser de nouvelles hypothèses, plutôt que pour prouver des hypothèses. « D’autres méthodes plus spécialisées seront encore nécessaires à des fins de vérification », a-t-elle déclaré.

Pour l’avenir, l’équipe espère ajouter de nouvelles informations génétiques au système au fur et à mesure de son arrivée. Ils ne s’attendent pas à ce que ce soit un problème, car le système peut en accueillir des millions d’autres.



Vous pouvez lire l’article original (en Angais) sur le sitegizmodo.com