Le projet Génome humain, lancé en 1990 et finalisé dès 2003, a favorisé le développement de techniques de séquençage du génome rapides, efficaces et économiques. Il faut traiter des quantités considérables d'information, ce qui serait impossible sans l'informatique. Il a fallu 13 ans et 100 millions de dollars pour séquencer le premier génome humain. Aujourd'hui, c'est possible en une journée pour moins de 1000 dollars.
Par exemple, en 2016, la GenBank comprenait les séquences de 193 millions fragments d'ADN génomique, soit 213 milliards de paires de baises. Toutes ces données sont partagées et accessibles.
Un exemple de découverte importante : plus de 75% du génome est transcrit à un certain moment dans au moins un des types de cellules étudiés, même si moins de 2% du génome code pour des protéines. De plus, on a pu associer des fonctions biochimiques à au moins 80% du génome humain.
La protéomique est une discipline qui étudie les protéines, qui assurent la plupart des fonctions cellulaires. Elle vient s'associer à la génomique. Il convient aussi de mettre ces composants individuels en lien pour comprendre leur intégration fonctionnelle : c'est la biologie des systèmes. En exemple, on trouve une carte des interactions protéiques globales probables parmi environ 4500 produits de gènes chez une levure.
LES GÉNOMES VARIENT EN TAILLE, EN NOMBRE DE GÈNES ET EN DENSITÉ GÉNIQUE
Parmi les génomes complètement séquencés, on compte ceux d'environ 5000 bactéries et plus de 240 archées. Chez les eucaryotes, on a séquencé la totalité du génome de près de 300 espèces et on dispose d'ébauches permanentes pour plus de 2600 espèces.
La plupart des génomes de bactéries contiennent entre 1 et 6 millions de paires de bases (Mb). Les génomes eucaryotes tendent à être plus imposants : 12 Mb pour une levure, au moins 100 Mb pour la plupart des animaux et végétaux, 165 Mb pour la drosophile, 3000 Mb dans le génome humain.
Globalement, chez les eucaryotes, la taille du génome ne donne pas d'information sur le phénotype de l'organisme. Il y a des plantes ou des amides qui auraient des milliards de paires de bases.
Quant au nombre de gènes : les bactéries non parasites et les archées possèdent généralement moins de gènes (1500 à 7500) que les eucaryotes (5000 à 45000). Les humains en ont entre 20000 et 21000.
Les séquences codantes des génomes des vertébrés sont plus "productives" car (par le biais des épissages extensifs différentiels) un seul gène peut engendrer plusieurs polypeptides. Un même gène peut être exprimé sous des centaines de formes. Ainsi chez les humains (mais pas que) le nombre de protéines codées excède largement le nombre de gènes.
LES EUCARYOTES MULTICELLULAIRES POSSÈDENT BEAUCOUP D'ADN NON CODANT
On met évidemment l'accent sur les parties du génome qui codent pour des protéines. Mais cela ne représente que 1,5 % du génome humain. Celui-ci se diviserait ainsi :
- 1,5 % → Exons, régions des gènes qui codent pour les protéines
- 5 % → Séquences régulatrices
- 20 % → Introns (segments non codants à l’intérieur des gènes)
- 15 % → ADN non codant unique (peut contenir des pseudogènes, des anciens gènes qui ne produisent plus de protéines fonctionnelles)
- 14 % → ADN répétitif non apparenté aux éléments transposables (dont 3 % de simples séquences comme les télomères qui servent de "marge" dans la réplication des gènes)
- 44 % → ADN répétitif comprenant des éléments transposables et des séquences apparentées (dont 10 % de séquences Alu et 17 % de séquences L1)
Cet ADN répétitif, qui compte donc pour plus de la moitié du génome, a dans le passé été considéré comme ADN poubelle. Mais on a remarqué par exemple qu'humains et rats possèdent plus de 500 régions d'ADN non codant portant des sections identiques, ce qui indique un niveau de conservation des séquences très élevé sur des temps très longs.
Une partie importante du génome est constituée d'éléments transposables, qui peuvent se copier-coller (les rétrotransposons) ou se couper-coller (les transposons) d'un endroit à un autre dans le génome. La très grande taille du génome de certains végétaux est attribuable aux rétrotransposons. Il est même possible que les rétrovirus descendent des rétrotransposons.
Chez les humains, c'est le cas des séquences Alu, qui représentent 10% du génome humain. D'une longueur d'environ 300 nucléotides, elles peuvent être répétées près de 1 million de fois. Elles ne codent pour aucune protéine mais certaines sont transposées en ARN.
De plus, 17 % du génome humain est composé d'un autre type de rétrotransposons, les séquences L1, bien plus longues (~6500 paires de bases). Elles auraient un rôle dans le développement des neurones.
Les 14% d'ADN répétitif non apparenté aux éléments transposables sont probablement des conséquences d'erreurs de réplication.
Note (c'est moi qui parle, pas le manuel) : il y a d'un côté la fonction adaptative d’un gène pour l’organisme (le phénotype et son efficacité pour la survie et la reproduction), et d'un autre la capacité d’un gène à se propager dans la population, ce qui est parfois indépendant, voire en conflit avec l’intérêt de l’organisme. En somme, on peut voir les gènes du génome humain comme des espèces en compétition/coopération pour la ressource qu'est l'espace dans le génome, c'est-à-dire la possibilité d'exister et de se répliquer.
LES DUPLICATIONS, RÉARRANGEMENTS ET LES MUTATIONS DE L'ADN CONTRIBUENT A L'ÉVOLUTION DU GÉNOME
La duplication des jeux complets de chromosomes. Un incident au cours de la méiose, comme l'incapacité de séparer les chromosomes homologues pendant la méiose I, peut donner naissance à un ou plusieurs jeux supplémentaires de chromosomes, ce qui entraine un état de polyploïdie. C'est souvent létal (surtout chez les animaux), mais ça peut être fonctionnel. Par exemple, un jeu de gène peut fournir les fonctions essentielles à l'organisme pendant que les autres peuvent diverger par mutation, divergences qui peuvent se retrouver dans la descendance, qui survivra si les mutations sont fonctionnelles. Ce serait fréquent chez les végétaux.
Les modifications de la structure chromosomique. En gros, l'inversion, la division ou l'association de chromosomes, ce qui fait changer le nombre de chromosomes et leur structure. C'est un processus crucial dans la spéciation, notamment dans la stérilité des hybrides.
La duplication et la divergence de régions d'ADN de la taille d'un gène. D'autres erreurs au cours de la méiose peuvent dupliquer des régions chromosomiques de la taille d'un gène. Ainsi une partie du brin matrice peut être copiée deux fois, ou pas du tout. Il est ainsi possible de remonter le temps en retraçant les duplications, divergences et erreurs de copie.
La duplication d'exons et le brassage d'exons. Les exons (codant pour une région ou fonctionnalité d'une protéine) peuvent aussi subir duplication ou délétion en cas d'enjambement inégal au cours de la méiose. Un bon nombre de gènes codant pour des protéines possèdent de multiples copies d'exons apparentés, qui sont probablement apparues par duplication suivie de divergences.
LA COMPARAISON DES SÉQUENCES GÉNOMIQUES FOURNIT DES INDICES SUR L'ÉVOLUTION ET LE DÉVELOPPEMENT
La comparaison des génomes, le relevé des gènes communs, permet de comprendre la proximité entre deux espèces et les évènements de l'évolution, aussi bien entre espèces éloignées qu'entre espèces proches. Par exemple, c'est très utile pour comprendre différences et proximité entre humains, chimpanzés et bonobos.
On peut travailler sur l'identification du rôle de certains gènes, par exemple le gène FOXP2, dont le produit régule les (autres) gènes intervenant dans la vocalisation chez les vertébrés. En retraçant le cheminement de ces gènes à travers les espèces, on peut retracer le cheminement des phénotypes.
Il s'agit aussi de comprendre le spectre de la variabilité génétique chez les humains, ce qui permet, entre autres choses, de retracer les déplacements de population au fil de l'évolution humaine.
Par exemple, on a pu découvrir que les gènes homéotiques sont globalement conservés entre la drosophile et les vertébrés, notamment la souris et l'humain. Ce sont les gènes qui commandent la forme des structures antérieures et postérieures de l'organisme. Ils sont placés dans le même ordre sur les chromosomes de la drosophile et de la souris, ordre qui reflète la disposition des structures sur l'animal. Ce sont d'autres gènes qui font que ces structures, placées similairement, sont de forme et fonction différentes.
Aucun commentaire:
Enregistrer un commentaire