Transcription de la vidéo
Dans cette vidéo, nous allons discuter de la structure du génome. Nous apprendrons à quoi font référence les termes gène et génome et ce qui constitue le génome d’un eucaryote et d’un procaryote. Nous en apprendrons également plus sur l’usage de l’ADN codant et non-codant et verrons leur lien avec les génomes eucaryotes et procaryotes.
En tant qu’êtres humains, on s’en sort pas trop mal. Nous pouvons marcher debout, saisir des choses avec nos pouces opposables et nous sommes également plutôt intelligents. Nous ne serions pas dans notre situation actuelle sans ces fonctionnalités. On doit tout cela à notre ADN, le matériel génétique présent dans la plupart des cellules de l’organisme qui donne les instructions pour faire de nous ce que nous sommes. Le génome correspond à l’ensemble du matériel génétique d’un organisme. C’est le manuel d’instructions de notre biologie qui ne doit pas être pris à la légère. Il peut nous procurer une vie longue et saine, ou il peut nous affecter avec une maladie. L’une des grandes quêtes de l’humanité est donc de comprendre un peu mieux tout ceci, c’est pourquoi le projet «génome humain» a vu le jour.
Le projet du génome humain fut un projet international visant à séquencer tout l’ADN à l’intérieur d’une cellule humaine. Il a commencé en 1990 et la version finale a été achevée en 2003. Au total, le coût a été estimé à environ 2,7 milliards de dollars. En 2016, le génome humain a pu être séquencé pour moins de 1 500 dollars, principalement grâce aux améliorations de la technologie de séquençage. En 2020, plus de 58 000 génomes ont été séquencés. C’est bien beau de parler de séquençage, mais qu'entendons-nous par séquençage exactement? Si nous prenions l’ADN de l’une de nos cellules, pour le déballer et l’étirer complètement, il ferait environ deux mètres de long, soit environ la taille de notre humain qui se tient ici.
Si nous zoomons, notre ADN est disposé en une double hélice comme indiqué ici, avec des nucléotides ou des paires de bases indiquées par ces cases colorées. Si nous zoomons davantage, nous pourrons voir la structure chimique de l’ADN. Ici, nous avons pu voir les deux brins d’ADN et le nucléotide, la sous-unité de base de l’ADN. Chaque nucléotide contient une base azotée – la guanine, la cytosine, l’adénine ou la thymine - qui peut s’associer à sa base complémentaire pour former une paire de bases. Donc, ce que l’on entend par séquençage du génome, c’est la détermination de la séquence ou l’ordre de ces nucléotides. Alors, si nous devions séquencer ce brin, nous aurions GAG, puis CGT, puis CAT. La séquence est écrite ici. Et puisque nous connaissons la séquence d’un brin, nous pouvons déduire la séquence de l’autre brin grâce aux règles d’appariement des bases complémentaires de l’ADN.
Voici donc une paire de bases, et cette séquence contient une, deux, trois, quatre, cinq, six, sept, huit, neuf paires de bases. Et voici un nucléotide. Si nous devions tous les compter, il y a en réalité 18 nucléotides sur les deux brins. Mais ceci prête à confusion puisqu’il y a neuf paires de bases. Donc, lorsque nous parlons de la taille d’une séquence en nucléotides, nous ne prenons en compte qu’un seul brin. De cette façon, nous pouvons dire que cette séquence a une longueur de neuf nucléotides, ce qui correspond au même nombre de paires de bases, et il n’y a pas de confusion. Ainsi, grâce au projet génome humain, nous avons pu déterminer que la séquence du génome humain était d’environ trois à 3,2 milliards de nucléotides. C’est un nombre énorme. Si la lecture d’un nucléotide prend une seconde, il faudrait environ 100 ans pour lire la séquence du génome humain.
Alors maintenant, vous comprendrez peut-être pourquoi il a fallu au monde entier plus de 10 ans pour séquencer le génome humain. Il est assez grand. Outre la taille du génome, nous en avons également appris davantage sur le nombre de gènes. Donc, zoomons à nouveau sur la même molécule d’ADN de taille humaine sur la gauche ici. Voici donc un segment d’ADN avec un gène au milieu. Ce gène peut avoir la fonction traditionnelle de coder pour une protéine à partir de l’ARNm produit. Mais un gène peut également être utilisé pour produire une molécule d’ARN non codant qui n’est pas traduite en protéine. Il en existe différents types, et ils ont souvent des fonctions spécifiques, certains étant impliqués dans la régulation de l’expression des gènes, par exemple. Nous en reparlerons plus tard.
Ainsi, la définition d’un gène a changé au fil des ans, passant de quelque chose qui codait pour une protéine à une définition plus générale prenant en compte ces gènes d’ARN non codant. Une bonne définition est qu’un gène est un segment d’ADN qui contient les informations nécessaires pour produire une unité fonctionnelle telle qu’une protéine ou une molécule d’ARN non codant, avec un rôle de régulation, par exemple. Maintenant que nous en savons plus sur le gène et le génome, nous discuterons ensuite des caractéristiques des génomes eucaryotes et procaryotes. Commençons par le génome eucaryote.
Précédemment, nous avons mentionné qu’il y avait environ deux mètres d’ADN à l’intérieur de la plupart des cellules du corps humain, représenté ici par cette fine ligne noire. On dirait qu’il s’agit d’une longue molécule continue d’ADN, mais ce n’est pas le cas. La plupart des cellules ont en fait 46 molécules d’ADN, qui sont extrêmement compactées dans des structures appelées chromosomes.
Nous avons 46 chromosomes, et ils sont numérotés en fonction de leur taille, le chromosome un étant plus grand que le chromosome deux, qui est plus grand que le chromosome trois, et ainsi de suite. Il y a aussi les chromosomes sexuels, X et Y, qui déterminent notre sexe biologique. Vous remarquerez également qu’il y a deux chromosomes pour chaque numéro de chromosomes, un en bleu et un en rose. Nous avons deux copies de chaque chromosome, une de notre mère biologique et une de notre père biologique. Comme nous avons deux chromosomes, nous sommes qualifiés de diploïdes.
Il est important de mentionner maintenant que les génomes sont souvent représentés comme étant haploïdes, c’est à dire avec un seul exemplaire pour chaque chromosome. Ainsi, les 3,0 à 3,2 milliards de nucléotides du génome humain correspondent en réalité à la taille d’un génome haploïde. La plupart de nos cellules sont diploïdes. Elles contiennent donc 6,0 à 6,4 milliards de nucléotides. Nous réduisons le génome à l’état haploïde puisqu’il est suffisant pour représenter l’ensemble complet des gènes qui existent chez l’Homme. De plus, c’est plus cohérent car de nombreux eucaryotes, en particulier les plantes, ont un nombre variable de copies des chromosomes. La fraise est octoploïde et possède huit copies pour chaque chromosome.
Comme nous l’avons mentionné, l’ADN est compacté pour former ces chromosomes. À quoi ressemblent-t-ils exactement? En démêlant un peu ce chromosome, nous voyons que l’ADN est étroitement enroulé autour de protéines spéciales appelées histones. Celles-ci permettent de compacter les plus de trois milliards de nucléotides d’ADN chez l’Homme. Cet ADN contient des gènes. Dans le génome humain, il y a entre 20 000 et 25 000 gènes codant pour des protéines, dont la taille moyenne est d’environ 10 000 nucléotides. En multipliant ces nombres, nous obtenons environ 200 à 250 millions de nucléotides, ce qui est largement inférieur aux plus de trois milliards de nucléotides du génome. Ceci est principalement dû à l’ADN non codant.
Donc, si nous changeons un peu de perspective et regardons notre ADN étiré comme ceci, nous pouvons voir qu’il n’y a pas beaucoup de gènes codant pour les protéines dans notre ADN. En fait, environ 99 pour cent de notre génome est constitué d’ADN non codant. Lors de sa découverte, beaucoup pensaient qu’il n’avait aucune fonction, c’est pourquoi on l’appelait ADN poubelle (ou «junk DNA» en anglais). Mais il n’a rien d’un déchet. Nous savons maintenant que l’ADN non codant a de multiples fonctions et peut fabriquer une variété de molécules d’ARN non codant, dont l’ARN structurel avec comme exemple l’ARN ribosomal ou ARNr, qui est un composant essentiel du ribosome, l’organite qui traduit les protéines à partir d’un transcrit d’ARNm.
L’ADN non codant peut également produire des ARN régulateurs comme les micro-ARN, qui joue un rôle important dans la régulation négative ou la diminution de l’expression de certains gènes. De nombreux micro-ARN seraient impliqués dans la maladie d’Alzheimer. Les deux tiers environ du génome humain sont constitués d’ADN répétitif, caractérisé par des séquences de nucléotides qui se répètent encore et encore. La mouche des fruits en est un exemple extrême, où la séquence AGAAG est répétée environ 100 000 fois.
En parlant du génome de la mouche des fruits, penchons-nous sur certaines de ses caractéristiques ainsi que celles d’autres eucaryotes. Le génome de la mouche des fruits possède environ 170 millions de nucléotides, et il contient environ 14 000 gènes codant pour des protéines, contrairement aux êtres humains, qui ont un génome d’environ trois à 3,2 milliards de nucléotides avec 20 à 25 000 gènes. Vous remarquerez que même si notre génome fait environ 20 fois la taille du génome de la mouche des fruits, nous n’avons pas 20 fois plus de gènes. Et si vous regardez le génome de la plante de riz, il a 470 millions de nucléotides, ce qui est environ 10 fois plus petit que notre génome, et contient environ le double du nombre de gènes codant pour des protéines.
Il n’y a donc pas vraiment de corrélation entre la taille du génome et le nombre de gènes codant pour des protéines. S’il y en avait une, alors nous devrions avoir plus de gènes que le riz, puisque notre génome est plus grand. Il est intéressant d’étudier le minuscule protozoaire Trichomonas vaginalis. Cet organisme a un tout petit génome comparable au génome de la mouche des fruits, mais possède un nombre surprenant de 60 000 gènes. Nous pouvons voir ici que la complexité d’un organisme n’est pas forcément en corrélation avec le nombre de gènes codant pour des protéines car, comparé à l’être humain, ce protozoaire relativement simple possède près de trois fois le nombre de gènes.
Maintenant que nous avons examiné le génome eucaryote en détail, portons notre attention sur le génome procaryote. Les procaryotes ont souvent un seul chromosome circulaire contenant leur ADN. Escherichia coli, ou E. coli, a un génome d’environ 4,6 millions de nucléotides, ce qui est environ 100 fois plus petit que notre génome. E. coli possède également environ 4 400 gènes codant pour des protéines, ce qui ne représente qu’environ un cinquième de notre génome. Cela fait beaucoup de gènes dans un petit espace. Le génome des procaryotes est souvent compacté avec très peu d’espace entre les gènes adjacents. Dans certains cas, les gènes sont tellement compactés qu’un seul nucléotide sépare deux gènes. Ainsi, contrairement aux eucaryotes qui sont essentiellement constitués d’ADN non codant, les génomes des procaryotes sont principalement constitués d’ADN codant.
Appliquons maintenant ce que nous avons appris en faisant une question pratique.
Quelle est la corrélation entre la complexité d’un organisme et leur nombre de gènes codant pour les protéines?
Avant de répondre à cette question, examinons quelques termes clés. Un gène est un segment d’ADN qui produit une unité fonctionnelle. Donc, si nous avions une section d’ADN contenant deux gènes, l’un d’eux pourrait produire une protéine, comme l’insuline par exemple impliquée dans la régulation de la glycémie, et l’autre une molécule d’ARN fonctionnelle, comme un type spécial d’ARN appelé microARN qui est impliqué dans la régulation de l’expression des gènes. Donc, il y a réellement deux types de gènes. Les gènes codants codent pour des protéines, et les gènes non codants ne codent pas pour des protéines, mais produisent plutôt une molécule d’ARN fonctionnelle.
Le génome est l’ensemble complet du matériel génétique d’un organisme. Et en étudiant les génomes de différents organismes, par exemple, le protozoaire Trichomonas vaginalis, la mouche des fruits et l’être humain, nous avons déterminé le nombre de gènes codant pour les protéines contenus dans l’organisme. Trichomonas vaginalis possède environ 60 000 gènes codant pour des protéines, la mouche des fruits en a environ 14 000 et l’Homme en a entre 20 et 25 000.
Puisque cette question nous interroge sur la complexité des organismes par rapport au nombre de gènes codant pour les protéines, classons-les. On peut dire que Trichomonas vaginalis est le moins complexe car il ne s’agit que d’une seule cellule, alors que les êtres humains sont les plus complexes car ils sont multicellulaires, et ont plus de types de tissus ainsi qu’un système nerveux plus avancé que notre mouche des fruits. Notre complexité relative ressemble donc à ceci. Cette question nous demande la corrélation, ou la relation, entre la complexité d’un organisme et leur nombre de gènes codant pour des protéines. Donc, que pouvons-nous dire du nombre de gènes codant pour des protéines lorsque la complexité augmente?
Eh bien, si nous regardons la mouche des fruits et l’être humain, nous pouvons voir que plus la complexité augmente, plus le nombre de gènes codant pour des protéines augmente également. Mais si nous regardons Trichomonas vaginalis et la mouche des fruits, c’est le contraire. À mesure que la complexité augmente, le nombre de gènes codant pour des protéines diminue. Nous ne voyons donc aucune relation cohérente entre les organismes, ce qui signifie qu’il n’y a pas de corrélation entre la complexité et le nombre de gènes codant pour des protéines.
Passons maintenant en revue certains des points clés que nous avons appris dans cette vidéo. Le génome est l’ensemble complet du matériel génétique d’un organisme. Le génome contient de nombreux gènes. Un gène est un segment d’ADN qui produit une unité fonctionnelle, telle qu’une protéine ou un ARN fonctionnel. Les génomes eucaryotes sont constitués d’ADN codant, qui se compose de gènes codant pour des protéines, et d’ADN non codant, qui contient de l’ADN ne codant pas pour des protéines. La majeure partie de l’ADN chez l’Homme est de l’ADN non codant qui est constitué de séquences répétées. Les eucaryotes ont souvent un génome plus grand que celui des procaryotes, mais leurs gènes sont souvent moins condensés.