Chronologie du séquençage du génome humain
1953
James Watson et Francis Crick découvrent la structure en double hélice de l’ADN
1972
Paul Berg et son équipe créent la première molécule recombinante de l’ADN
1977
Allan Maxam, Walter Gilbert et Frédéric Sanger développent les méthodes de séquençage d’ADN
1980
David Botstein, Ronald Davis, Mark Skolnick et Ray White proposent une méthode en utilisant les RFLP [1] pour cartographier le génome humain
1982
Akiyoshi Wada propose le séquençage automatisé
1984
Charles Cantor et David Schwartz développent l’électrophorèse en champ pulsé
Des scientifiques de MRC [2] déchiffrent la séquence d’ADN du virus Epstein-Barr
1985
Discussion sur la faisabilité du séquençage du génome humain
Développement de la technique PCR par Kary Mullis et son équipe
1986
Sydney Brenner de MRC incite l’Union Européenne à fair un programme commun pour le séquençage et la cartographie du génome humain.
Début de discussions sur le séquençage du génome humain
Leroy Hood et Lloyd Smith présentent la première machine de séquençage automatisée.
Début d’étude du génome humain à la DOE par Charles DeLisi
1987
Walter Gilbert annonce le début de la Genome Corp. Qui a pour but de séquencer et de faire un copyright du génome humain
Début de l’initiative de la DOE (Department Of Energy)
Développement des YACs pour le clonage
Publication de la première carte génétique avec 403 marqueurs
Les scientifiques DuPont développent un système rapide de séquençage utilisant des didéoxynucléotides fluorescents
L’Applied Biosystems Inc.met la première machine automatique de séquençage sur le marché
1988
La NRC (National Research Council) adopte le projet de séquençage du génome humain (HGP)
La NIH (National Institutes of Health) décide de jouer un rôle important dans le HGP
La NIH et la DOE décident de coopérer ensemble pour la HGP
1989 Olson, Hood et Botstein définissent une nouvelle stratégie de cartographie utilisant les STS (Sequence Tagged Site)
La NIH entre dans la NCHGR (National Center for Human Genome Research)
1990
Développement de l’électrophorèse capillaire par trois groupes de recherche
La NIH et la DOE publient un plan de 5 ans dont les buts sont de cartographier génétiquement tout le génome, de faire une carte physique avec des marqueurs tous les 100kb et de séquencer un groupe de 20 Mb d’ADN chez des organismes modèles
Tests menés par la NIH sur 4 organismes modèles : Mycoplasma capricolum, Escherichia coli, Caenorhabditis elegans et Saccharomyces cerevisiae.
1 octobre : début du HGP
Publication de l’algorithme BLAST pour l’alignement des séquences
1991
J. Craig Venter (NIH) annonce une stratégie utilisant les EST pour trouver les gènes exprimés
Début du projet de séquençage du génome du riz japonais
Développement du programme GRAIL pour trouver les gènes
1992
Watson démissionne de la NCHGR
Venter quitte la NIH pour créer la TIGR (The Institut for Genomic Research)
La Wellcome Trust entre dans la HGP en apportant $95 millions
Développement des BACs pour le clonage
Des équipes françaises et américaines terminent la première carte physique de chromosomes : David Page et son équipe cartographient le chromosome Y, Daniel Cohen et son équipe le chromosome 21
Débats entre la NIH et la DOE à propos du partage des informations et des sources
Des équipes françaises et américaines termeinent les cartes génétiques de la souris et de l’homme
1993
Francis Collins est nommé directeur de la NCHGR
Publication par la NIH et la DOE d’un nouveau plan pour la période 1993-98 dont les buts sont de séquencer 80 Mb d’ADN et de compléter le génome humain pour 2005
Création du Sanger Centre qui est un des laboratoires majeurs de séquençage du consortium international
Fin des désaccords entre la NIH et la DOE lors du transfert de la banque de données de la GenBank de Los Alamos à NCBI
1994
Publication par Jeffrey Murray, Cohen et leurs collègues d’une carte génétique complètedu génome humain
1995
Amélioration des teintures de séquençage et développement de poltmérases thermostables
Publication par Venter, Claire Fraser et Hamilton Smith de la première séquence d’un organisme vivant : Haemophilus influenzae (1.8 Mb)
Aides financières du gouvernement japonais ($15.9 millions sur 5 ans) pour des groupes de recherche
Publication de séquences d’ADNc
Publication d’une carte physique du génome humain et contenant 15000 marqueurs
1996
Décision de rendre public les données sur les séquences
La NIH finance 6 groupes de recherche pour tenter un séquençage à grande échelle du génome humain
La DOE initie et finance ($5 millions) 6 projets pilotes pour séquencer les extrêmités des clones BACs
La séquence complète du génome de Saccharomyces cerevisiae est rendue publique
Yoshihide Hayashizaki et son équipe achèvent le premier ensemble d’ADNc de la souris
1997
La NCHGR devient la National Human Genome Research Institute et la DOE crée la Joint Genome Institute
Fred Blattner, Guy Plunkett et leurs équipes terminent la séquence d’ADN d’Escherichia coli (5 Mb)
Utilisation de MegaBACE, une machine de séquençage capillaire
1998
La NIH annonce un nouveau projet pour trouver les SNP
Etablissement à Tsukuba (Japon) de lignes de conduite pour une collaboration internationale pour le séquençage du riz
Publication du programme phred qui permet d’interpréter automatiquement les données séquentielles
PE Biosystems Inc. introduit la PE Prism 3700, une machine de séquençage capillaire
Venter annonce un nouvel ordinateur, Celera, et déclare que celui-ci séquencera le génome humain en 3 ans pour $300 millions
En réponse, la Wellcome Trust double ses efforts en aide financière pour la HGP en donnant $330 millions
La NIH et la DOE lancent la HGP dans le projet d’établir pour 2001 un "brouillon de travail" du génome humain. Elles avancent la date de la fin du séquençage à 2003
Fin du séquençage de C. elegans
1999
La date limite du "brouillon de travail" est de nouveau avancée au printemps 2000
La NIH lance le projet de séquencer le génome de la souris. La NIH fait don de $130 miliions sur 3 ans
Des chercheurs du Royaume-Uni, du Japon et des Etats-Unis terminent le séquençage du chromosome humain 22
2000
Celera séquence le génome de la Drosophile (180 Mb). Validation de la méthode de séquençage shotgun de Venter
Les plans de collaboration entre la HGP et Celera sont remis en cause
Publication de la séquence du chromosome 21
Finalement, la HGP et Celera annoncent leur union pour le travail de séquençage du génome humain
La DOE et la MRC lancent le projet de séquençage du génome de Fugu rubripes pour mars 2001
Séquençage complet d’Arabidopsis thaliana (125 Mb)
2001
La HGP publie son ?brouillon’ du génome humain dans "NATURE" et Celera dans "SCIENCE"
Les recherches ont montré que l’homme ne possède que 32 000 gènes, seulement le double du nombre de gènes du nématode Caenorhabditis elegans. La firme Celera a déterminé 26 383 gènes ainsi que 12 000 autres potentiels, tandis que le consortium public arrive à 24 500 gènes avec 5000 autres gènes attendus. Ceci est bien loin des 100 000 gènes précédemment calculés dans les années 1980.
Il se peut que dans certains cas, des gènes aient été sous évalués. D’une part, car les programmes de prédiction de gènes travaillent soit en recherchant des séquences similaires à des gènes déjà connus, soit en cernant des séquences qui comportent les éloquents débuts et fin de gènes. Les gènes qui sont rarement actifs ne sont pas détectés. Il y a beaucoup d’incertitude sur cette question car il n’y a pas de réelle voie pour connaître le nombre exact de gènes.
En comparant le génome humain avec des séquences exprimées ou avec d’autres données génomiques ou protéiques, les chercheurs ont révélé que les gènes humains font « plus de travail » que les gènes d’autres organismes. Cependant, chaque région codante d’un gène a à peu près la même taille que ce soit chez le vers, la mouche ou l’Homme. Les gènes humains assemblent ces régions en de surprenantes combinaisons.
On a longtemps cru qu’un gène spécifiait une protéine ; en fait, chaque gène humain peut donner naissance à trois protéines en utilisant des assemblages différents de ses régions codantes : les exons. Cette théorie semble se confirmer en ce qui concerne les protéines : l’homme n’aurait pas plus de types de protéines différents, il les utiliserait avec plus de créativité.
Une autre découverte est celle de l’architecture des chromosomes, et particulièrement la distribution des polymorphismes [3] à nucléotide simple (SNP), lieux du génome où une certaine base varie selon les individus.Dans certaines régions, la densité des SNP est plus importante que ce qu’on attendait, pour d’autres régions, elle est plus faible... Quelque chose que nous ignorons encore détermine l’accumulation de SNP dans certaines régions.
La firme Celera a calculé que seulement 1.1% du génome code des protéines, ce chiffre est de 1.5% pour la recherche publique. Le fait que les gènes humains contiennent des séquences intermédiaires, allant parfois jusqu’à des centaines de bases, entre les exons complique l’identification des gènes. De plus, les gènes peuvent être séparés de longues régions d’ADN non codant « l’ADN poubelle ».
Celera estime que 40 à 48% du génome n’est en fait que des séquences répétées. Les transposons, morceaux d’ADN qui ne semble pas avoir de rôle particulier si ce n’est de faire des copies d’eux-mêmes et de se déplacer de part en part le long des chromosomes. Ils ne contiennent que les gènes qui servent à la prolifération de ces transposons.
Juillet 2003
Source : INRA
[1] Restriction Fragment Length Polymorphisms
[2] Medical Research Center
[3] formes diverses au sein d’une même espèce, d’une même variété