Présentation des mémoires de terminologie
Visite guidée de la fiche de terminologie
Le séquençage du génome humain
Français,anglaisPerrine Cartier
Maitrise LEA - 2002 / 2003 - Paris III
Responsable : Loïc Depecker
Sommaire
Remerciements
Introduction
Termes traités dans ce mémoire
Bibliographie
J'exprime ma reconnaissance à Pauline Rimmelé, amie étudiante en génétique, qui m'a apporté une aide précieuse dans la réalisation de ce mémoire. Sans son encouragement, je n'aurais probablement pas osé aborder ce sujet auquel je porte beaucoup d'intérêt.
J'adresse également mes remerciements au Docteur Emmanuèle Mouchel-Vielh qui a eu la gentillesse de me recevoir et de me consacrer un peu de son temps pour me faire partager ses connaissances de la génétique et répondre à mes questions, et a accepté de relire et valider le contenu de mon mémoire.
INTRODUCTION GÉNÉRALE
Il y a cinquante ans, au terme d'une incroyable compétition, la structure en double hélice de l'ADN fut découverte par deux biologistes, Watson et Crick, leur valant le prix Nobel en 1962. Bien que l'ADN ait été identifié au 18e siècle, ce n'est qu'au 20e siècle qu'on lui prêta une plus grande attention, après la mise en évidence de son implication dans la transmission des caractères héréditaires par l'intermédiaire des protéines.
A la fin de l'année 1951, Watson et Crick seront les premiers à présenter un modèle d'ADN qui, d'après les premiers clichés d'ADN au rayon X, présenterait une structure hélicoïdale. Mais leur thèse sera réfutée et débutera un chemin semé d'embûches jusqu'à ce que des clichés de plus en plus précis révèlent que les deux brins de l'hélice sont maintenus ensemble parce que certaines bases forment des paires. La double hélice serait donc formée de deux brins complémentaires. « Cette structure donne la clé d'un principe de réplication merveilleusement efficace et élégant. »
Une nouvelle ère venait de s'ouvrir, qui sera le point de départ du génie génétique et d'une nouvelle médecine. On sait maintenant que les trois fonctions essentielles à la vie, autonomie de l'organisme, sa reproduction et sa survie en fabricant des protéines, sont assurées par un minuscule filament de 2nm situé au cSur du noyau des cellules : l'ADN. C'est une molécule bicaténaire (deux brins) présente dans chacune de nos cellules qui, associée à des protéines, les histones, forme chacun de nos chromosomes. C'est le support universel de l'information génétique.
L'organisation du matériel chromosomique est maintenant bien connue, tout comme les mécanismes cellulaires assurant la transmission du patrimoine génétique lors de la division cellulaire. Un nouveau défi est alors né : décoder les clés du langage du génome humain. On a en effet très vite compris l'importance de localiser et déterminer le rôle de chacun de nos gènes afin de pouvoir étudier le fonctionnement de l'organisme humain, et en particulier le mécanisme de mutation à l'origine de maladies génétiques. En cartographiant le génome, on espère pouvoir dépister ces maladies et les traiter par thérapie génique que l'on pourra alors mettre au point. Au début des années 1990, la communauté scientifique internationale s'est fixé pour objectif le séquençage complet du génome humain 23 paires de chromosomes, 3,5 milliards de nucléotides, pour le début du troisième millénaire. En raison de la taille de ce génome, les grands centres de séquençage financés par des moyens publics ont convenu de diviser le travail et de se charger individuellement de régions chromosomiques ou de chromosomes particuliers. Chaque centre s'engage à déposer les données dans des bases de données publiques dès leur obtention. C'est ainsi qu'en 2001 le consortium public américain International Human Genome et la société privée Celera Genomic dévoilent la séquence presque complète du patrimoine génétique humain. Mais les résultats sont encore incomplets et des incertitudes persistent quant au nombre de gènes révélés.
Séquencer, c'est déterminer l'ordre des quatre constituants élémentaires de l'ADN, les nucléotides (A, T, C et G). Le principe utilisé consiste à réaliser à partir d'un point fixe, des copies partielles de la molécule, interrompues au hasard. On synthétise toutes les copies intermédiaires possibles à partir du point fixe puis on les sépare selon leur taille par une migration électrophorétique dans un gel poreux. Ces gels permettent de séparer deux intermédiaires consécutifs qui ont une différence de taille d'un seul nucléotide. Si l'on peut identifier le nucléotide du point d'interruption sur chacune des copies partielles, de la plus petite à la plus grande, il devient alors possible de reconstituer la succession des nucléotides tout au long de la copie. Dans la pratique, pour identifier les nucléotides terminaux, l'ADN à séquencer est recopié à l'aide d'un composé chimique qui provoquera l'interruption au hasard, mais systématiquement à la suite d'un seul des quatre nucléotides A, G, C ou T. on fera donc en parallèle quatre séries de copies. Dans chaque série, toutes les copies seront interrompues derrière un seul type de nucléotide, par exemple toutes les copies intermédiaires d'une série seront terminées par un A. le composé provoquant l'interruption est fluorescent pour pouvoir être détecté automatiquement à l'aide d'un système optique qui balaye le bas du gel d'électrophorèse dans les séquenceurs automatiques. Le signal obtenu est interprété par un programme informatique qui reconstituera la séquence originale du fragment d'ADN analysé. Un séquenceur automatique peut par opération unitaire, ou lecture, déterminer l'enchaînement de 500 à 1000 nucléotides. Les lectures sont raccordées les une aux autres grâce à des lectures redondantes : en procédant à la lecture d'un grand nombre de segments de petite taille on obtiendra des séquences qui se recouvrent en partie.
La séquence du génome humain permettra en premier lieu de procéder à l'identification et à l'inventaire complet des gènes de l'homme. Les estimations les plus récentes faites au Génoscope donnent un nombre total de gènes humains compris entre 30000 et 35000, soit un nombre bien inférieur aux estimations antérieures. Plusieurs milliers de gènes responsables de maladie génétique pourront ainsi être trouvés plus rapidement grâce à la séquence du génome. La connaissance de ces gènes permet de mettre au point un diagnostic à partir de l'ADN. Pour les maladies les plus graves, le diagnostic génétique peut être pratiqué avant la naissance dans les familles à risque. L'identification du gène responsable permet aussi de comprendre le mécanisme physiologique de l'apparition de maladie et donc, dans certains cas, d'explorer de nouvelles possibilités thérapeutiques.
Le séquençage complet du génome humain a été terminé cette année mais son interprétation devrait donner du fil à retordre aux spécialistes pendant encore quelques temps.
En réalisant ce dictionnaire terminologique sur le séquençage du génome humain, j'ai choisi de traiter un sujet très actuel qui fait l'objet de nombreux articles, sur toutes sortes de supports : journaux grand public, presse spécialisée, sites Internet& C'est donc un sujet très spécialisé duquel nous avons tous pu entendre parler, car il nous concerne tous et revêt un caractère extraordinaire, qui a permis sa diffusion au-delà du milieu scientifique. C'est pour cela qu'il m'a paru intéressant de constituer un dictionnaire sur ce thème qui intéresse tout lectorat, y compris des non-spécialistes. Il pourrait aider à la compréhension de tels articles (presse non-spécialisée) en explicitant les termes principaux nécessaires pour aborder le domaine de la génétique. C'était de plus, pour la première fois dans mon cursus universitaire, l'occasion de mettre à profit mes connaissances de terminale scientifique, auxquelles j'ai eu très peu l'occasion de faire appel, et mon grand intérêt pour ce domaine, en particulier la biologie humaine.
J'ai donc destiné ce travail à un lectorat très large, au grand public, pour lui permettre de décrypter ce qu'il lit, lui donner quelques explications supplémentaires qui sont parfois éludées dans les articles, et non à des spécialistes, qui disposent déjà des clés suffisantes pour accéder aux articles scientifiques. Le thème est fort intéressant et peut être compris par tous, à condition d'apporter quelques explications complémentaires. Au premier abord, le langage utilisé peut sembler très technique, c'est le cas, mais il n'est pas inabordable. J'ai en particulier remarqué qu'il existe une profusion d'articles accessibles au grand public, du fait qu'ils y intègrent des explications sur le fonctionnement moléculaire de base. De plus, beaucoup d'articles, en particulier sur Internet, sont publiés en anglais. Il peut donc s'avérer utile de disposer d'un dictionnaire français-anglais pour comprendre les termes techniques, qui du fait de leur grande technicité n'apparaissent dans aucun dictionnaire. C'est une clé pour toute personne recherchant des informations supplémentaires sur tout support disponible.
Pour ce lectorat, j'ai donc dû rédiger des définitions d'un niveau pas trop élevé, le but n'étant pas de devoir s'informer dans d'autres documents pour les comprendre, ou de devoir aller chercher le vocabulaire inconnu utilisé dans les définitions (bien qu'il y ait forcément des concepts employés dans les définitions qui fassent à leur tour l'objet d'une définition, car il est indispensable d'utiliser les termes appropriés dans un contexte particulier, de ne pas trop simplifier). J'ai essayé de faire des définitions compréhensibles, qui apportent des informations, mais en m'obligeant à utiliser les termes spécifiques. Je n'ai pas voulu trop entrer dans les détails dans les définitions. Mon objectif était de répondre aux questions suivantes : quelle est la nature du concept traité, à quoi ça sert, où le trouve-t-on ? Pour les personnes désirant des informations complémentaires, des notes techniques complètent les définitions.
Au premier abord, il semble facile d'établir un corpus destiné au grand public, mais cela oblige à ne pas trop aller dans les détails et à faire un tri rigoureux parmi la profusion de termes utilisés. Le découpage des domaines a donc été difficile. Je souhaitais couvrir l'ensemble du sujet, en ne sélectionnant que les termes essentiels. Or, lorsque l'on commence à se documenter sur le séquençage du génome humain, les sources d'informations sont nombreuses et les sujets connexes abondent, tous aussi intéressant les uns que les autres. Après avoir regarder un grand nombre de documents, je me suis fait une idée des domaines abordés. C'est alors que j'ai dû poser les limites des domaines traités : le séquençage, c'est-à-dire les méthodes et outils utilisés, ainsi qu'un rappel inévitable du vocabulaire fondamental, tel que l'organisation et le fonctionnement du matériel chromosomique et les mécanismes cellulaires de base, tout en donnant une idée des applications qui découlent d'une connaissance toujours plus grande du génome humain. Mais ce ne sont que les applications principales, la liste n'est pas exhaustive, car elles sont très nombreuses. Au cours de mes nombreuses lectures je me suis rendu compte que les termes importants ne manquaient pas, et, contrairement à ce que je pensais avant de commencer ce travail, la difficulté consisterait à réduire le nombre de concepts retenus, et non le contraire. Je devais éviter de trop entrer dans le détail, sans pour autant passer à côté des concepts essentiels. Or tous les concepts semblaient importants et il est difficile pour un non-spécialiste de prendre la décision de supprimer un concept. C'est là que l'aide d'une personne qualifiée dans le domaine est importante. J'ai eu recours aux connaissances d'une amie étudiante en génétique qui me fut d'une aide précieuse dans le processus de sélection des quatre-vingts concepts d'une part (trier les concepts trouvés, en ajouter&) et pour me fournir de la documentation (ouvrages spécialisés, cours de l'université&) et m'aider dans la rédaction des définitions d'autre part. Au tout début de ma réflexion sur les sujets possibles j'avais besoin de son avis pour savoir si ce projet était réalisable, si elle m'apporterait son concours quant aux recherches, à la rédaction, aux vérifications, et à recherche d'un valideur.
J'ai en premier lieu effectuer un inventaire des concepts utilisés en recourant à toutes sortes de supports disponibles. Tout d'abord Internet, une source d'informations très riche pour ce type de recherches : en effet des articles sont publiés très régulièrement et sont disponibles sur Internet. Cet outil offre la possibilité de consulter les sites de tous les organismes de recherche sur le génome (en français et en anglais), on peut y trouver de nombreux glossaires, lire les articles de nombreux journaux, spécialisés ou non. Il me restait également quelques ouvrages de génétique de terminale, qui ont l'avantage d'être d'un niveau correct mais pas trop spécialisés, sur la génétique en générale, avec des explications des termes de base. Mon amie m'a également procuré d'autres ouvrages plus complets, traitant entre autres du séquençage, des méthodes et outils et donnant un nouvel éclairage sur des termes plus basiques. Mais les explications sont parfois trop techniques. On y trouve beaucoup d'informations mais j'ai eu parfois besoin d'aide pour bien les comprendre et pour pouvoir simplifier les informations. Et pour finir, j'ai consulté la presse. Sachant que je devais réaliser mon mémoire, je surveillais de très près la presse, en particulier la presse spécialisée telle que le journal « Science & Vie », dont le lectorat est celui que je cible pour ce dictionnaire : les articles sont très complets mais accessibles à un grand lectorat. J'ai eu la chance qu'un numéro comportant un dossier spécial ADN paraisse récemment. J'y ai souvent eu recours pour trouver des explications plus simples que dans les manuels classiques, dans un langage moins académique, ainsi que pour trouver des contextes. Mais d'autres journaux abordent également ce sujet, sous un autre angle : j'ai trouvé un article du « Monde diplomatique » intitulé « La bataille du génome humain » rédigé par John Sulston, prix Nobel de médecine 2002. Il est plutôt centré sur les implications éthiques et l'octroi de brevets pour les séquences découvertes. J'ai alors constaté qu'un grand effort était fait pour rendre ce domaine accessible à tous : certains organismes spécialistes de séquençage tels que le Génoscope ont des sites très bien faits, offrant de nombreuses explications, destinés à tous les publics.
Pour savoir quels concepts retenir, j'ai tenu compte de divers critères : apparitions redondantes dans un grand nombre de textes, mes propres connaissances du sujet, me permettant d'évaluer si certains concepts sont incontournables, repérage des mots-clé. Plus le concours de mon amie pour compléter la liste au fur et à mesure. J'ai donc finalement limité mes domaines de la manière suivante :
-constituants et mécanismes chromosomiques de base
-techniques de séquençage
-outils principaux
-grandes étapes
-applications
ces domaines permettent de couvrir tout le sujet: séquençage du génome humain : techniques et applications. Le but est de comprendre le mécanisme dans l'ensemble, c'est-à-dire qu'il n'y ait pas de « trous » dans le corpus, que l'on puisse comprendre un article dans son ensemble. Pour comprendre le séquençage et s'y intéresser, il faut connaître ses outils, comment ils s'utilisent et leurs relations les uns avec les autres, les étapes du séquençage, à quoi elles mènent. Mais pour bien comprendre cela il faut connaître les notions de base en génétique. En revanche tout connaître dans le détail n'entrait pas dans mes objectifs, il n'est pas nécessaire de trop approfondir pour comprendre un article généraliste. Par exemple, je n'ai pas jugé utile de détailler tous les types de gènes ou d'ARN, même s'ils sont importants en génétique. J'ai préféré ne me consacrer qu'à ceux qui interviennent dans le séquençage. J'ai eu également l'occasion de compléter ma liste avec mon valideur, qui a une vue d'ensemble du domaine et sait quels concepts sont incontournables.
Mon corpus est caractérisé par un grand recours à Internet : c'est un sujet actuel et cet outil offre un éventail d'informations très fiables car provenant des organismes concernés (Centre National de Séquençage, Celera Genomic&) accessibles à tous niveaux. On peut également trouver sur Internet des articles plus complets et plus spécialisés pour trouver des informations complémentaires, dans plusieurs langues, ainsi que des glossaires. Ce sont en général des articles récents puisque le séquençage a connu un essor important ces dernières années. J'ai également trouvé beaucoup d'informations dans les journaux qui offre un point de vue plus vivant et des bibliographies fort utiles. Il est aisé de trouver des informations fiables dans ce domaine.
La rédaction des fiches s'est faite au fur et à mesure que j'obtenais mes informations. J'ai fait des recherches de mon côté avec les outils dont je disposais, puis, lorsque mon travail s'est un peu plus organisé, je rencontrais régulièrement mon amie étudiante en génétique pour faire le point, vérifier ce que j'avais fait, remodeler mes phrases ou les simplifier (car il je trouvais des informations pertinentes, mais il m'était souvent difficile de les reformuler plus simplement, ne sachant pas toujours ce qui est essentiel et ce que tout veut dire). Je pouvais donc avancer seul et elle me complétait pour les points plus sensibles. J'ai commencé par les définitions, pour mieux comprendre le sujet, son organisation, avant de faire les relations. La constitution des arborescences m'a posé quelques problèmes : en effet, lorsqu'il s'agissait de relations partitives (organisation du matériel chromosomique par exemple) c'est facile à représenter. Mais les différents mécanismes et processus sont difficiles à incorporer.
Le thème du séquençage regroupe des concepts de toutes sortes, souvent des unités très longues. Mais il était très important de relever les unités dans leur intégralité, car j'ai souvent des unités très proches qui ne diffèrent que d'un adjectif (notamment les adjectifs « cellulaire » et « moléculaire » sont redondants et primordiaux en biologie. On trouve énormément de sigles, souvent formés à partir du terme anglais, qui sont en général utilisés, plus que le formes complètes, ainsi que des termes en anglais, dont la traduction en français existe mais est moins utilisée.
Pour trouver les équivalents en anglais, j'ai cherché des textes et glossaires (grâce à la définition, il est plus facile de trouver l'équivalent) en anglais, où j'ai trouvé le vocabulaire, souvent très proche du français.
Lorsque toutes mes fiches ont été complétées, j'ai rencontré une spécialiste de génétique, maître de conférence à Jussieu, qui a accepté de me recevoir. Mon amie m'avais donné les coordonnées d'une première personne qui, ne s'estimant pas spécialiste de séquençage m'a mise en relation avec elle. Elle a tout de suite accepté. Elle a relu mon mémoire, proposé des corrections, apporté des compléments, m'a fourni d'autres documents et a répondu à mes questions. Elle me fut d'une grande aide.
C'est donc un sujet très intéressant auquel je me suis attelée. Je ne regrette pas d'avoir fait ce choix et me rends compte de l'utilité de ce mémoire, car je rencontre souvent des articles qui font référence à ce domaine, les applications sont multiples et les termes de base de la génétique apparaissent régulièrement dans la presse dans des sujets très actuels tels que le clonage, les organismes transgéniques& Bien plus qu'un sujet d'actualité, c'est un sujet d'avenir !
En réalisant ce dictionnaire terminologique sur le séquençage du génome humain, j'ai choisi de traiter un sujet très actuel qui fait l'objet de nombreux articles, sur toutes sortes de supports : journaux grand public, presse spécialisée, sites Internet& C'est donc un sujet très spécialisé duquel nous avons tous pu entendre parler, car il nous concerne tous et revêt un caractère extraordinaire, qui a permis sa diffusion au-delà du milieu scientifique. C'est pour cela qu'il m'a paru intéressant de constituer un dictionnaire sur ce thème qui intéresse tout lectorat, y compris des non-spécialistes. Il pourrait aider à la compréhension de tels articles (presse non-spécialisée) en explicitant les termes principaux nécessaires pour aborder le domaine de la génétique. C'était de plus, pour la première fois dans mon cursus universitaire, l'occasion de mettre à profit mes connaissances de terminale scientifique, auxquelles j'ai eu très peu l'occasion de faire appel, et mon grand intérêt pour ce domaine, en particulier la biologie humaine.
J'ai donc destiné ce travail à un lectorat très large, au grand public, pour lui permettre de décrypter ce qu'il lit, lui donner quelques explications supplémentaires qui sont parfois éludées dans les articles, et non à des spécialistes, qui disposent déjà des clés suffisantes pour accéder aux articles scientifiques. Le thème est fort intéressant et peut être compris par tous, à condition d'apporter quelques explications complémentaires. Au premier abord, le langage utilisé peut sembler très technique, c'est le cas, mais il n'est pas inabordable. J'ai en particulier remarqué qu'il existe une profusion d'articles accessibles au grand public, du fait qu'ils y intègrent des explications sur le fonctionnement moléculaire de base. De plus, beaucoup d'articles, en particulier sur Internet, sont publiés en anglais. Il peut donc s'avérer utile de disposer d'un dictionnaire français-anglais pour comprendre les termes techniques, qui du fait de leur grande technicité n'apparaissent dans aucun dictionnaire. C'est une clé pour toute personne recherchant des informations supplémentaires sur tout support disponible.
Pour ce lectorat, j'ai donc dû rédiger des définitions d'un niveau pas trop élevé, le but n'étant pas de devoir s'informer dans d'autres documents pour les comprendre, ou de devoir aller chercher le vocabulaire inconnu utilisé dans les définitions (bien qu'il y ait forcément des concepts employés dans les définitions qui fassent à leur tour l'objet d'une définition, car il est indispensable d'utiliser les termes appropriés dans un contexte particulier, de ne pas trop simplifier). J'ai essayé de faire des définitions compréhensibles, qui apportent des informations, mais en m'obligeant à utiliser les termes spécifiques. Je n'ai pas voulu trop entrer dans les détails dans les définitions. Mon objectif était de répondre aux questions suivantes : quelle est la nature du concept traité, à quoi ça sert, où le trouve-t-on ? Pour les personnes désirant des informations complémentaires, des notes techniques complètent les définitions.
Au premier abord, il semble facile d'établir un corpus destiné au grand public, mais cela oblige à ne pas trop aller dans les détails et à faire un tri rigoureux parmi la profusion de termes utilisés. Le découpage des domaines a donc été difficile. Je souhaitais couvrir l'ensemble du sujet, en ne sélectionnant que les termes essentiels. Or, lorsque l'on commence à se documenter sur le séquençage du génome humain, les sources d'informations sont nombreuses et les sujets connexes abondent, tous aussi intéressant les uns que les autres. Après avoir regarder un grand nombre de documents, je me suis fait une idée des domaines abordés. C'est alors que j'ai dû poser les limites des domaines traités : le séquençage, c'est-à-dire les méthodes et outils utilisés, ainsi qu'un rappel inévitable du vocabulaire fondamental, tel que l'organisation et le fonctionnement du matériel chromosomique et les mécanismes cellulaires de base, tout en donnant une idée des applications qui découlent d'une connaissance toujours plus grande du génome humain. Mais ce ne sont que les applications principales, la liste n'est pas exhaustive, car elles sont très nombreuses. Au cours de mes nombreuses lectures je me suis rendu compte que les termes importants ne manquaient pas, et, contrairement à ce que je pensais avant de commencer ce travail, la difficulté consisterait à réduire le nombre de concepts retenus, et non le contraire. Je devais éviter de trop entrer dans le détail, sans pour autant passer à côté des concepts essentiels. Or tous les concepts semblaient importants et il est difficile pour un non-spécialiste de prendre la décision de supprimer un concept. C'est là que l'aide d'une personne qualifiée dans le domaine est importante. J'ai eu recours aux connaissances d'une amie étudiante en génétique qui me fut d'une aide précieuse dans le processus de sélection des quatre-vingts concepts d'une part (trier les concepts trouvés, en ajouter&) et pour me fournir de la documentation (ouvrages spécialisés, cours de l'université&) et m'aider dans la rédaction des définitions d'autre part. Au tout début de ma réflexion sur les sujets possibles j'avais besoin de son avis pour savoir si ce projet était réalisable, si elle m'apporterait son concours quant aux recherches, à la rédaction, aux vérifications, et à recherche d'un valideur.
J'ai en premier lieu effectuer un inventaire des concepts utilisés en recourant à toutes sortes de supports disponibles. Tout d'abord Internet, une source d'informations très riche pour ce type de recherches : en effet des articles sont publiés très régulièrement et sont disponibles sur Internet. Cet outil offre la possibilité de consulter les sites de tous les organismes de recherche sur le génome (en français et en anglais), on peut y trouver de nombreux glossaires, lire les articles de nombreux journaux, spécialisés ou non. Il me restait également quelques ouvrages de génétique de terminale, qui ont l'avantage d'être d'un niveau correct mais pas trop spécialisés, sur la génétique en générale, avec des explications des termes de base. Mon amie m'a également procuré d'autres ouvrages plus complets, traitant entre autres du séquençage, des méthodes et outils et donnant un nouvel éclairage sur des termes plus basiques. Mais les explications sont parfois trop techniques. On y trouve beaucoup d'informations mais j'ai eu parfois besoin d'aide pour bien les comprendre et pour pouvoir simplifier les informations. Et pour finir, j'ai consulté la presse. Sachant que je devais réaliser mon mémoire, je surveillais de très près la presse, en particulier la presse spécialisée telle que le journal « Science & Vie », dont le lectorat est celui que je cible pour ce dictionnaire : les articles sont très complets mais accessibles à un grand lectorat. J'ai eu la chance qu'un numéro comportant un dossier spécial ADN paraisse récemment. J'y ai souvent eu recours pour trouver des explications plus simples que dans les manuels classiques, dans un langage moins académique, ainsi que pour trouver des contextes. Mais d'autres journaux abordent également ce sujet, sous un autre angle : j'ai trouvé un article du « Monde diplomatique » intitulé « La bataille du génome humain » rédigé par John Sulston, prix Nobel de médecine 2002. Il est plutôt centré sur les implications éthiques et l'octroi de brevets pour les séquences découvertes. J'ai alors constaté qu'un grand effort était fait pour rendre ce domaine accessible à tous : certains organismes spécialistes de séquençage tels que le Génoscope ont des sites très bien faits, offrant de nombreuses explications, destinés à tous les publics.
Pour savoir quels concepts retenir, j'ai tenu compte de divers critères : apparitions redondantes dans un grand nombre de textes, mes propres connaissances du sujet, me permettant d'évaluer si certains concepts sont incontournables, repérage des mots-clé. Plus le concours de mon amie pour compléter la liste au fur et à mesure. J'ai donc finalement limité mes domaines de la manière suivante :
-constituants et mécanismes chromosomiques de base
-techniques de séquençage
-outils principaux
-grandes étapes
-applications
ces domaines permettent de couvrir tout le sujet: séquençage du génome humain : techniques et applications. Le but est de comprendre le mécanisme dans l'ensemble, c'est-à-dire qu'il n'y ait pas de « trous » dans le corpus, que l'on puisse comprendre un article dans son ensemble. Pour comprendre le séquençage et s'y intéresser, il faut connaître ses outils, comment ils s'utilisent et leurs relations les uns avec les autres, les étapes du séquençage, à quoi elles mènent. Mais pour bien comprendre cela il faut connaître les notions de base en génétique. En revanche tout connaître dans le détail n'entrait pas dans mes objectifs, il n'est pas nécessaire de trop approfondir pour comprendre un article généraliste. Par exemple, je n'ai pas jugé utile de détailler tous les types de gènes ou d'ARN, même s'ils sont importants en génétique. J'ai préféré ne me consacrer qu'à ceux qui interviennent dans le séquençage. J'ai eu également l'occasion de compléter ma liste avec mon valideur, qui a une vue d'ensemble du domaine et sait quels concepts sont incontournables.
Mon corpus est caractérisé par un grand recours à Internet : c'est un sujet actuel et cet outil offre un éventail d'informations très fiables car provenant des organismes concernés (Centre National de Séquençage, Celera Genomic&) accessibles à tous niveaux. On peut également trouver sur Internet des articles plus complets et plus spécialisés pour trouver des informations complémentaires, dans plusieurs langues, ainsi que des glossaires. Ce sont en général des articles récents puisque le séquençage a connu un essor important ces dernières années. J'ai également trouvé beaucoup d'informations dans les journaux qui offre un point de vue plus vivant et des bibliographies fort utiles. Il est aisé de trouver des informations fiables dans ce domaine.
La rédaction des fiches s'est faite au fur et à mesure que j'obtenais mes informations. J'ai fait des recherches de mon côté avec les outils dont je disposais, puis, lorsque mon travail s'est un peu plus organisé, je rencontrais régulièrement mon amie étudiante en génétique pour faire le point, vérifier ce que j'avais fait, remodeler mes phrases ou les simplifier (car il je trouvais des informations pertinentes, mais il m'était souvent difficile de les reformuler plus simplement, ne sachant pas toujours ce qui est essentiel et ce que tout veut dire). Je pouvais donc avancer seul et elle me complétait pour les points plus sensibles. J'ai commencé par les définitions, pour mieux comprendre le sujet, son organisation, avant de faire les relations. La constitution des arborescences m'a posé quelques problèmes : en effet, lorsqu'il s'agissait de relations partitives (organisation du matériel chromosomique par exemple) c'est facile à représenter. Mais les différents mécanismes et processus sont difficiles à incorporer.
Le thème du séquençage regroupe des concepts de toutes sortes, souvent des unités très longues. Mais il était très important de relever les unités dans leur intégralité, car j'ai souvent des unités très proches qui ne diffèrent que d'un adjectif (notamment les adjectifs « cellulaire » et « moléculaire » sont redondants et primordiaux en biologie. On trouve énormément de sigles, souvent formés à partir du terme anglais, qui sont en général utilisés, plus que le formes complètes, ainsi que des termes en anglais, dont la traduction en français existe mais est moins utilisée.
Pour trouver les équivalents en anglais, j'ai cherché des textes et glossaires (grâce à la définition, il est plus facile de trouver l'équivalent) en anglais, où j'ai trouvé le vocabulaire, souvent très proche du français.
Lorsque toutes mes fiches ont été complétées, j'ai rencontré une spécialiste de génétique, maître de conférence à Jussieu, qui a accepté de me recevoir. Mon amie m'avais donné les coordonnées d'une première personne qui, ne s'estimant pas spécialiste de séquençage m'a mise en relation avec elle. Elle a tout de suite accepté. Elle a relu mon mémoire, proposé des corrections, apporté des compléments, m'a fourni d'autres documents et a répondu à mes questions. Elle me fut d'une grande aide.
C'est donc un sujet très intéressant auquel je me suis attelée. Je ne regrette pas d'avoir fait ce choix et me rends compte de l'utilité de ce mémoire, car je rencontre souvent des articles qui font référence à ce domaine, les applications sont multiples et les termes de base de la génétique apparaissent régulièrement dans la presse dans des sujets très actuels tels que le clonage, les organismes transgéniques& Bien plus qu'un sujet d'actualité, c'est un sujet d'avenir !
Retour à la page précédente.