Les techniques de clonage moléculaire
====== Si vous recherchez une rubrique en particulier, utilisez l'index...============
Index:
=================================================================
On distingue du clonage cellulaire le clonage d'un ou plusieurs gènes. Ceci permet d'étudier, de contrôler le fonctionnement des gènes en question ainsi que leurs interactions avec le reste du génome.
On peut donc vouloir cloner un gène pour l'analyser (profil de restriction, taille, séquece ...) par Southern, séquençage .... ou pour le faire s'exprimer individuellement dans une cellule, via un vecteur d'expression. Dans le premier cas, la manip ne concerne que les deux premières étapes décrites ci-dessous. Pour cloner un gène dans une cellule hôte, on l'insère au préalable dans une construction: le vecteur de clonage. De même, pour le faire s'exprimer et produire une protéine, on construit au préalable un vecteur d'expression.
Trois étapes pour cloner un gène:
- Isoler le gène d'intérêt.
- Introduire le gène dans une cellule hôte.
- Le faire s'exprimer dans une cellule hôte, si c'est ce que l'on recherche.
1) Isolement du gène (inconnu bien sûr à ce stade).
Le gène, bien qu'inconnu, s'exprime par l'intermédiaire d'un ARN messager (ARNm) et d'une protéine, que l'on peut par contre rechercher. La première orientation de la démarche est donnée par l'effet constaté du gène (dégradation d'hydocarbures, résistance à un antibiotique...).
On recherche la protéine responsable de cet effet, on la séquence, on en déduit la séquence de l'ARNm. On isole cet ARNm à l'aide d'oligosondes et on le transcrit en ADNc.
Prenons l'exemple de souches de Pseudomonas putida: de nombreuses d'entre elles peuvent hydrolyser une classe d'hydrocarbures (octane-hexane-décane ou xylène-toluène ...). L'enzyme (une protéine) responsable de cette faculté est différente selon les souches bactériennes, ce que l'on peut visualiser sur les profils électrophorétiques des différentes souches.
Voir aussi extraction d'ADN (en anglais).
2) Introduction du gène dans une cellule hôte.
Le gène doit-il s'exprimer ou pas?
Il convient avant tout de savoir si on veut faire exprimer le gène ou non. Dans la négative, on cherchera seulement à obtenir un grand nombre de copies du gène; il faut donc l'introduire dans une cellule qui se multiplie rapidement: l'hôte de choix est bien entendu Escherichia coli.
Si par contre on cherche à faire s'exprimer le gène, le choix de l'hôte dépendra de la protéine que l'on cherche à produire. Certains systèmes d'expression (les bactéries) se multiplient vite et produisent une grande quantité de protéine, mais ne permettent pas d'y adjoindre la "valeur ajoutée" que constituent les modifications post-traductionnelles (telles que les glycosylations). On peut s'en contenter dans certains cas, mais dans d'autres il faut utiliser des cellules eucaryotes (Saccharomyces cerevisiae), voire des cellules de mammifère.
Dans tous les cas, si l'on veut que notre transgène (pour gène étranger à la cellule hôte) persiste et se miltiplie dans la cellule où il doit être introduit, il faut l'intégrer au préalable dans une construction: un vecteur de clonage et le cloner dans une cellule (préférentiellement le colibacille).
Au bout du compte, différentes méthodes permettent d'introduire notre vecteur de clonage ou d'expression dans sa cellule hôte:
Comme l'indique le tableau ci-dessous, les techniques sont différentes selon la cellule hôte.
Escherichia coli | co-précipitation au CaCl2 électroporation de protoplastes |
Saccharomyces cerevisiae | électroporation cytoélicase + Ca2+ ou PEG (Poly-Ethylène Glycol) |
Cellule de mammifère | co-précipitation au CaHPO3 DEAE dextrane Liposomes + PEG électroporation virus défectifs pour la réplication (BPV, SV40, Vaccine) |
Le matériel génétique est intriduit par action du CaCl2 ou par électroporation de protoplastes (bactéries sans paroi).
- Cytohélicase: enzyme de suc gastrique de l'escargot (helix pomatia) qui élimine les parois des levures, donnant alors des protoplastes de levures. L'ADN exogène en présence de Ca++ ou de PEG (PolyEthylène Glycol) pénètre spontanément dans la cellule suite à la fragilisation de la membrane plasmique. Les protoplastes regénèrent ensuite leur paroi.
- Electroporation. On soumet les protoplastes à un choc électrique qui perfore réversiblement la membrane par où pénètre alors l'ADN. Les cellules de levure sont plus fragiles que les bactéries, d'où l'emploi d'un voltage moins élevé plus longtemps.
3) La cellule hôte est une cellule de mammifère:
- co-précipitation au phosphate de calcium: l'ADN est mélangé à une solution de clorure de calcium et de tampon phosphate. Il se forme alors un co-précipité de CaHPO3 et d'ADN qui est internalisé dans la celllule par phagocytose. Cette technique est très toxique pour les cellules - beaucoup meurent - et n'est applicable qu'aux cellules adhérentes. L'efficacité de la technique dépend en fait du type de cellule employée.
- DEAE dextrane. Ce polycation forme un complexe avec l'ADN, fragilise la membrane cytoplasmique et permettant la pénétration du complexe. Cette technique est aussi très toxique pour les cellules.
- Fusion de liposomes. Il s'agit de vésicules phospholipidiques artificielles pouvant englober de l'ADN. En présence de PEG, qui est un agent fusionnant, ils fusionnent avec la membrane plasmique et incorporent l'ADN aux cellules. Cette méthode présente l'avantage d'être moins toxique.
- Electroporation: fragilisation de la membrane par choc électrique.
Ces quatre techniques sont toutefois peu efficaces. On peut recourir à une cinquième approche:
- L'infection par un virus défectif pour la réplpication, tel que le Poxvirus (dont la vaccine), le SV40, le papillome bovin, adénnovirus, rétrovirus.
3) Expression dans la cellule hôte.
3.1) Production de protéines recombinantes par E. coli:
Les vecteurs sont dérivés de PBR 48. Ils ont:
a) Une origine de réplication, pour se répliquer de façon autonôme (indépendemment du chromosome bactérien).
b) Un marqueur de sélection tel qu'un gène de résistance à un antibiotique. Lorsque le taux de croissance est grand, la relation entre celui-ci et le nombre de copies du gène par cellule est inversement proportionnel; le plasmide peut être perdu! Pour éviter sa perte, on exerce un facteur de sélectionpar ajout d'un antibiotique.
c) Un promoteur issu du colibacille ou de phage.
- Promoteur de colibacille: long d'environ 40 pb, il a deux séquences consensus en -10 et -35. Pour avoir une bonne expression du gène, on le place en aval du promoteur fort, généralement inductible. Les promoteurs utilisés sont:
- opéron lactose, lié à l'opérateur, sous sa forme mutée UV5 permettant un niveau d'expression beaucoup plus élevé.
- opéron tryptophane (moins courant).
- fusion de séquences de plusieurs promoteurs, par exemple "Ptac", hybride du promoteur opéron lac (séquence consensus en -10) et trp (séquence consensus en -35).
- Promoteur de phage:
Le promoteur "phi 10" issu du phage T7. On utilise un vecteur de clonage possédant ce promoteur. Ce promoteur ne fonctionne qu'en présence de l'ARN polymérase du phage T7. Il doit donc co-exprimer dans la cellule cette ARN polymérase phagique. La vitesse d'élongation est 7 fois supérieure à celle d'un promoteur d'E.coli. Les ARN polymérase ne reconnaissent QUE le génome de leur cellule d'origine.
d) Signaux d'initiation et de terminaison:
Initiation: AUG ou GUG, UUG, AUU.
Site de fixation du ribosome ou séquence Shine-Dalgarno en -12 du codon d'initiation.
La séquence située entre AUG et Shine-Dalgarno est importante et doit être constituée de nucléotides à A et U.
Terminaison: la libération de chaque peptide est assurée par deux facteurs: RF1 et RF2 (pour releasing factor). Le premier reconnaît UAA, UAG tandis que le secind reconnaît UAA et UGA.
Les codons ont des efficacités de terminaison différentes, UAA étant le plus fort. On place les trois codons stop en tandem. Le vecteur d'expression doit avoir une région codant pour les parties N et C terminales de la protéine recombinante. En effet, si E. Coli produit une protéine hétérologue, elle est attaquée par son système protéolytique car étrangère à la cellule hôte. Pour éviter cela on fait exprimer la protéine sous forme hybride, associée en N ou C terminal avec une protéine bactérienne: la bêta galactosidase car son gène - lac Z - se prête à cette fusion. Cette association évite la protéolyse mais il faut ensuite purifier le complexe protéique par clivage enzymatique.
Problèmes de secrétion de protéines hétérologues:
Celles-ci se trouvent dans le cytoplasme sous forme de corps d'inclusion, agrégats réfractiles. La récupération de la protéine se fait par
- isolement des pores d'inclusion
- solubilisation et renaturation: étape difficile voire infaisable.
- Une solution est de faire secréter la protéine, mais E.coli s'y prête mal. On pallie ce travers en adjoignant au complexe protéique une séquence signal. On place derrière le transgène le gène d'une séquence signal de protéine de paroi bactérienne :Omp A (Outer membrane protein A). Les protéines recompbinantes sont alors secrétées dans le périplasme (entre la paroi et la membrane) d'où elles sont extraites par choc osmotique.
Avantages et Inconvénients d'E. coli comme système de production:
Avantages: de nombreux vecteurs sont commercialisés prêts à l'emploi. La culture bactérienne est aisée en fermenteurs. Le taux d'expression est élevé: qqs grs de protéine/l de culture.
Inconvénients: le colibacille est un mauvais secréteur. Les protéines s'accumulent sous forme de corps d'inclusion. On peut la faire secréter dans le périplasme par certains vecteurs. E.coli ne fait pas les modifications post-traductionnelles nécessaires aux protéines eucaryotes. Certaines souches sont de plus toxiques. D'autres systèmes d'expression sont donc envisageables:
3.2) Utilisation de la levure de bière comme système de production:
La levure est un champignon unicellulaire eucaryote ascomycète.
Les vecteurs d'expression:
Il faut des vecteurs navette pouvant fonctionner à la fois chez E. coli et chez la levure, car le clonage du gène se fait chez E. coli. Le vecteur est le plasmide 2 µ (seul disponible pour la levure) présent en 100 exemplaires par cellule et naturellement présent dans le noyau des levures.
a) 2 origines de réplication
ORI pour la réplication du vecteur dans E. coli,
ARS (Autonomous Replicating Sequence) pour la réplication dans la levure.
b) 2 marqueurs de sélection
Pour la bactérie on utilise un caractère de résistance à un antibiotique: l'ampicilline. On désigne le gène amp intégré par amp+.
Pour les levures on utilise le gène URA3. Les cellules à tranformer doivent être URA- (pas de synthèse d'uracile).
c) Un seul promoteur
Le gène devant s'exprimer dans la levure, on emploie le promoteur de levure GAL 1 inductible par le galactose.
d) Terminateur de transcription d'un gène du plasmide 2 µ car on n'en connaît pas d'autre chez la levure.
e) Signaux d'initiation et de terminaison
Il faut une séquence consensus autour du codon initiateur ATG: APAATAATGTCT
P = Polynker, un site de clonage quelquesoit le vecteur, procaryotique ou eucaryotique.
Secrétion des protéines hétérologues:
La levure est naturellement secrétrice, à condition de fusionner le gène à une séquence signal de levure.
Avantages et inconvénients de la levure comme système de production:
Avantages: Saccharomyces est non toxique, ce qui permet de l'utiliser pour produire des protéines à usage thérapeutique. Elle est un bon secréteur ce qui simplifie grandement les procédures de purification. Elle permet des modification post-traductionnelles, mais ses glycosylations sont différentes de celles des eucaryotes supérieurs. Sa culture industrielle est facile.
Inconvénients: Le taux d'expression est faible; 100 mg/l env. Elle n'est pas un hôte optimal pour un vecteur d'expression car elle n'a pas de promoteur fort et modulable, ce qui limite la production à grande échelle. Enfin, ses glycosylations sont inadaptées.
3.3) Expression de protéines recombinantes dans les cellules d'eucaryote supérieur
Pour une expression transitoire, l'ADN n'est pas incorporé à un vecteur, il est dit "nu" et ne s'intègre pas au génome de la cellule hôte. Pour une expression stable, l'ADN s'intègre au génome et est intégré dans un vecteur qui peut être de trois sortes:
- vecteur plasmidique
Remarque: pour la réplication plasmidique, l'intégration au chromosome peut se faire mais seulement sous certaines conditions. Sinon, le plasmide se réplique - sous certaines conditions aussi - à l'état d'épisome sans s'intégrer.
- vecteur viral (SV40, BPV, adénovirus)
- vecteur rétroviral, avec intégration au chromosome cellulaire.
Ce sont des vecteurs navette, s'exprimant à la fois dans la cellule procaryote (E.coli) - le clonage du gène se faisant dans la bactérie - et dans la cellule d'eucaryote supérieur. Il faut pour leur permettre de se répliquer dans ses dernières leur adjoindre une origine de réplication virale: SV40, polyome.
dans la bactérie= amp (ou équivalent).
Gène de sélection eucaryote = le gène bactérien Néo (et oui), qui confère aux cellules eucaryotes la résistance à la généticine ou G418, un analogue de la néomycine. Néo code pour une enzyme de phosphorylation de la néomycine. D'autres marqueurs de sélection pour cellules animales sont également possibles.
Séquences d'initiation et de terminaison de transcription:
- Promoteur et enhancer viraux du SV40, du cytomégalovirus.
- L'origine de réplication bactérienne est col EI, commune à toutes les souches d'E.coli. Les cellules eucaryotes doivent exprimer l'antigène T de l'un des deux virus précédents, qui est un activateur de l'aorigine de réplication. Les cellules COS (CV1 Origin defective SV40) ont dans leur génome le gène viral codant pour la protéine T du SV40.
- Séquence poly A en tant que signal de fin de transcription.
1. Dérivés de Virus lytiques
Ceux-ci sont employés en expression transitoire car la cellule est lysée en 48 heures environ.
Les vecteurs dérivés des baculovirus:
Il s'agit de virus en forme de batonnet, spécifique sdes larves de lépidoptères. Les virions s'entourent d'une enveloppe protéique de polyédrine qui les protège et permet leur dissémination dans la nature.
L'intérêt consiste à remplacer le gène de la polyédrine par un gène étranger.
AcNPV, soit Autographa california Nuclear Polyhedrosis, est à ADN bicaténaire circulaire, de 128 kD et pouvant intégrer un gène étranger de 10 kb. Il infecte un lépidoptère Sedoptera fugiperda. Les larves d'insecte intègrent les particules de polyédrine (renfermant les virus) présente dans leur nourriture. Celles-ci se dissolvent dans leur intestin et libèrent les virions qui vont infecter les cellules intestinales en 4 phases.
- La première phase du cycle lytique a lieu 6 heures plus tard, il y a réplication virale.
- Deuxième phase: 10 à 12 h. après l'infection il y a émission de nouveaux virions par les cellules infectées, sans lyse.
- Troisième phase: 18 à 24 h. après, il y a accumulationde protéines virales dont la polyédrine dans le noyau puis dans le cytoplasme des insectes.
- La quatrième phase a lieu 48 à 72 h. après l'infection; il y a lyse des cellules et libération de particules de polyédrine.
La polyédrine n'est pas nécessaire à la réplication virale et peut être remplacée par un autre gène.
Avantages des cellules d'insecte:
Leur capacité de secrétion est importante si on fournit un peptide signal reconnu par la cellule, ce qui somplifie en outre la purification.
Les protéines sont complètement maturées avec des modifications post-traductionnelles, mais les glycosylations sont quelquefois différentes de celles des mammifères.
Les baculovirus ne sont pas pathogènes pour l'homme, ce qui permet de l'employer en thérapeutique.
sont dérivées de poxviridae, dont précisément le virus de la vaccine (virus bovin à l'origine du vaccin antivariolique). Le virus est à ADN dicaténaire, de 150 à 300 kb.
Avantages et inconvénients des cellules d'eucaryote supérieur comme système de production:
Toutes les molécules thérapeutiques proviennent de cellules de mammifère. On emploie des cellules immortalisées, se divisant continuellement, issues de cellules tumorales ou de cellules saines transformées par un virus. La lignée CHO (Chinese Hamster Ovaire) en est un exemple.
Avantages: les cellules de mammifère permettent de synthétiser des molécules complexes, de grande taille, contrairement aux bactéries. Les molécules sont complètement repliées et maturées et sont de surcroît secrétées dans le milieu de culture.
Inconvénients: le taux d'expression est le plus faible des trois systèmes d'expression, de l'ordre de 10 mg/l. Les cellules sont très fragiles, sujettes aux infections et leur milieu de culture est très coûteux.
Les protéines issues de "gene breeding" à partir de cellules de mammifère, de levures et d'E.coli sont commercialisées.
Les animaux transgéniques et les vaccins recombinants |