-
Journal intime de la réflexion
30.12.18 Paris
Par réflexion j'entends ma réflexion sur les PEEMOVs que j'ai entreprise déjà depuis 10 ans. Avec les articles sur la répétition des bases et la corrélation entre les codons protéiques je me suis tellement étalé et dispersé dans mes recherches grâce aux bases de données gtRNAdb et KEGG que j'ai décidé de noter mes idées-réflexions momentanées dans ce recueil quotidien. Il ne sera certainement pas quotidien au jour le jour mais me permettra personnellement de placer des étapes, d'avoir un repère.
Par intime j'entends mettre des références à des contenus de mon ordinateur qui ne serviront pas au lecteur immédiatement mais lui permettront de me les demander s'il en a besoin. Je consigne ainsi des repères dans mes vastes documents.
Aujourd'hui j'ai mis le lien de l'article en préparation, genèse et duplication des gènes des tRNAs 2018 que j'ai commencé en août de la même année. Pendant la rédaction de l'article sur les corrélations entre codons j'ai voulu faire le lien avec les gènes de tRNAs pour infirmer l'hypothèse à la mode que le "codon usage" est en relation directe avec l'efficacité des tRNAs lors de la traduction et que la dégénérescence du code viendrait de ce constat (Factors That Shape Eukaryotic tRNAomes: Processing, Modification and Anticodon–Codon Use). Un seul article de 2018 a pu mettre en évidence cette infirmation (Codon usage revisited: Lack of correlation between codon usage and the number of tRNA genes in enterobacteria). Le chapitre sur la résonance des tRNAs ayant pris tellement de volume et ayant constaté que l’absence de certains gènes de tRNAs ou plutôt la présence des autres (que j'appelle genèse) a tellement d'importance que j'ai décidé de consacrer un article spécialement pour les gènes de tRNAs.
Le codon iMet:
- La réflexion du jour est sur le tRNA d'initiation de la traduction (iMet) chez les archées. La base gtRNAdb différencie nettement (par bio-informatique) entre le codon Met et iMet chez les procaryotes. Cela veut dire que la séquence de iMet est bien conservée et qu'elle est facilement repérable par un logiciel. iMet est notée Methanocella_conradii_HZ254_tRNA-iMet-CAT-1-1 dans la base. C'est en étudiant la protection des tRNAs des duplications par les introns que j'ai constater que iMet est dupliquée très souvent et surtout que, dans l'ADN, elle ne porte pas d'intron. Chez les Methanomicrobia sur 45 génomes décomptés pour leurs tRNAs, il n'y a que 14 séquences différentes pour iMet dont une est retrouvée 29 fois. J'ai comparé avec la fonction stxt (texte, caractère) du tableur calc de libreoffice et effectivement les 14 séquences sont très semblables (sur mon PC, tRNA-duplications-151218.ods/microbia/d2722). Pourquoi cette constance de iMet alors que les autres tRNAs chez tous les archées dans ces décomptes ne se dupliquent que rarement et, quand c'est le cas, la duplication n'est pas à l'identique. Chez les Methanomicrobia 25 duplications du codon atg sont dues à iMet dont 21 sont à l'identique (sur mon PC, tRNA-duplications-151218.ods/microbia/ca7), aucune duplication à l'identique n'est apparue pour les 2 Met restant dont une porte un intron dans 46 cas sur 47.
- Pour les bactéries (cas de Acidobacterium_capsulatum_ATCC_51196) la notation iMet n'apparaît pas, par contre le tableau récapitulatif affiche bien un codon atg pour Ile, un pour iMet et un pour Met. Chez l'archée Methanocella_conradii_HZ254 c'est le contraire qui apparaît, les 3 tRNAs sont regroupés sous le codon atg de la Met.
L'exception du codon ata:
- Sur 4034 bactéries de la base gtRNAdb seulement 48 ont des gènes tRNA ata, dont 4 ont 2 à 4 copies ( Au 26.8.19 j'ai trouvé respectivement 4037 65 dont 5 ont 2 à 4copies). Et sur 246 125 tRNAs bactériens il n'y a que 3 avec un intron ( Au 26.8.19 j'ai trouvé respectivement 241 956 et 278) . Comme indiqué ci-dessus la base tgRNAdb attribue un codon atg pour coder Ile à la place du codon ata. C'est une modification spéciale, et donc avec des enzymes spéciaux, qui accole une lysine au tRNa, à la position 34 chez E.Coli, pour permettre à l'anti-codon CAU de lire le codon ata. C'est comme si la base C etait transformée en U. Par ailleurs le codon atg se retrouve tout seul sans aucun autre atx dans 81 bactéries. Est-ce qu'une bactérie avec un seul tRNA CAU, modifié de différentes manières, peut lire les codons atg atc ata à la fois?
- Chez les eucaryotes presque tous les codons et tous les génomes ont des introns avec un rapport très variable du nombre de tRNAs sans introns sur le total par codon. Chez les 42 champignons le codon ata a tous ses tRNAs (59) avec un intron, devant tac (1/252), ttg (39/190) et atg (220/364) alors que 14 codons ont moins de 21% (ttg). Chez les 79 autres eucaryotes seulement 4 codons ont moins de 39%, tac (71/1310) ata 20% avec 110/564, aga (213/682) et ttg (257/657) et atg vient très loin avec 93% (2039/2188) comme tous les autres codons forts qui ont plus de 78% (cga, 478/609). Chez les eucaryotes le codon atg ne semble pas contenir donc un tRNA qui, une fois modifié, traduira ata en Ile. En même temps le codon ata est très protégé par un intron et atg ne l'est pratiquement pas.
- Chez les eucaryotes ata est omniprésent et protégé comme le sont tac aga ttg ttc agc, alors que chez les bactéries il est quasiment absent et les 5 codons sont omniprésents. Je note que si tac et ttc sont obligatoires fonctionnellement ( un seul codon par acide aminé) aga agc et ttg ne le sont pas du tout puisqu'ils appartiennent aux codons dégénérés des aas à 6 codons. De même il faut noter que les autres codons obligatoires, à part tgg chez les champignons (28%), aac cac gac tgc tgg sont très peu protégés chez les champignons avec plus de 58% et quasiment pas chez les 79 autres eucaryotes avec plus de 95%.
- Chez les archées le codon ata n'existe plus à part dans 2 tRNAs avec un intron chacun, chez le nanarchaeota neq (code KEGG) et le korarchaeota kcr(code KEGG). Par contre 173/183 génomes ont un intron sur un tRNA parmi les 3 du codon atg. Les décomptes précédents du codon iMet que leur tRNA ne porte pas d'intron. Le comportement des codons ata chez les eucaryotes et son affichage bio-informatique chez les bactéries par la base gtRNAdb laissent penser que le tRNA du codon atg qui porte l'intron est bien celui qui se traduira en Ile après modification en position 34 comme chez les bactéries.
- La protection des tRNAs par les introns contre les duplications: C'est ce comportement du codon ata et son analogue chez atg, portant toujours un intron qui m'a conforté dans cette hypothèse de protection quand j'ai remarqué que chez les crenarchaeota le très grand nombre d'introns est accompagné d'un très faible taux de duplications essentiellement à l'identique. Apparemment c'est la température optimale très élevée de ces archées qui imposerait cette protection par les introns. Chez les Euryarchaeota thermococci subissant ces températures élevées les duplications sont rares et à l'identique bien que les introns ne se trouvent que sur les codons atg et tgg. Le fait que tous les codons de ces 2 groupes ont tous un tRNA et un seul peut être expliqué par l'organisation complexe du splicing chez les crenarchaeota et par la recherche de séquences rares en l'absence d'enzymes de modifications chez les thermococci due aux fortes températures.
07.01.19 Paris
Cette réflexion a débuté quand j'ai cru comprendre qu'une duplication d'un tRNA apparaissait pendant la réparation, la réplication ou la transcription quand l'ADN, encore sous forme de simple brin, peut se replier sur lui-même (pour adopter le motif du trèfle à 4 feuilles) et donc empêcher le processus en cours. C'est en comparant les tRNAs d'un même codon que je me suis rendu compte que c'est toujours le début, jusqu'à la position 38 ou 39, qui se conserve, alors que la fin qui correspond à l’appariement du début ne dépasse pas la vingtaine de bases, jusqu'à la séquence CTP (rC r(m5-U) pseudo-uridine), soit la moitié. Une autre image m'est apparue et concerne plutôt la réparation. Elle commencerait, en même temps, par la tête et la fin du tRNA-gène, progressant en sens contraire. La réparation ne sera plus fidèle et procédera à des insertions entre l'anti-codon et le triplet CTP. Ce qui contiendrait la partie variable des tRNAs que l'on connaît.
La Thymine
- La considération du triplet CTP m'a ensuite fait penser aux PEEMOVs, qu'elle est l'origine de la Thymine? Les expériences de Miller n'aboutissent qu'à la cytosine et à l'uracile. Voir ce site qui cite Miller.
- Dans le métabolisme central la thymine ne dérive que de l'uracile en présence du THF (EC 211.45, KEGG) ou bien dérive de la méthylation de la cytosine dans l'ADN (ADN méthylase wiki) , qui est ensuite désaminée en thymine tout en restant dans l'ADN (5-methylcytosine wiki) ou bien dérive de la méthylation dans l'ARN qui se dégrade et donne la 5-méthyl-cytosine désaminé en Thymine (EC 3541, KEGG).
- Epigenie : Les 3 pyrimidines sont très liées dans l'ADN et l'ARN et la cytosine joue le rôle central dans l'ADN. La méthylation de la cytosine aboutit non seulement à l'insertion de la thymine dans l'ADN mais a une fonction de marquage de celle-ci créant des fonctions importantes, notamment l'immunité des bactéries contre les phages. Avec l'épigénie on retrouve les modifications des tRNAs, avec l'adénine aussi.
- Dans les PEEMOVs où il n'y a pas encore de protéine et que les aas les remplacent, par le principe de continuité physique, quelque soit les bases nucléiques originelles nous retrouverons ces trois bases U C T et mon hypothèse de la synthèse des rN et dN dans la membrane prébiotique reste valable pour la thymine aussi (Résumé du 300814 page 3) .
- Dans les PEEMOVs, étudiées jusqu'ici, je suppose qu'il n'y a pas synthèse de novo des petites molécules car, en général, ces synthèses exigent des cofacteurs (vitamines) non minéraux qui sont supposés être synthétisés eux aussi de novo. Dans l'article sur le métabolisme prébiotique, que j'ai écrit avant le concept des PEEMOVs, (Résumé du 300814), j'ai voulu initialiser le métabolisme avec ces synthèses de novo. Dans les PEEMOVs la synthèse est basée sur les contraintes imposées par le liposome et toutes les molécules de l'intérieur. Donc plus il y aura d'aas et d'aNs qui s'auto-organisent, plus cette organisation ressemble aux protéines, aux RNAs et aux ADNs et donc agirait, même faiblement, comme elles. C'est le principe de continuité fondé essentiellement sur les propriétés physiques de ces petites molécules. J'ai vérifié toutes les enzymes nécessaires aux BERs ( base excision repair) qui transforment les 3 pyrimidines C U T, pour l’absence des cofacteurs. Chez B.subtillus la ligase LigA a besoin du NAD+ (bsu LigA) et a 668 aas, mais il y a des ligases bactériennes du BER qui ne nécessitent pas de cofacteur autre que ATP ( bsu LigB ) avec 270 aas comme les autres protéines du BER (sauf la polymérase DPoI qui n'a pas besoin de cofacteur synthétisé de novo). En général les enzymes qui phosphorylent les bases RNA et DNA utilisent ces gros substrats comme cofacteurs et n'en nécessitent pas d'autres.
15.6.19 Mainz
La corde vibrante
J'ai déjà évoqué la longueur d'onde minimale dans les gènes de protéines qu'est le codon avec 2 noeuds et un ventre. Dans les opérons de RNAs des firmicutes, bsu et lmo, la longueur d'onde des tRNAS est beaucoup plus grande et légèrement variable, de 70 à 90 pb. C'est l'agencement régulier des noms courts des tRNAs qui m'a laissé penser à une longueur d'onde de résonance comme pour les codons. Seulement ici les longueurs ne se répètent pas exactement, comme si le gène de tRNA était un paquet d'ondes avec le codon présentant son maximum d'intensité, ou encore que c'est le codon qui définit le paquet d'onde et donc qui définit le gène de tRNA et non le contraire.
Mais où est la corde vibrante dans tout çà? Alors que dans les gènes de protéines la longueur de la corde est fixée par les codons stop, ici je ne devine qu'un point fixe, un seul groupe de rRNAs pour les opérons longs (en nombre d'aas, opérons 16aas et 21aas). Et les opérons courts où les aas sont entre 2 rRNAs, le nombre d'aas est de quelques unités seulement quand les 2 extrémités sont différentes. Cependant ce sont les opérons moyens, 6aas et 9aas, qui ont l'allure d'une corde avec 2 extrémités à rRNAs identiques, 16s-23s-5s. Les opérons à une seule extrémité fixe peuvent être comparés aux cordes vibrantes à une seule extrémité fixe. Certains opérons peuvent présenter un groupe ou plusieurs groupes de rRNAs séparés par des groupes d'aas ou se terminant aux extrémités par des aas: 16s-2aas-23s-5s-14aas chez lmo ou encore 2aas-16s-23s-5s-2aas.
Ce sont les opérons longs à une seule extrémité fixe qui m'a suggéré, au-delà du dernier aa, que des codons protéiques peuvent se former, comme des vagues qui se meurent petit à petit au bord du rivage. C'est la formation d'un gène protéique. Et cela m'a fait penser aux gènes protéiques qui se retrouvent dans les opérons à rRNAs comme EFTU. La question qui se pose alors est, est-ce que les opérons à rRNAs peuvent créer ou sont à l'origine de l'apparition des gènes de tRNAS et de certains gènes protéiques?
Effectivement, en dehors du fait qu'ils sont transcrits en même temps (promoteur et terminateur), les gènes de tRNAs présentent beaucoup de similarités avec les gènes des rRNAs, zones appariés alternant avec des boucles, un %GC analogue et une très faible mutabilité. En plus quand on considère les groupes d'aas de l'opéron, les intercalaires entre les aas sont très mutables comme les zones très variables (une dizaine de 25 pb chacune) qui se trouvent à l'intérieur des 16s (ref.).
Et si les gènes protéiques cotranscrits étaient créés par ces opérons, alors ils devraient présenter des similarités avec les gènes de rRNAs, appariements et boucles, %GC et avec ou sans de zones très variables. Deux indices laissent penser à ces similarités: ces gènes protéiques sont petits, de la taille d'un ou deux tRNAs et font partie du ribosome ou participent à la traduction. Il serait intéressant de voir leur taux de mutabilité en comparaison avec celui des gènes rRNAs.
- La réflexion du jour est sur le tRNA d'initiation de la traduction (iMet) chez les archées. La base gtRNAdb différencie nettement (par bio-informatique) entre le codon Met et iMet chez les procaryotes. Cela veut dire que la séquence de iMet est bien conservée et qu'elle est facilement repérable par un logiciel. iMet est notée Methanocella_conradii_HZ254_tRNA-iMet-CAT-1-1 dans la base. C'est en étudiant la protection des tRNAs des duplications par les introns que j'ai constater que iMet est dupliquée très souvent et surtout que, dans l'ADN, elle ne porte pas d'intron. Chez les Methanomicrobia sur 45 génomes décomptés pour leurs tRNAs, il n'y a que 14 séquences différentes pour iMet dont une est retrouvée 29 fois. J'ai comparé avec la fonction stxt (texte, caractère) du tableur calc de libreoffice et effectivement les 14 séquences sont très semblables (sur mon PC, tRNA-duplications-151218.ods/microbia/d2722). Pourquoi cette constance de iMet alors que les autres tRNAs chez tous les archées dans ces décomptes ne se dupliquent que rarement et, quand c'est le cas, la duplication n'est pas à l'identique. Chez les Methanomicrobia 25 duplications du codon atg sont dues à iMet dont 21 sont à l'identique (sur mon PC, tRNA-duplications-151218.ods/microbia/ca7), aucune duplication à l'identique n'est apparue pour les 2 Met restant dont une porte un intron dans 46 cas sur 47.
-
Commentaires