< Recherche:Les clusters de gènes tRNA et rRNA chez les procaryotes < Annexe


Methanobacterium formicicum DSM1535

mfi opérons

  • Lien tableur: mfi opérons
  • Liens: gtRNAdb , NCBI , génome [orgn]
  • Phylogénie: Archaea; Euryarchaeota; Methanomada group; Methanobacteria; Methanobacteriales; Methanobacteriaceae; Methanobacterium.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
Ar1. mfi opérons, Methanobacterium formicicum DSM1535
41.2%GC17.8.19 Paris47 doublesintercalcdsaaavec aacdsacdsdprotéines
157153..157563CDS3636137
comp157600..157683ctc246246
157930..158232CDS101
comp211693..213681CDS206206663
213888..213971tcg281281
214253..215677CDS475
comp314088..314264CDS505059
comp314315..314487caa@1-1-1
comp314487..314654CDS56
comp317759..318211CDS198198151
comp318410..318494tcc177177
comp318672..319634CDS321
comp419250..419975CDS156156242
comp420132..420204aac2929
comp420234..420545CDS104
comp466570..467484CDS223223305
comp467708..467792agc186186
comp467979..468294ncRNA@2122122316
468417..469397CDS327
681116..681676CDS3737187
comp681714..681786gcg195195
comp681982..682488CDS169
695936..696538CDS939939201
comp697478..6976005s305123
comp697906..70077223s2332867
comp701006..701079gca87
comp701167..70264616s7247241480
703371..704336CDS322
comp746487..747290CDS155155268
comp747446..747518acc8585
comp747604..747686tta303303
747990..748163CDS58
comp800615..801820CDS4343402
comp801864..801935caa7272
comp802008..802697CDS230
comp963425..964432CDS273273336
964706..964778aac55
964784..964857atgi5858
964916..964990gaa5353
965044..965127cta2929
965157..965232cac146146
965379..965717CDS113
comp974621..974842CDS56456474
975407..975480aag9090
975571..975653ttg504504
976158..976231aaa148148
comp976380..976679CDS100
comp1006329..1008095CDS397397589
1008493..10086145s@3748122
1009363..10094855s286123
1009772..101263823s2332867
1012872..1012945gca72
1013018..101449716s4544541480
1014952..1016097CDS382
comp1088211..1088831CDS5353207
comp1088885..1089038tgg@14040
comp1089079..1089150tgc212212
comp1089363..1089746CDS128
1143658..1144137CDS166166160
comp1144304..1144610ncRNA@21414307
comp1144625..1144699atgf139139
comp1144839..1145162CDS108
1153368..1154087CDS5656240
1154144..1154217aga6262
1154280..1154354agg552552
comp1154907..1156157CDS417
1247204..1247659CDS44152
comp1247664..1247739cga133133
comp1247873..1248481CDS203
comp1320721..1321641CDS183183307
1321825..1321896gta9999
1321996..1322067gtg228228
comp1322296..1323084CDS263
comp1403886..1409507CDS3513511874
comp1409859..1409930cgc222222
comp1410153..1410620CDS156
1532795..1533088CDS12712798
comp1533216..1533325atgj@1246246
1533572..1534402CDS277
1541929..1542321CDS127127131
1542449..1542522ggg11
comp1542524..1543528CDS335
1602054..1603277CDS257257408
1603535..1603608aca7676
1603685..1603759cca4444
1603804..1603877tac170170
1604048..1604119gac77
1604127..1604200aaa2424
1604225..1604461CDS79
1617553..1617861CDS187187103
1618049..1618133tca252252
1618386..1619444CDS353
comp1692202..1692552CDS271271117
comp1692824..1692895cag156156
comp1693052..1693972CDS307
1887796..1888038CDS13613681
1888175..1888257ctg193193
1888451..1891267CDS939
2057488..2057883CDS230230132
2058114..2058184tgc143143
2058328..2059713CDS462
2128536..2129312CDS123123259
2129436..2129509acg362362
comp2129872..2130963CDS
comp2204492..2204932CDS178178147
2205111..2205182gtc44
2205187..2205259ttc283283
comp2205543..2205875CDS111
2317208..2317498CDS27127197
2317770..2317842atc460460
2318303..2318863CDS187
comp2414821..2415903CDS491491361
2416395..2416468gcc303303
comp2416772..2417797CDS342
comp2432399..2432848CDS537537150
2433386..2433459ggc22
2433462..2433535gga326326
comp2433862..2434263CDS134

mfi cumuls

cumuls. mfi.
opéronsFréquences intercalaires tRNAsFréquences intercalaires cdsFréquences aas cds chromosome
effectifgammessans rRNAsavec rRNAsgammescdsgammescdsdgammescdsagammescdsa 300
avec rRNAopérons210-1211009300
16 23 5s 002045082020021603
16 gca 235240210034030010903
16 23 5s a060315010604001212010
max a1802200128050051507
a doubles01003250810060011805
autres21200300712070012105
total aas21400350314080002402
sansopérons291600400316090002704
1 aa2018014500180100013001
max a520005003200110003306
a doubles015115
total aas451606406161
total aas47
remarques3
avec jaunemoyenne83224266
variance121176265
sans jaunemoyenne35178213171
variance279611581

mfi blocs

Ar1. mfi blocs, Methanobacterium formicicum DSM1535
CDS939201
5s305123
23s2332867
gca87
16s7241480
CDS322
CDS397589
5s748!122
5s286123
23s2332867
gca72
16s4541480
CDS382

mfi remarques

  • Lien tableur: mfi remarques
  • Remarques: pas de doubles mais des séquences. Il n’y a pas de cgt, on est avec les archées.
    1. @ Les introns des(gtRNAdb) archées existent pour tgg et atgj tujours. Ici en plus il y a un caa.
      - caa (Join(314315..314349,314448..314487)), l’intron empiète sur le cds d’où l’intercalaire négatif.
      - tgg ( join(1088885..1088919,1089000..1089038)), l’intron mais n’empiète pas sur les cds.
      - atgj Join(1533216..1533251,1533288..1533325), n’empiète pas sur les cds. C’est Met mais pas Il2 ni atgf.
    2. @ Ces ncRNAs sont dans le même cluster, sur le même brin qu’ un tRNA et très proche de lui, agc 186 et atgf 14. Ils sont petits respectivement 316 et 307 pbs.
    3. @ Le 5s collé au cluster du 16sgca23s5s, il se comporte comme un tRNA. Il a une pb de moins que les 2 autres 5s.
  • Séquence des doubles: aucun double dans une séquence. Les doubles exitants sont gca aac aaa caa tgc.
  • Tableau du code génétique de mfi
    Légende: prélèvement de la base gtRNAdb le 17.8.19
    • - totaux en en-tête, 47 total de gtRNAdb contenant des pseudo et inconnus; 47 total du cumul.
    • - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    • - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    • - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
    • - Voir la légende des tris et couleurs, g1 t1.
Ar1. mfi, Methanobacterium formicicum DSM1535
g1t14747
atgi1tcttatatgf1
attactaatagt
cttcctcatcgt
gttgctgatggt
ttc1tcc1tac1tgc2
atc1acc1aac2agc1
ctc1ccccac1cgc1
gtc1gcc1gac1ggc1
tta1tca1taatga
ataaca1aaa2aga1
cta1cca1caa2cga1
gta1gca2gaa1gga1
ttg1tcg1tagtgg1
atgj1acg1aag1agg1
ctg1ccgcag1cgg
gtg1gcg1gagggg1

mfi distribution

Ar1. mfi distribution. Methanobacterium formicicum DSM1535. Archée
g1t1 
atgi1tcttatatgf1
attactaatagt
cttcctcatcgt
gttgctgatggt
ttc1tcc1tac1tgc2
atc1acc1aac2agc1
ctc1ccccac1cgc1
gtc1gcc1gac1ggc1
tta1tca1taatga
ataaca1aaa2aga1
cta1cca1caa2cga1
gta1gca2gaa1gga1
ttg1tcg1tagtgg1
atgj1acg1aag1agg1
ctg1ccgcag1cgg
gtg1gcg1gagggg1
arch>1aa=1aa-5s+5s-16s+16stotal
mfi2520 *247

Methanocaldococcus jannaschii DSM 2661

mja opérons

  • Lien tableur: mja opérons
  • Liens: gtRNAdb , NCBI , génome
  • Phylogénie: Archaea; Euryarchaeota; Methanomada group; Methanococci; Methanococcales; Methanocaldococcaceae; Methanocaldococcus.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
Ar2. mja opérons, Methanocaldococcus jannaschii DSM 2661
31.3%GC17.8.19 Paris37 doublesintercalcdsaaavec aacdsacdsdprotéines
comp96499..97053CDS372372185
comp97426..97537atgj@19191
97629..97716ctc241241
97958..99259CDS434
comp110328..111545CDS222222406
111768..111852tga2121
111874..112785CDS304
137244..138245CDS9898334
comp138344..138419gtg5959
comp138479..138781CDS101
153070..154479CDS182182470
comp154662..15763923s2072978
comp157847..157919gca64
comp157984..15946316s3403401480
159804..160085CDS94
comp185874..186671CDS306306266
186978..187066tcc7171
187138..187590CDS151
190579..190800CDS313174
190832..190908ccc3232
190941..191114CDS58
comp214560..215060CDS149149167
215210..215297tta154154
215452..216240CDS263
226386..227639CDS6464418
comp227704..227780gcc239239
228020..229720CDS567
303613..303927CDS6464105
303992..304081tca230230
comp304312..304752CDS147
comp357984..358547CDS220220188
358768..358845aga2323
358869..358943gaa164164
359108..359923CDS272
359108..359923CDS4848272
comp359972..360047atgf103103
comp360151..361485CDS445
401945..402796CDS171171284
comp402968..403044gtc229229
403274..403834CDS187
comp618311..618757CDS402402149
comp619160..619234tgc6363
comp619298..619915CDS206
636394..637449CDS133133352
637583..637659ttc77
637667..637742aac2929
637772..637849atgi1818
637868..637942gaa3939
637982..638069cta1111
638081..638152cac295
638448..63993016s641483
639995..640067gca207
640275..64325423s782980
643333..6434475s56115
643504..643761ncRNA@2232232258
643994..644962CDS323
762859..763608CDS157157250
comp763766..763842acc178178
764021..764096caa5050
764147..764818CDS224
862207..862410CDS17917968
862590..862661cga4141
862703..863392CDS8686230
863479..863555aca1414
863570..863647cca88
863656..863732tac8383
863816..863889aaa13
863903..8640175s@346115
864064..864141gac8080
864222..864842CDS207
871492..873447CDS238238652
comp873686..873763atc102102
comp873866..875110CDS415
comp882566..883615CDS6565350
883681..883754gta123123
comp883878..884297CDS140
comp1037197..1038504CDS3939436
comp1038544..1038620cgc@411
comp1038622..1039386CDS255
comp1148669..1149934CDS210210422
1150145..1150220ggc3434
1150255..1150330gga243243
1150574..1151254CDS227
comp1188906..1189772CDS172172289
1189945..1190055tgg@19595
1190151..1190684CDS178
comp1312335..1312781CDS383383149
1313165..1313249agc177177
1313427..1314617CDS397

mja cumuls

cumuls. mja.
opéronsFréquences intercalaires tRNAsFréquences intercalaires cdsFréquences aas cds chromosome
effectifgammessans rRNAsavec rRNAsgammescdsgammescdsdgammescdsagammescdsa 300
avec rRNAopérons21001111004300
16 23 5s 0020055072020012601
16 atc gca04022100104030013902
16 23 5s a0600015056040061203
max a7800020088050081504
a doubles0100112501010060011803
autres212000300012070012105
total aas1314000350214080002403
sansopérons2016000400216090002704
1 aa16180104501180100003004
max a2200005000200110003302
a doubles0000014
total aas24484604545
total aas37
remarques4
avec jaunemoyenne8226154269
variance7125102137
sans jaunemoyenne2918152253194
variance8129511774

mja blocs

Ar2. mja blocs, Methanocaldococcus jannaschii DSM 2661
CDS182
23s2072978
gca64
16s3401480
CDS
cac295
16s641483
gca207
23s782980
5s56115
ncRNA232258
CDS
aaa13
5s46115
gac80
CDS

mja remarques

  • Lien tableur: mja remarques
  • Remarques: pas de doubles mais des séquences. Il n’y a pas de cgt, on est avec les archées.
    1. @ Les introns (gtRNAdb) des archées existent toujours pour tgg et atgj.
      - tgg, Join(1189945..1189984,1190018..1190055), l’ intron mais n’empiète pas sur les cds.
      - atgj, Join(97426..97464,97500..97537), n’empiète pas sur les cds. C’est Met mais pas Il2 ni atgf.
    2. @ Ce ncRNA est dans et sur le même brin que le cluster et très proche de lui, 56 au lieu de 232 avec cds. Il est petit, 258 pbs comme pour mfi.
    3. @ Le 5s est décollé du cluster du 16sgca23s, il se comporte comme un tRNA et est dans leur séquence. C’est pour ça que j’ai ces aas dans la colonne “avec rRNAs”.
    4. @ cgc très collé à ses 2 cds
  • Séquence des doubles: aucun double dans une séquence. Les doubles exitants sont gca gaa.
  • Tableau du code génétique de mja
    Légende: prélèvement de la base gtRNAdb le 17.8.19
    • - totaux en en-tête, 37 total de gtRNAdb contenant des pseudo et inconnus; 37 total du cumul.
    • - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    • - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    • - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
    • - Voir la légende des tris et couleurs, g1 t1.
Ar2. mja, Methanocaldococcus jannaschii DSM 2661
g1t13737
atgi1tcttatatgf1
attactaatagt
cttcctcatcgt
gttgctgatggt
ttc1tcc1tac1tgc1
atc1acc1aac1agc1
ctc1ccc1cac1cgc1
gtc1gcc1gac1ggc1
tta1tca1taatga1
ataaca1aaa1aga1
cta1cca1caa1cga1
gta1gca2gaa2gga1
ttgtcgtagtgg1
atg1acgaagagg
ctgccgcagcgg
gtg1gcggagggg

mja distribution

Ar2. mja distribution, Methanocaldococcus jannaschii DSM 2661. Archée
g1t1 
atgi1tcttatatgf1
attactaatagt
cttcctcatcgt
gttgctgatggt
ttc1tcc1tac1tgc1
atc1acc1aac1agc1
ctc1ccc1cac1cgc1
gtc1gcc1gac1ggc1
tta1tca1taatga1
ataaca1aaa1aga1
cta1cca1caa1cga1
gta1gca2gaa2gga1
ttgtcgtagtgg1
atgj1acgaagagg
ctgccgcagcgg
gtg1gcggagggg
arch>1aa=1aa-5s+5s-16s+16stotal
mja816146 *237

mja intercalaires entre cds

  • Lien NCBI 9.4.20
  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

mja les fréquences

  • Lien tableur: mja intercalaires entre cds
  • Légende: long, longueur en pbs, intercal pour intercalaire
    - fréquence-1 1 5 6 f, respectivement fréquence des intercalaires négatives à l'unité, positives à l'unité, par blocs de 5, par blocs de 10 jusqu'à 600 pbs et f pour finales. Ces fréquences servent à faire les diagrammes. La fréquence fréquence6 est étendue à 1200 pour certains grands génomes.
    - cumul,% colonne à la droite de frequence6, reprend les fréquences par plages et leurs pourcentages indiqués déjà dans la 1ère partie du tableau.
    - La couleur cyan des fréquences fréquence-1 et 1 sert à montrer leur périodicité ternaire.
    - intercaln intercalx, pour les intercalaires négatifs minimaux et intercalaires positifs maximaux.
    - colonne ADN pour la longueur totale du génome en pbs et intercals pour le total en pbs des intercalaires entre cds uniquement, d'après la méthode des prélèvements de NCBI du 9.4.20.
mja Les fréquences des intercalaires entre cds
mjaintercalairestotal%intercalairesmoyenneecartypeplageADNintercalfrequence5
négatif21912.7négatif -1314-1 à -831 664 970-1219
zéro211.2intercals021
1 à 200127573.70 à 2006456151 5805128
201 à 3701669.6201 à 370265479.1%10100
371 à 600372.1371 à 6004385115102
601 à max120.7601 à 1028675392083
total 1730<20188total 172785109-83 à 7242573
adresseintercalxintercalfréquence1intercalfréquence6cumul,%intercalfréquence-13035
4703261019-1219-7030213539
47370859021-603-1254027
451281848130-501-204536
449897724240-405-305025
29122271139-3010min à -1-4775518
623421694438-2025219-526037
1432395694511-104412.7%-646522
694012687690149-737036
14616176857710228-8147521
117647262982020185-938027
32832962593530108-1018527
911715622102940661 à 200-11129044
10695854211235061935-1239522
916725271226605554.0%-13410033
69242852213207058-141010521
25618250114188048-15311017
137082649515159071-16211521
15863490161510055-17512025
424100489171211038-18212522
1547813489181912046-19213020
73799487192113042-20613525
1128054479201614051-21114026
777753478212015034-22014518
983847478221516031-23715016
13385204742310170211 à 200-24115515
5185624722414180281275-25416016
41008545625141902474%-26116511
1291124450261020025-27017010
160732144627821015-28117516
159612143928322022-29418012
43982743129623017-30018510
48990641730824012-31019014
966335417317250120 à 200-32519516
7338412326260712962232009
325298411331227013reste172056
111953940634132809total2402109
2581194003512901421511
365300422011
37431052255
3863201223012
391133032355
4013406201 à 3702407
reste90335031662456
total173036069.6%2506
37062554
38062603
39032657
adresseintercalndécalagelong40042706
349543-83shift263541012757
541115-73shift249842042802
575292-71shift214643002859
125178-64shift224644022905
1600078-62comp45022953
1611178-62shift2149946013001
28018-59shift249747003054
316817-49shift249548053101
1478759-48comp49043156
739648-44shift285150013206
875683-41shift263551013253
1378478-41shift2191052003300
12869-3953023355
1051112-385400371 à 6003401
1285398-385501373452
1623026-3856002.1%3501
697374-3557003553
1152607-345800601 à max3603
1328814-345900123654
139527-3260000.7%3702
312088-32reste12reste49
352843-32total1730total1730

mja autres intercalaires

  • Lien tableur: mja autres intercalaires
  • Légende:
    - comp, le gène est sur le brin complement
    - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
mja Les autres intercalaires.
mja1 adresses1
deb-fingènesadressesintercalsens
debCDS1664008?comp
repeat_region37889
finCDS2216comp
debCDS96499372comp
tRNA9742691comp
tRNA97629241
finCDS97958
debCDS110328250comp
tRNA11176619
finCDS111874
debCDS131467369
repeat_region132922114
finCDS134114comp
debCDS13724498
tRNA13834459comp
finCDS138479comp
debCDS153070182
rRNA154662207comp
tRNA15784764comp
rRNA157984340comp
finCDS159804
debCDS185874306comp
tRNA18697871
finCDS187138
debCDS19057931
tRNA19083232
finCDS190941
debCDS214560149comp
tRNA215210154
finCDS215452
debCDS22638664
tRNA227704239comp
finCDS228020
debCDS235984394
repeat_region23656497
finCDS238282comp
debCDS30362264
tRNA303992230
finCDS304312comp
debCDS351301129comp
repeat_region351694374
finCDS352843comp
debCDS357984220comp
tRNA35876823
tRNA358869164
debCDS35910848
tRNA359972103comp
finCDS360151comp
mja2 adresses2
deb-fingènesadressesintercalsens
debCDS862207179
tRNA86259041
debCDS86270386
tRNA86347914
tRNA8635708
tRNA86365683
tRNA86381613
rRNA86390346
tRNA86406480
finCDS864222
debCDS401945171
tRNA402968229comp
finCDS403274
debCDS427091467
repeat_region42857239
finCDS429676comp
debCDS498208604comp
repeat_region50149152
finCDS502042comp
debCDS506108484comp
repeat_region507264282
finCDS508398
debCDS551189251comp
ncRNA55254128
finCDS552885
debCDS618311402comp
tRNA61916063comp
finCDS619298comp
debCDS636394133
tRNA6375837
tRNA63766729
tRNA63777218
tRNA63786839
tRNA63798211
tRNA638081295
rRNA63844864
tRNA639995207
rRNA64027578
rRNA64333356
ncRNA643504232
finCDS643994
debCDS762859157
tRNA763766178comp
tRNA76402150
finCDS764147
mja3 adresses3
deb-fingènesadressesintercalsens
debCDS857400118comp
repeat_region858112532
finCDS858876
debCDS871492238
tRNA873686102comp
finCDS873866comp
debCDS88256665comp
tRNA883681123
finCDS883878comp
debCDS1033083474comp
repeat_region103482093
finCDS1035848comp
debCDS103719739comp
tRNA10385441comp
finCDS1038622comp
debCDS1047158568comp
repeat_region1049373181
finCDS1050484
debCDS1148669210comp
tRNA115014534
tRNA1150255243
finCDS1150574
debCDS1188906172comp
tRNA118994595
finCDS1190151
debCDS121859879
repeat_region1219844479
finCDS1220645comp
debCDS1266436484
repeat_region126704679
finCDS1267794comp
debCDS1312335383comp
tRNA1313165177
finCDS1313427
debCDS145522268
repeat_region1456715384
finCDS1457720comp
debCDS1568600484
repeat_region1570374121
finCDS1571017comp
debCDS1574035473
repeat_region1575519223
finCDS1576607

mja intercalaires tRNA

  • Lien tableur: mja intercalaires tRNA
  • Légende:
    - comp', l'intercalaire est entre un gène comp (sur le complément) et un gène sur le brin direct. Continu les 2 gènes sont sur le même brin.
    - deb, fin sont les intercalaires des cds du tableau précédent, autres intercalaires: respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
  • Cumuls comp'+continu du tableau
	deb	fin	total
<201	14	16	30
total	22	21	43
taux	64%	76%	70%
mja intercalaires tRNA
mja les relevés deb-fin
comp’entre tRNAscomp’debcomp’fin
comp’91372241
23comp’25019
7comp’9859
29comp’30671
183132
39comp’149154
11comp’64comp’239
comp’17864comp’230
14comp’220164
8comp’48103
83comp’171comp’229
3440263
133
comp’15750
17941
8680
comp’238102
comp’65comp’123
391
comp’210243
comp’17295
comp’383177
mja intercalaires inférieures à 201 pbs
debfincontinucumuls
311deb
3919<2016
6432total8
8641taux75%
13350
17959fin
37263<20115
40271total17
-80taux88%
-95
-102total
-103<20121
-154total25
-164taux84%
-177
-241
-243comp’cumuls
48123deb
64229<2018
65230total14
98239taux57%
149-
157-fin
171-<2011
172-total4
210-taux25%
220-
238-total
250-<2019
306-total18
383-taux50%

mja intercalaires rRNA

  • Voir la présentation des blocs à rRNA dans le chapitre mja blocs de l'étude préliminaire. A comparer avec le tableau mja autres intercalaires.
  • Remarque: Quand le 16s n'est pas précédé de tRNAs l'intercalaire cds-16s est élevé, il est ici pour les 2 blocs de 340 295 pbs. L'intercalaire cds-bloc de l'autre côté du bloc est beaucoup plus faible, il est ici pour les 2 blocs de, respectivement, 182 232 pbs. Cette orientation est quasiment générale chez tous les génomes que j'ai étudié ici. Je l'ai notée dans les chapitres génome-bloc de chaque génome.
  • Note: J'ai supposé souvent que les blocs à tRNA sans rRNA sont aussi orientés de l'intercalaire le plus grand au plus petit. Dans mja cumuls et de même pour les autres génomes, j'ai noté cette orientation dans la colonne cdsd, pour cds dirigé. Je n'ai conservé pour les calculs que le plus petit intercalaire des 2 cds bordant le bloc. L'idée était que cette orientation provoquait la création du cds en fin de bloc. Ces cds sont souvent de petites protéines et souvent hypothétiques. Aussi je présente ci-dessous la transformation deb-fin qui est imposée par l'adressage en intercalaire plus grand et plus petit.
deb	fin		tri	grand	petit
372	241		18	39	1
250	19		2	250	19
98	59		5	32	31
306	71		14	179	41
31	32		10	103	48
149	154		13	157	50
64	239		3	98	59
64	230		12	402	63
220	164		7	239	64
48	103		8	230	64
171	229		17	123	65
402	63		4	306	71
157	50		15	86	80
179	41		20	172	95
86	80		16	238	102
238	102		6	154	149
65	123		9	220	164
39	1		11	229	171
210	243		21	383	177
172	95		19	243	210
383	177		1	372	241

Methanosarcina barkeri str. Fusaro

mba opérons

  • Lien tableur: mba opérons
  • Liens: gtRNAdb , NCBI , génome
  • Phylogénie: Archaea; Euryarchaeota; Stenosarchaea group; Methanomicrobia; Methanosarcinales; Methanosarcinaceae; Methanosarcina.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
Ar3. mba opérons, Methanosarcina barkeri str. Fusaro
39.2%GC2.2.20 Paris62 doublesintercalcdsaaavec aacdsacdsdprotéines
91192..91938cds137137249DUF429 domain-containing protein
comp92076..92160ctc+132132
comp92293..92377ctc2 ctc298298
comp92676..93476cds267DNA-directed RNA polymerase subunit D
comp98630..99337cds535535236ABC transporter ATP-binding protein
comp99873..99955tcc222222
comp100178..101194cds339RNA-guided pseudouridylation complex pseudouridine synthase subunit Cbf5
comp146979..147518cds8080180tyrosine-type recombinase/integrase
comp147599..147670acc198198
comp147869..148381cds171DUF98 domain-containing protein
comp199345..200268cds492492308aldolase
comp200761..200833aac+7171
comp200905..200979atgi2 aac119119
comp201099..201171aac964964
202136..202366cds77hp
260990..261532cds173173181nitroreductase family protein"
261706..261777cgg673673
262451..262960cds170hp
comp463836..464723cds20752075296polyprenyl synthetase family protein
466799..466870gga9494
466965..467049cta221221
comp467271..468818cds516MBL fold metallo-hydrolase
473154..473723cds298298190hp
comp474022..474096gag246246
comp474343..475584cds414proteasome-activating nucleotidase
comp692109..692987cds349349293branched-chain-amino-acid transaminase
693337..693411aga400400
comp693812..694420cds203sulfite exporter TauE/SafE family protein
comp703446..703958cds488488171biotin transporter BioY
704447..704521agg283283
704805..705284cds160N-acetyltransferase
comp800463..800642cds79979960hp
comp801442..801526agc137137
comp801664..801978ncRNA@1327327315
802306..803931cds542methylamine methyltransferase corrinoid protein reductive activase
1109819..1110013cds151565hp
1110029..1110103atgf+6363
1110167..1110241atgf3 atg6363
1110305..1110379atgf273273
1110653..1111984cds444signal recognition particle protein
comp1134460..1135074cds235235205endonuclease III
comp1135310..1135381tgc+6565
comp1135447..1135518tgc2 tgc126126
comp1135645..1136277cds211hp
1137210..1137680cds488488157P-bacterioferritin
comp1138169..11382905s129122
comp1138420..114125223s2222833
comp1141475..114296316s8308301489
1143794..1145302cds5032-isopropylmalate synthase
comp1249870..1250040cds42342357CopG family transcriptional regulator
comp1250464..1250537aag546546
1251084..1251290cds69TRAM domain-containing protein
1315521..1315691cds@2-12-1257hp
comp1315680..1315751cgc174174
1315926..1317110cds395redox-regulated ATPase YchF
<comp1514831..1515373cds11331133181ArsR family transcriptional regulator
1516507..1516579caa760760
comp1517340..1517663cds108hp
comp1538879..1539286cds3636136sensor histidine kinase
comp1539323..1539395other@31249124973
>comp1540645..1540794cds50PKD domain-containing protein
comp1546247..1547791cds576576515aminotransferase class V-fold PLP-dependent enzyme
comp1548368..1548441aca448448
<1548890..1549093cds68matrixin family metalloprotease
1550566..1550760cds74574565DeoR family transcriptional regulator
comp1551506..1551579aca506506
1552086..1552640cds185YkgJ family cysteine cluster protein
1621639..1622835cds433433399methionine adenosyltransferase
1623269..1623384tac@4112112
1623497..1623569gac300300
comp1623870..1624067cds66hp
1714788..1715069cds15415494hp
comp1715224..1715295acg187187
comp1715483..1716493cds337class I SAM-dependent methyltransferase family protein
comp1755811..1755993cds11311361DNA-directed RNA polymerase subunit K
comp1756107..1756181ccg@500
comp1756182..1756370cds63DNA-directed RNA polymerase subunit N
1842058..1842195cds161646hp
comp1842212..1842285gtg717717
1843003..1843767cds255peptidase A24
comp1852573..1852896cds13641364108PadR family transcriptional regulator
comp1854261..1854338ccc198198
comp1854537..1855097cds187CDP-alcohol phosphatidyltransferase family protein
comp1908225..1908989cds349349255hp
comp1909339..1909530tgg445445
>1909976..1910152cds59nitrogenase reductase
1926717..1927178cds183183154DUF4145 domain-containing protein
comp1927362..1927445tcg125125
comp1927571..1928944cds458endonuclease Q family protein
comp2005431..2007053cds23152315541PKD domain-containing protein
comp2009369..2009443cca199199
comp2009643..2010194cds184UbiX family flavin prenyltransferase
comp2026807..2028456cds314314550ATP-dependent DNA ligase
2028771..2028842ggg513513
comp2029356..2029766cds137PaaI family thioesterase
2157926..2158684cds567567253hp
2159252..2159362atgj349349
2159712..2160225cds171amidohydrolase family protein
comp2194967..2195302cds713713112translation initiation factor eIF-1A
2196016..219750416s2221489
2197727..220055923s1292833
2200689..22008105s607607122
comp2201418..2201615cds66hp
>comp2434335..2434609cds60360392nucleoside deaminase
comp2435213..2435284gcc223223
2435508..2435584atc+7474
2435659..2435735atc2 atc241241
comp2435977..2436390cds138transcriptional regulator
2622097..2624025cds14891489643replication factor C large subunit
2625515..2625588gta11021102
2626691..2626918cds76hp
2650514..2651296cds164164261thiazole biosynthesis protein
2651461..2651532cac218218
2651751..2653460cds570radical SAM protein
2663547..2664668cds318318374PGF-pre-PGF domain-containing protein
comp2664987..2665058ggc263263
2665322..2666563cds414hp
2856552..2857409cds134134286hp
comp2857544..2857628tca153153
comp2857782..2858546cds255peptidylprolyl isomerase
3326036..3326557cds539539174hp
3327097..3327168tgc995995
3328164..3328898cds245hp
3994472..3994921cds514514150IS200/IS605 family transposase
comp3995436..3995529cga477477
3996007..3996714cds236hp
4005709..4006026cds269269106divalent-cation tolerance protein CutA
4006296..4006378ttg860860
4007239..4009012rpr@61691691774Family CRISPR
comp4009182..4009478cds99CRISPR-associated endonuclease Cas2
comp4031590..4031871cds1075107594hp
4032947..4033019cag182182
comp4033202..4033765cds188hp
comp4041205..4041960cds9696252MBL fold metallo-hydrolase
4042057..4042141tta375375
comp4042517..4044976cds820beta-propeller fold lactonase family protein
comp4045359..4048274cds718718972PKD domain-containing protein
4048993..4049077tta3535
comp4049113..4052403cds2412411097PGF-pre-PGF domain-containing protein
4052645..4052729tta177177
comp4052907..4053395cds163MarR family transcriptional regulator
4407561..4407830cds646490elongation factor 1-beta
4407895..4407966gcg675675
comp4408642..4409715cds358radical SAM protein
comp4504139..4504300cds53653654hp
comp4504837..4504921ctg220220
comp4505142..4506050cds303ornithine carbamoyltransferase
comp4551177..4551851cds566566225MBL fold metallo-hydrolase
4552418..4552491gtc+9494
4552586..4552660ttc2 gtc77
4552668..4552739ggc2 ttc6161
4552801..4552874gtc2 ggc9494
4552969..4553043ttc77
4553051..4553122ggc717717
4553840..4554052cds71MoaD/ThiS family protein
4617920..4618339cds200200140hp
4618540..4618617gaa351351
4618969..4619190cds37737774hp
4619568..4619645gaa214214
comp4619860..4620678cds273hp
4673041..4673643cds289289201adenosylcobinamide amidohydrolase
comp4673933..46740545s129122
comp4674184..467701623s1352833
comp4677152..4677224gca79
comp4677304..467879216s124212421489
4680035..4680817cds261methanol-5-hydroxybenzimidazolylcobamide methyltransferase
comp4759174..4759410cds898979DNA-directed RNA polymerase subunit H
comp4759500..4759576aaa655655
comp4760232..4760801cds190DJ-1/PfpI family protein

mba cumuls

cumuls. mba.
opéronsFréquences intercalaires tRNAsFréquences intercalaires cdsFréquences aas cds chromosome
effectifgammessans rRNAsavec rRNAsgammescdsgammescdsdgammescdsagammescdsa 300
avec rRNAopérons310-12110025300
16 23 5s 022025042020027607
16 gca 2351400100440300219014
16 23 5s a060015066040081208
max a1806200148050041505
a doubles010032509100600718010
autres012023008120700121011
total aas11401350614080002404
sansopérons4416004004160900127010
1 aa3718004504180100013004
max a620005004200110013302
a doubles6135021
total aas6115010009696
total aas62
remarques6
avec jaunemoyenne85457240
variance52407194
sans jaunemoyenne51210186158
variance289810678

mba blocs

Ar3. mba blocs, Methanosarcina barkeri str. Fusaro
cds289201adenosylcobinamide amidohydrolase
5s129122
23s1352833
gca79
16s12421489
cds261methanol-5-hydroxybenzimidazolylcobamide methyltransferase
cds713112translation initiation factor eIF-1A
16s2221489
23s1292833
5s607122
cds66hp
cds488157P-bacterioferritin
5s129122
23s2222833
16s8301489
cds5032-isopropylmalate synthase

mba remarques

  • Lien tableur: mba remarques
  • Remarques un génome avec beaucoup de doubles dont une séquence de 3 aas.
    1. @ ncRNA, dans le même ques l que’aa, taille de 315 pbs.
    2. @ intercalaire négatif du au changement de sens
    3. @ un autre aa, other
    4. @ 4 introns
      - tac 1623269..1623304,1623349..1623384
      - tgg 1909339..1909374,1909493..1909530
      - atgj 2159252..2159289,2159327..2159362
      - cga 3995436..3995470,3995491..3995529
    5. @ un intercalaire nul sans changement de sens
    6. @ rpr, repeat région famille CRISPR, assez grand 1774 pbs. Dans le même sens que l’aa.
  • Séquence des doubles: 6 clusters avec des doubles dont une séquence de 3 aas et un triplet.
    - 2 doublets seuls ctc tgc
    - gcc 2atc
    - aac atgi aac
    - 3 atgf
    - 2 (gtc ttc ggc)
  • Tableau du code génétique de mba
    Légende: prélèvement de la base gtRNAdb le 2.2.20
    • - totaux en en-tête, 62 total de gtRNAdb contenant des pseudo et inconnus; 62 total du cumul.
    • - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    • - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    • - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
    • - Voir la légende des tris et couleurs, g1 t1.
Ar3. mba, Methanosarcina barkeri str. Fusaro
g1t16262
atgi1tcttatatgf3
attactaatagt
cttcctcatcgt
gttgctgatggt
ttc2tcc1tac1tgc4
atc2acc1aac2agc1
ctc2ccc1cac1cgc1
gtc2gcc1gac1ggc3
tta3tca1taatga
ataaca2aaa1aga1
cta1cca1caa1cga1
gta1gca1gaa2gga1
ttg1tcg1tagtgg1
atg1acg1aag1agg1
ctg1ccg1cag1cgg1
gtg1gcg1gag1ggg1
  • intercalaires élevés avec le cds 43/100
1315680	cgc	-12	comp
1756107	ccg	0	
			
1250464	aag	423	
1623269	tac	433	
1909339	tgg	445	comp
1548368	aca	448	comp
3995436	cga	477	comp
704447	agg	488	comp
1138169	5s	488	comp
200761	aac	492	
1551506	aca	506	comp
2028771	ggg	513	comp
3995436	cga	514	comp
99873	tcc	535	
4504837	ctg	536	
3327097	tgc	539	
1250464	aag	546	comp
4552418	gtc	566	comp
2159252	atgj	567	
1548368	aca	576	
2435213	gcc	603	
2200689	5s	607	comp
4759500	aaa	655	
261706	cgg	673	
4407895	gcg	675	comp
2194967	16s	713	comp
1842212	gtg	717	comp
4553840	ggc	717	
4048993	tta	718	comp
1551506	aca	745	comp
1516507	caa	760	comp
801442	agc	799	
1141475	16s	830	comp
4006296	ttg	860	
201099	aac	964	comp
3327097	tgc	995	
4032947	cag	1075	comp
2625515	gta	1102	
1516507	caa	1133	comp
4677304	16s	1242	comp
1539323	other	1249	
1854261	ccc	1364	
2625515	gta	1489	
466799	gga	2075	
2009369	cca	2315	
moyenne		795	
écart		415	
  • intercalaires élevés entre aas
ttc-ggc		7	
ttc-ggc		7	
ggc-gtc		61	
atgf-atgf	63	
atgf-atgf	63	
tgc-tgc		65	
aac-atgi	71	
atc-atc		74	
--	--	
gga-cta		94	
gtc-ttc		94	
gtc-ttc		94	
tac-gac		112	intron
atgi-aac	119	intron
ctc-ctc		132	
gcc-atc		223	

mba distribution

Ar3. mba distribution, Methanosarcina barkeri str. Fusaro. Archée
g1t1 
atgi1tcttatatgf3
attactaatagt
cttcctcatcgt
gttgctgatggt
ttc2tcc1tac1tgc3
atc2acc1aac2agc1
ctc2ccc1cac1cgc1
gtc2gcc1gac1ggc3
tta3tca1taatga
ataaca2aaa1aga1
cta1cca1caa1cga1
gta1gca1gaa2gga1
ttg1tcg1tagtgg1
atgj1acg1aag1agg1
ctg1ccg1cag1cgg1
gtg1gcg1gag1ggg1
arch>1aa=1aa-5s+5s-16s+16stotal
mba23 *37 *161

mba intercalaires entre cds

  • Lien NCBI 17.12.20
  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

mba les fréquences

  • Lien tableur: mba intercalaires entre cds
  • Légende: long, longueur en pbs, intercal pour intercalaire
    - fréquence-1 1 5 6 f, respectivement fréquence des intercalaires négatives à l'unité, positives à l'unité, par blocs de 5, par blocs de 10 jusqu'à 600 pbs et f pour finales. Ces fréquences servent à faire les diagrammes. La fréquence fréquencez est l'étendue à 1200 de la fréquence6 pour certains grands génomes.
    - cumul,% colonne à la droite de frequence6, reprend les fréquences par plages et leurs pourcentages indiqués déjà dans la 1ère partie du tableau.
    - La couleur cyan des fréquences fréquence-1 et 1 sert à montrer leur périodicité ternaire.
    - intercaln intercalx, pour les intercalaires négatifs minimaux et intercalaires positifs maximaux.
    - colonne ADN pour la longueur totale du génome en pbs et intercals pour le total en pbs des intercalaires entre cds uniquement, d'après la méthode des prélèvements de NCBI du 17.12.20.
mba Les fréquences des intercalaires entre cds
mbaintercalairestotal%intercalairesmoyenneecartypeplageADNintercalfrequence5intercalfréquencez
négatif3298.3négatif -1213-1 à -744 837 408-132961021
zéro220.6intercals02262023
1 à 200147837.50 à 20085621 292 909511063021
201 à 37078219.8201 à 3702784826.7%105364020
371 à 60064316.3371 à 60047566157365014
601 à max68917.5601 à 1028920310206766022
total 3943<20146total 3938324341-74 à 2323254667014
adresseintercalxintercalfréquence1intercalfréquence6cumul,%intercalfréquence-1303768028
30950402919-1329-70102235396906
5264342894022-600-133405470011
17885532705122-508-22453571020
20020902693233-407-32503172014
46313352517312-3014min à -1-412055347307
8181732323419-2034329-51604574016
27978302322524-10668.3%-62653475020
379961223096150221-75702576012
37614522997410163-833753477018
365374022828620140-91803678012
48095962233983083-10485417908
11879522165102040931 à 100-111390308007
4415180216111185066900-12095278106
32689952076128607922.8%-135100278208
372411196413197059-1418105238308
3552425194614158070-150110318409
3151269190115139071-1651153285013
36039171870161410054-1712120418606
5420321854171111054-1851252587018
6827851848181612073-194130258808
3195397179719813050-2081352489010
24846251761201814055-210140319009
3100209175421915071-221145429107
27241771733221216047-236150299205
9124061712236170581 à 200-240155239304
244866017072414180601478-255160249407
275085316772551907537.5%-2691652295015
4703857162426620057-271170369609
9748311613271121039-283175299705
4637075160028522074-291180319809
2503952159629523051-300185399908
5116261595301024047-3101903610009
27056101569313250510 à 200-3241953310103
390808415683262605915003252002410209
2490112155733827053reste262051910304
637861555341028055total3512102010407
13665315533512290422154610503
95859715493614300352202810607
30114915483793104322529107010
11655461516381132044intercalfrequencef2302210805
39103303760032542352410903
401034049201 à 3707001802402311001
reste3113350407828001342452911108
total39433603219.8%900952502211204
370311000782553011303
adressesintercalndécalagelong380361100522602911404
4403838-74comp390231200412652611503
1874377-59shift2688400371300302702711605
4136612-59shift2694410341400222752211704
493240-56shift2127420311500152803311803
942901-56shift2601430431600132852011903
4169341-56shift223844034170032902212004
4335751-56shift2445450301800629520580
4374865-55comp460271900330015reste109
2801727-51comp470312000330518total3943
1742959-49shift22660480282100131025
2882494-49shift21325490282200231524
3292321-49shift2101500262300332020
2440972-47shift2664510222400332519
4561346-44shift21744520322500033018
1057681-41shift2394530252600133521
1723225-41comp54020371 à 6002700134028
82489-38550236432800134521
222695-385602216.3%2900135019
3533580-38570223000135519
1573832-3558028601 à max68936013
1931905-355901868936515
3122151-356002317.5%37016
3337334-35reste689reste0reste1332
4054645-35total3943total3943total3943

mba autres intercalaires

  • Lien tableur: mba autres intercalaires
  • Légende:
    - comp, le gène est sur le brin complement
    - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
mba Les autres intercalaires.
mba1 adresses1
deb-fingènesadressesintercalsens
debCDS91192137
tRNA92076132comp
tRNA92293298comp
finCDS92676comp
debCDS98630535comp
tRNA99873222comp
finCDS100178comp
debCDS14697980comp
tRNA147599198comp
finCDS147869comp
debCDS199345492comp
tRNA20076171comp
tRNA200905119comp
tRNA201099790comp
finCDS201962
debCDS260990173
tRNA261706673
finCDS262451
debCDS355894309
repeat_region356467137
finCDS359947
debCDS4638362075comp
tRNA46679994
tRNA466965221
finCDS467271comp
debCDS473154298
tRNA474022246comp
finCDS474343comp
debCDS692109349comp
tRNA693337400
finCDS693812comp
debCDS703446488comp
tRNA704447307
finCDS704829
debCDS800463799comp
tRNA801442137comp
ncRNA801664327comp
finCDS802306
debCDS110981915
tRNA111002963
tRNA111016763
tRNA1110305273
finCDS1110653
debCDS1134460235comp
tRNA113531065comp
tRNA1135447126comp
finCDS1135645comp
debCDS1137210488
rRNA113816974comp
rRNA1138365209comp
rRNA1141481835comp
finCDS1143794
debCDS1249870423comp
tRNA1250464546comp
finCDS1251084
debCDS1315521-12
tRNA1315680174comp
finCDS1315926
mba2 adresses2
deb-fingènesadressesintercalsens
debCDS1516050286comp
tRNA1516507760
finCDS1517340comp
debCDS153887936comp
tRNA15393231249comp
finCDS1540645comp
debCDS1546247576comp
tRNA1548368448comp
finCDS1548890
debCDS1550566745
tRNA1551506506comp
finCDS1552086
debCDS1621639433
tRNA1623269112
tRNA1623497300
finCDS1623870comp
debCDS1657967616comp
repeat_region166024274
finCDS1661656
debCDS1714788154
tRNA1715224187comp
finCDS1715483comp
debCDS1755811113comp
tRNA17561070comp
finCDS1756182comp
debCDS184205816
tRNA1842212717comp
finCDS1843003
debCDS18525731379comp
tRNA1854261198comp
finCDS1854537comp
debCDS1908225349comp
tRNA1909339445comp
finCDS1909976
debCDS1926495183
tRNA1927362125comp
finCDS1927571comp
debCDS197503878
ncRNA1976292428comp
finCDS1977078
debCDS20054312315comp
tRNA2009369199comp
finCDS2009643comp
debCDS2026807314comp
tRNA2028771513
finCDS2029356comp
debCDS2157926567
tRNA2159252349
finCDS2159712
debCDS2194967718comp
rRNA2196021209
rRNA219770874
rRNA2200689607
finCDS2201418comp
debCDS2434335603comp
tRNA2435213223comp
tRNA243550874
tRNA2435659241
finCDS2435977comp
mba3 adresses3
deb-fingènesadressesintercalsens
debCDS26220971489
tRNA26255151102
finCDS2626691
debCDS2650514164
tRNA2651461218
finCDS2651751
debCDS2663547318
tRNA2664987263comp
finCDS2665322
debCDS2856552134
tRNA2857544153comp
finCDS2857782comp
debCDS3326036539
tRNA3327097995
finCDS3328164
debCDS3994472514
tRNA3995436477comp
finCDS3996007
debCDS4005709269
tRNA4006296860
repeat_region4007239169
finCDS4009182comp
debCDS40315901075comp
tRNA4032947182
finCDS4033202comp
debCDS404120596comp
tRNA4042057375
finCDS4042517comp
debCDS4045359718comp
tRNA404899335
debCDS4049113241comp
tRNA4052645177
finCDS4052907comp
debCDS440756164
tRNA4407895675
finCDS4408642comp
debCDS4504139536comp
tRNA4504837220comp
finCDS4505142comp
debCDS4551177566comp
tRNA455241894
tRNA45525867
tRNA455266861
tRNA455280194
tRNA45529697
tRNA4553051717
finCDS4553840
debCDS4617920200
tRNA4618540351
debCDS4618969377
tRNA4619568214
finCDS4619860comp
debCDS4673041289
rRNA467393374comp
rRNA4674129116comp
tRNA467715285comp
rRNA46773101247comp
finCDS4680035
debCDS475917489comp
tRNA4759500655comp
finCDS4760232comp

mba intercalaires tRNA

  • Lien tableur: mba intercalaires tRNA
  • Légende:
    - comp', l'intercalaire est entre un gène comp (sur le complément) et un gène sur le brin direct. Continu les 2 gènes sont sur le même brin.
    - deb, fin sont les intercalaires des cds du tableau précédent, autres intercalaires: respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
  • Cumuls comp'+continu du tableau
	deb	fin	toal
<201	16	12	28
total	46	44	90
taux	35%	27%	31%
mba intercalaires tRNA
mba les relevés deb-fin
comp’entre tRNAscomp’debcomp’fin
132comp’137298
535222
80198
71 119492comp’790
173673
94comp’2075comp’221
comp’298246
comp’349comp’400
comp’488307
799
63 6315273
65235126
423comp’546
comp’-12comp’174
comp’286comp’760
361249
576comp’448
comp’745comp’506
112433comp’300
comp’154187
1130
comp’16comp’717
1379198
349comp’445
comp’183125
2315199
comp’314comp’513
567349
comp’223603comp’241
74
14891102
164218
comp’318comp’263
comp’134153
539995
comp’514comp’477
269
comp’1075comp’182
comp’96comp’375
comp’718comp’35
comp’241comp’177
64comp’675
536220
94 7 61 94 7comp’566717
200351
377comp’214
89655
mba intercalaires inférieures à 201 pbs
debfincontinucumuls
150deb
36125<2019
64126total25
80153taux36%
89187
113198fin
164198<2018
173199total23
200218taux35%
235220
269222total
349246<20117
377273total48
423298taux35%
433307
535349
536351
539655
567673
576717
603995
7991102
13791249
1489-
2315-comp’cumuls
-1235
16174deb
96177<2017
134182total21
137214taux33%
154221
183241fin
241263<2014
286300total21
298375taux19%
314400
318445total
349448<20111
488477total42
492506taux26%
514513
566546
718675
745717
1075760
2075790

mba intercalaires rRNA

  • Voir la présentation des blocs à rRNA dans le chapitre mba blocs de l'étude préliminaire. A comparer avec le tableau mba autres intercalaires.
  • Remarque: Quand le 16s n'est pas précédé de tRNAs l'intercalaire cds-16s est élevé, il est ici pour les 3 blocs de 1242 713 830. L'intercalaire cds-bloc de l'autre côté du bloc est beaucoup plus faible, il est ici pour les 3 blocs de, respectivement, 289 607 488 pbs. Cette orientation est quasiment générale chez tous les génomes que j'ai étudié ici. Je l'ai notée dans les chapitres génome-bloc de chaque génome.
  • Note: J'ai supposé souvent que les blocs à tRNA sans rRNA sont aussi orientés de l'intercalaire le plus grand au plus petit. Dans mba cumuls et de même pour les autres génomes, j'ai noté cette orientation dans la colonne cdsd, pour cds dirigé. Je n'ai conservé pour les calculs que le plus petit intercalaire des 2 cds bordant le bloc. L'idée était que cette orientation provoquait la création du cds en fin de bloc. Ces cds sont souvent de petites protéines et souvent hypothétiques. Aussi je présente ci-dessous la transformation deb-fin qui est imposée par l'adressage en intercalaire plus grand et plus petit.
deb	fin		tri	grand	petit		deb	fin		tri	grand	petit
137	298		13	174	-12		349	445		43	377	214
535	222		20	113	0		183	125		40	536	220
80	198		10	273	15		2315	199		6	2075	221
492	790		21	717	16		314	513		2	535	222
173	673		37	718	35		567	349		28	603	241
2075	221		15	1249	36		603	241		7	298	246
298	246		39	675	64		1489	1102		31	318	263
349	400		3	198	80		164	218		14	760	286
488	307		44	655	89		318	263		18	433	300
15	273		36	375	96		134	153		9	488	307
235	126		24	183	125		539	995		26	513	314
423	546		11	235	126		514	477		8	400	349
-12	174		32	153	134		1075	182		23	445	349
286	760		1	298	137		96	375		27	567	349
36	1249		19	187	154		718	35		12	546	423
576	448		30	218	164		241	177		16	576	448
745	506		5	673	173		64	675		34	514	477
433	300		38	241	177		536	220		4	790	492
154	187		35	1075	182		566	717		17	745	506
113	0		22	1379	198		200	351		33	995	539
16	717		25	2315	199		377	214		41	717	566
1379	198		42	351	200		89	655		29	1489	1102

Methanosarcina sp. WH1

mfe opérons

  • Lien tableur: mfe opérons
  • Liens: gtRNAdb , NCBI , génome , %GC 41.80
  • Phylogénie: Archaea; Euryarchaeota; Stenosarchaea group; Methanomicrobia; Methanosarcinales; Methanosarcinaceae; Methanosarcina; unclassified Methanosarcina
  • Légende: cdsa: cds aas, cdsd: cds dirigé
Ar4. mfe opérons, Methanosarcina sp. WH1
40.2%GC2.2.20 Paris56 doublesintercalcdsaaavec aacdsacdsdprotéines
comp38726..40264cds6986985132-isopropylmalate synthase
40963..4245016s2081488
42659..4549123s1302833
45622..457435s857857122
46601..47164cds102102188hp
47267..47338tgc+7272
47411..47482tgc2 tgc411411
47894..48508cds205endonuclease III
comp71092..72423cds384384444signal recognition particle protein
comp72808..72882atgf+8989
comp72972..73046atgf2 atgf234234
73281..73472cds64hp
comp175573..176153cds163163194hp
comp176317..176389gac111111
comp176501..176614tac@1295295
176910..177248cds113hp
comp214884..215966cds801801361hp
comp216768..216841aca150150
216992..217582cds197aldolase
comp372219..373091cds558558291hp
comp373650..373723gtg340340
374064..374828cds255peptidase A24
comp379248..381950cds10761076901DNA mismatch repair protein MutS
comp383027..383104ccc193193
comp383298..383882cds195CDP-alcohol phosphatidyltransferase family protein
comp532751..533176cds356356142hp
comp533533..533607cca149149
comp533757..534308cds184UbiX family flavin prenyltransferase
comp598666..599850cds170170395redox-regulated ATPase YchF
600021..600092cgc341341
600434..600868cds145cell surface lipoprotein
680493..681734cds185185414proteasome-activating nucleotidase
681920..681994gag242242
>682237..682560cds108p-IS200/IS605 family transposase
689062..689631cds3636190phosphatase PAP2 family protein
comp689668..689752cta7373
comp689826..689897gga14811481
691379..691483cds35CcmD family protein
comp793563..795017cds111111485p-IS66 family transposase
comp795129..795213ctc+117117
comp795331..795418ctc2 ctc235235
comp795654..796454cds267DNA-directed RNA polymerase subunit D
810088..810471cds861861128hp
comp811333..811415tcc123123
comp811539..812555cds339RNA-guided pseudouridylation complex pseudouridine synthase subunit Cbf5
comp893309..894232cds391391308aldolase
comp894624..894696aac+8787
comp894784..894858atgi2 aac110110
comp894969..895041aac14151415
comp896457..897506cds350TIGR00303 family protein
949570..950112cds208208181nitroreductase family protein
950321..950392cgg498498
comp950891..952300cds470NADPH-dependent glutamate synthase
1088496..1090946cds360360817PGF-pre-PGF domain-containing protein
comp1091307..1091378gcc227227
1091606..1091682atc+6262
1091745..1091818atc2 atc353353
comp1092172..1092585cds138transcriptional regulator
1155736..1156137cds210210134AsnC family transcriptional regulator
1156348..1156425gaa+718718
1157144..1157221gaa2 gaa233233
comp1157455..1158645cds@4397ISH3 family transposase
comp1199367..1200149cds967967261methanol-5-hydroxybenzimidazolylcobamide methyltransferase
1201117..120260416s801488
1202685..1202757gca135
1202893..120572523s1302833
1205856..12059775s55122
comp1205983..1206231cds83hp
1207508..1211485cds12121326PAS domain S-box protein
comp1211498..1211582ctg190190
comp1211773..1212681cds303ornithine carbamoyltransferase
comp1220571..1220783cds59659671MoaD/ThiS family protein
comp1221380..1221451ggc+2525
comp1221477..1221551ttc2 ggc5757
comp1221609..1221682gtc2 ttc7171
comp1221754..1221825ggc2 gtc2525
comp1221851..1221925ttc118118
comp1222044..1222117gtc358358
1222476..1223792cds439methanogenesis marker 16 metalloprotein
1400830..1401773cds914914315helix-turn-helix domain-containing protein
1402688..1402761gta287287
1403049..1403276cds76hp
comp1504221..1505630cds686686470F0F1 ATP synthase subunit beta
comp1506317..1506410cga750750
1507161..1508039cds293response regulator
1513245..1513562cds213213106divalent-cation tolerance protein CutA
1513776..1513858ttg268268
>1514127..1514647cds174p-IS1634 family transposase
1887880..1888338cds392392153pyridoxamine 5'-phosphate oxidase family protein
comp1888731..1888802ggc378378
1889181..1890518cds446DHH family phosphoesterase
1962666..1963553cds130130296hp
comp1963684..1963768tta235235
1964004..1964759cds252MBL fold metallo-hydrolase
1971331..1971852cds319319174hp
comp1972172..1972244cag204204
comp1972449..1972850cds134hp
comp2170713..2172446cds156156578radical SAM protein
comp2172603..2172674cac174174
comp2172849..2173631cds261thiazole biosynthesis protein
<comp2320809..2321131cds141141108p-IS200/IS605 family transposase
comp2321273..2321344gcg6565
comp2321410..2321679cds90elongation factor 1-beta
2387890..2388675cds150150262peptidylprolyl isomerase
2388826..2388911tca326326
comp2389238..2389453cds72hp
comp2678132..2678368cds858579DNA-directed RNA polymerase subunit H
comp2678454..2678530aaa824824
comp2679355..2679537cds61hp
3091524..3091754cds27127177hp
comp3092026..30921475s130122
comp3092278..309511023s2082833
comp3095319..309680616s8398391488
3097646..3097975cds110translation initiation factor eIF-1A
comp3153517..3155214cds599599566diguanylate phosphodiesterase
comp3155814..3155923atgj799799
3156723..3157106cds128tRNA CCA-pyrophosphorylase
comp3241682..3242944cds473473421diaminopimelate decarboxylase
3243418..3243489ggg377377
3243867..3244073cds69hp
3341829..3342017cds@20063DNA-directed RNA polymerase subunit N
3342018..3342092ccg112112
3342205..3342387cds61DNA-directed RNA polymerase subunit K
3358176..3359186cds533533337class I SAM-dependent methyltransferase family protein
3359720..3359791acg5252
comp3359844..3360305cds154peroxiredoxin
comp3397316..3398947cds422422544methylamine methyltransferase corrinoid protein reductive activase
3399370..3399684ncRNA@3149149315
3399834..3399918agc230230
3400149..3400847cds233ATPase
3435506..3436918cds181181471phosphotransferase
3437100..3437183tcg273273
3437457..3437948cds870870164rubrerythrin family protein
3438819..3438989cds10710757hp
3439097..3439289tgg4242
comp3439332..3439484cds51hp MLELDILDLDILDLDILDLKILELEILELEVLELEILELEILELEVLVQS
3456114..3456473cds260260120hp
comp3456734..3456805acc200200
comp3457006..3457518cds171DUF98 domain-containing protein
comp3583589..3584044cds295295152N-acetyltransferase
comp3584340..3584414agg339339
3584754..3585317cds188biotin transporter BioY
3593430..3593861cds343343144PspC domain-containing protein
comp3594205..3594279aga348348
3594628..3595506cds293branched-chain-amino-acid transaminase
3603458..3603697cds38938980type II toxin-antitoxin system HicB family antitoxin
3604087..3604159caa633633
comp3604793..3606301cds503lipopolysaccharide biosynthesis protein
comp3856073..3856279cds40240269TRAM domain-containing protein
3856682..3856755aag498498
3857254..3857424cds57CopG family transcriptional regulator

mfe cumuls

cumuls. mfe.
opéronsFréquences intercalaires tRNAsFréquences intercalaires cdsFréquences aas cds chromosome
effectifgammessans rRNAsavec rRNAsgammescdsgammescdsdgammescdsagammescdsa 300
avec rRNAopérons310-11110018300
16 23 5s 022005042020029604
16 gca 2351402100340300129014
16 23 5s a0601150116040091206
max a180420098050091508
a doubles010022501010060051807
autres01204300712070002109
total aas11400350714080002401
sansopérons4016004001016090012706
1 aa3118004503180100013004
max a620005003200110003303
a doubles7220123
total aas551508808585
total aas56
remarques
avec jaunemoyenne131376255
variance169299210
sans jaunemoyenne55223207157
variance2110812780

mfe blocs

Ar4. mfe blocs, Methanosarcina sp. WH1
cds6985132-isopropylmalate synthase
16s2081488
23s1302833
5s857122
cds102188hp
cds967261methanol-5-hydroxybenzimidazolylcobamide methyltransferase
16s801488
gca135
23s1302833
5s5122
cds83hp
cds27177hp
5s130122
23s2082833
16s8391488
cds110translation initiation factor eIF-1A

mfe remarques

  • Lien tableur: mfe remarques
  • Remarques un génome avec beaucoup de doubles dont une séquence de 3 aas.
    1. @ ncRNA, dans le même ques l que’aa, taille de 315 pbs.
    2. @ 4 introns
      - tac 176501..176536,176579..176614
      - tgg 3439097..3439134,3439254..3439289
      - atgj 3155814..3155849,3155886..3155923
      - cga 1506317..1506351,1506372..1506410
    3. @ un intercalaire nul sans changement de sens
    4. @ intercalaire très élevé 718 pbs entre 2 aas, le nouveau doublet gaa.
  • Séquence des doubles: 7 clusters avec des doubles dont une séquence de 3 aas
    - 4 doublets seuls ctc tgc atgf gaa
    - gcc 2atc
    - aac atgi aac
    - 2 (gtc ttc ggc)
    - par rapport à mja un noveau doublet, gaa. Le triplet atgf est changé en doublet. Les autres restent identiques.
  • Tableau du code génétique de mfe
    Légende: prélèvement de la base gtRNAdb le 2.2.20
    • - totaux en en-tête, 56 total de gtRNAdb contenant des pseudo et inconnus; 56 total du cumul.
    • - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    • - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    • - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
    • - Voir la légende des tris et couleurs, g1 t1.
Ar4. mfe, Methanosarcina sp. WH1
g1t15656
atgi1tcttatatgf2
attactaatagt
cttcctcatcgt
gttgctgatggt
ttc2tcc1tac1tgc2
atc2acc1aac2agc1
ctc2ccc1cac1cgc1
gtc2gcc1gac1ggc3
tta1tca1taatga
ataaca1aaa1aga1
cta1cca1caa1cga1
gta1gca1gaa2gga1
ttg1tcg1tagtgg1
atg1acg1aag1agg1
ctg1ccg1cag1cgg1
gtg1gcg1gag1ggg1
  • intercalaires élevés avec le cds 26/88
3856682	aag	402	comp
47411	tgc	411	
3399370	ncRNA	422	comp
3243418	ggg	473	comp
950321	cgg	498	comp
3856682	aag	498	
3359720	acg	533	
373650	gtg	558	
1221380	ggc	596	
3155814	atgj	599	
3604087	caa	633	comp
1506317	cga	686	
40963	16s	698	comp
1506317	cga	750	comp
3155814	atgj	799	comp
216768	aca	801	
2678454	aaa	824	
3095319	16s	839	comp
45622	5s	857	
811333	tcc	861	comp
3438819	cds	870	
1402688	gta	914	
1201117	16s	967	comp
383027	ccc	1076	
894969	aac	1415	
689826	gga	1481	comp
  • intercalaires élevés entre aas
ggc-ttc		25
ggc-ttc		25
ttc-gtc		57
atc-atc		62
gtc-ggc		71
tgc-tgc		72
cta-gga		73
aac-atgi	87
atgf-atgf	89
atgi-aac	110
gac-tac		111
ctc-ctc		117
ttc-gtc		118
gcc-atc		227
gaa-gaa		718

mfe distribution

Ar4. mfe distribution, Methanosarcina sp. WH1. Archée
g1t1 
atgi1tcttatatgf2
attactaatagt
cttcctcatcgt
gttgctgatggt
ttc2tcc1tac1tgc2
atc2acc1aac2agc1
ctc2ccc1cac1cgc1
gtc2gcc1gac1ggc3
tta1tca1taatga
ataaca1aaa1aga1
cta1cca1caa1cga1
gta1gca1gaa2gga1
ttg1tcg1tagtgg1
atgj1acg1aag1agg1
ctg1ccg1cag1cgg1
gtg1gcg1gag1ggg1
arch>1aa=1aa-5s+5s-16s+16stotal
mfe24 *31 *156

archées synthèse

archées distribution par génome

archées distribution par génome
arch>1aa1aa-5s+5s-16s+16sduplica1-3aastotal
mba14371961
mfe143111056
mfi2520247
mja816146237
total611041466190201

archées distribution du total

  • Lien tableur: archées distribution du total
  • Liens indices: euryarchaeota
  • Notes: Les -5s +5s et -16s sont colorés et correspondent à un seul tRNA du génome mja. Les +16s sont tout les 6 des gca. Les -16s sont d'un seul bloc de 6 aas. Les -5s et +5s sont inversés dans le bloc 4aas-5s-gac.
  • Légende: Tableau des indices, en-tête: total des génomes, total des tRNAs, indice ttt, indice tgt.
Euryarcheota. distribution et indices.
Euryarcheota. distribution du total
g1t1 
atgi4tcttatatgf7
attactaatagt
cttcctcatcgt
gttgctgatggt
ttc6tcc4tac4tgc8
atc6acc4aac7agc4
ctc6ccc3cac4cgc4
gtc6gcc4gac4ggc8
tta6tca4taatga1
ataaca5aaa5aga4
cta4cca4caa5cga4
gta4gca6gaa7gga4
ttg3tcg3tagtgg4
atgj4acg3aag3agg3
ctg3ccg2cag3cgg2
gtg4gcg3gag2ggg3
arch>1aa=1aa-5s+5s-16s+16stotal
total801041466201
Euryarchaeota. indices du 16.1.21 143 génomes
g1t1143693500
atgi99tcttatatgf127
attactaatagt
ctt0.7cctcatcgt0.7
gttgctgatggt0.7
ttc122tcc106tac104tgc181
atc121acc104aac122agc104
ctc122ccc93cac101cgc102
gtc121gcc101gac124ggc141
tta107tca101taatga13
ataaca110aaa110aga103
cta103cca102caa108cga103
gta103gca151gaa132gga103
ttg87tcg87tagtgg102
atgj101acg90aag87agg88
ctg85ccg78cag87cgg71
gtg91gcg84gag84ggg79
intermaxmintotal
eury

archées distribution par type

  • Lien tableur: archées distribution par type
  • Notes: Le cyan pour les effectifs élevés des solitaires, le jaune celui des multiples sans duplicata et le blanc, le reste. En rapportant au total de chaque type je constate que les 3 processus sont distincts et se chevauchent très peu, respectivement pour 1aa >1aa duplicata, % 65 61 79.
	1aa		>1aa		duplica	%
	104	%	61	%	19	
jaune	4	4	37	61	0	0
cyan	68	65	7	11	4	21
blanc	32	31	17	28	15	79
Archées. Distribution par type.
Archées. distribution des solitaires
g1t1 
atgitcttatatgf2
attactaatagt
cttcctcatcgt
gttgctgatggt
ttctcc4tactgc3
atc2acc2aac1agc4
ctc1ccc3cac2cgc4
gtc1gcc2gacggc2
tta5tca4taatga1
ataaca3aaa2aga2
ctacca2caa4cga4
gta3gcagaa2gga2
ttg2tcg3tagtgg3
atgj3acg3aag2agg2
ctg3ccg2cag3cgg2
gtg3gcg3gag2ggg3
arch1aa104
Archées. distribution du type >1aa sans duplicata.
g1t1 
atgi3tcttatatgf
attactaatagt
cttcctcatcgt
gttgctgatggt
ttc5tcctac3tgc1
atcacc2aac5agc
ctc1ccccac1cgc
gtc5gcc2gac3ggc
tta1tcataatga
ataaca1aaa2aga2
cta3cca1caa1cga
gta1gcagaa2gga4
ttg1tcgtagtgg1
atgj1acgaag1agg1
ctgccgcagcgg
gtg1gcggagggg
arch>1aa61
Archées. distribution des duplicata
g1t1 
atgitcttatatgf5
attactaatagt
cttcctcatcgt
gttgctgatggt
ttctcctactgc4
atc4accaacagc
ctc4ccccaccgc
gtcgccgacggc
ttatcataatga
ataacaaaaaga
ctaccacaacga
gtagcagaa2gga
ttgtcgtagtgg
atgjacgaagagg
ctgccgcagcgg
gtggcggagggg
archdupl19

archées par rapport au groupe de référence

Comparaison avec la référence
tRNAsblocs tRNAsblocs rRNAs
archeo41aa>1aadup+5s1-3aasautrestotal
21faible4011455
16moyen39168972
14fort253474474
1046119413201
10g+cgg26228
2agg+cga617
4carre ccc78419
5autres11
4011455
total tRNAs ‰
archeo41aa>1aadup+5s1-3aasautresarcheo ‰ref.‰
21faible199552027426
16moyen194804045358324
14fort124169352020368650
517303952065201729
10g+cgg1291013910
2agg+cga30535
4carre ccc3540209516
5autres55
1995520274
blocs tRNAs ‰ total colonne %
archeo41aa>1aaduptotalref.‰1aa>1aadup
21faible2176022299263818
16moyen21287433423243826
14fort136185383596502456
56533210318472910461
10g+cgg141111521065
2agg+cga3353815
4carre ccc3843221031618
5autres553
217602229940

euryarchaeota, estimation des -rRNAs

  • Lien tableur: euryarchaeota, estimation des -rRNAs
  • Liens fiche: typage
  • Légende: prélèvement de la base gtRNAdb le 16.1.21
    - ttt et tgt sont nuls partout
    - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    - atgf, c'est iMet, mis à la place de tgt, très rare chez les procaryotes.
    - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met iMet.
    - Voir la légende des tris, g1 t1 et des couleurs

euryarchaeota, calcul des -rRNAs

eur euryarchaeota 63 génomes
eur1 cumul des +rRNAs de la fiche euryarchaeota pour 63 génomes
g1t1 00
atgitcttatatgf
attactaatagt
cttcctcatcgt
gttgctgatggt
ttctcc2tactgc28
atc1accaacagc
ctcccccac0cgc
gtcgccgacggc
ttatcataatga
ataacaaaa3aga
ctaccacaacga
gtagca87gaagga
ttgtcgtagtgg
atgjacgaag1agg
ctgccgcagcgg2
gtggcggagggg
eury63intermaxmintotal
11833124
eur2 indices du clade euryarchaeota du 16.1.21 de gtRNAdb pour 100 génomes
g1t1 
atgi99tcttatatgf127
attact°aatagt
ctt°0.7cctcatcgt0.7
gttgctgatggt0.7
ttc122tcc106tac104tgc181
atc121acc104aac122agc104
ctc°122ccc°93cac101cgc102
gtc°121gcc°101gac124ggc141
tta107tca101taatga°13
ata°aca110aaa110aga103
cta103cca102caa108cga°103
gta103gca151gaa132gga103
ttg87tcg°87tagtgg102
atgj101acg°90aag°87agg°88
ctg85ccg°78cag°87cgg°71
gtg°91gcg°84gag°84ggg°79
gtRNAintermaxmintotal
1757161214804848
eur3 cumul des -rRNAs de l'annexe archeo 4 génomes
g1t1 
atgi3tcttatatgf7
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc5tcc4tac3tgc8
atc6acc4aac6agc4
ctc6ccc3cac3cgc4
gtc6gcc4gac3ggc8
tta6tca4taatga1
ataaca4aaa4aga4
cta3cca3caa5cga4
gta4gcagaa6gga4
ttg3tcg3tagtgg4
atgj4acg3aag3agg3
ctg3ccg2cag3cgg2
gtg4gcg3gag2ggg3
eury4intermaxmintotal
636655184
eur4 indices des +rRNAs de la fiche euryarchaeota pour 100 génomes
g1t1 
atgitcttatatgf
attactaatagt
cttcctcatcgc
gttgctgatggt
ttctcc3tactgc44
atc2accaacagc
ctcccccaccgc
gtcgccgacggc
ttatcataatga
ataacaaaa5aga
ctaccacaacga
gtagca138gaagga
ttgtcgtagtgg
atgjacgaag2agg
ctgccgcagcgg3
gtggcggagggg
eury63intermaxmintotal
18755197
eur5 estimation des -rRNA du clade euryarchaeota pour 100 génomes
g1t1 
atgi99tcttatatgf127
attactaatagt
ctt0.7cctcatcgc0.7
gttgctgatggt0.7
ttc122tcc102tac104tgc137
atc119acc104aac122agc104
ctc122ccc93cac101cgc102
gtc121gcc101gac124ggc141
tta107tca101taatga13
ataaca110aaa106aga103
cta103cca102caa108cga103
gta103gca13gaa132gga103
ttg87tcg87tagtgg102
atgj101acg90aag85agg88
ctg85ccg78cag87cgg68
gtg91gcg84gag84ggg79
-rRNAintermaxmintotal
1569160714754651
eur6 indices des -rRNAs de l'annexe archeo pour 100 génomes
g1t1 
atgi75tcttatatgf175
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc125tcc100tac75tgc200
atc150acc100aac150agc100
ctc150ccc75cac75cgc100
gtc150gcc100gac75ggc200
tta150tca100taatga25
ataaca100aaa100aga100
cta75cca75caa125cga100
gta100gcagaa150gga100
ttg75tcg75tagtgg100
atgj100acg75aag75agg75
ctg75ccg50cag75cgg50
gtg100gcg75gag50ggg75
eury4intermaxmintotal
1575165013754600

euryarchaeota, comparaison clade-annexe des -rRNAs

  • Lien tableur: euryarchaeota, comparaison clade-annexe des -rRNAs
  • Légende
    - eur7. diff, somme des couleurs de eur7. La différence entre tRNAs est faite entre eur5 et eur6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
    - eur8. rap, rapport des sommes couleurs eur5/eur2. Le rapport -rRNA/total est celui du tRNA de eur5 sur celui de eur2.
  • Fréquences des différences en % du tableau eur7
gamme		0/0	10	20	30	40	50	60	70	80	90	100			total
fréquence	1	17	14	10	3	2	0	0	0	0	0	1	48
tot ≤ 50							41							
  • Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 10% au dessus de celle de la fiche des archées.
tRNAs		fiche		annexe
sans		2642		184
avec		150		17
genomes		63		4
indice %	42		46
eur euryarchaeota 63 génomes
eur7 euryarchaeota, différence clade-annexe des -rRNAs
g1t1 
atgi24tcttatatgf28
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc2tcc2tac28tgc32
atc20acc4aac19agc4
ctc19ccc19cac26cgc2
gtc19gcc1gac39ggc29
tta29tca1taatga50
ataaca9aaa5aga3
cta27cca27caa13cga3
gta3gca100gaa12gga3
ttg14tcg14tagtgg2
atgj1acg17aag12agg15
ctg12ccg36cag14cgg27
gtg9gcg11gag40ggg5
diffintermaxmintotal
361220311832
eur8 euryarchaeota, rapports -rRNA/total
g1t1 
atgitcttatatgf
attactaatagt
cttcctcatcgc
gttgctgatggt
ttctcc97tactgc75
atc99accaac agc
ctcccccaccgc2
gtcgccgac ggc
ttatcataatga
ataacaaaa96aga
ctaccacaacga
gta gca9gaa gga
ttgtcgtagtgg
atgjacgaag98agg
ctgccgcagcgg96
gtggcggagggg
rapintermaxmintotal
8910010096
Cet article est issu de Wikiversity. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.