< Recherche:Les clusters de gènes tRNA et rRNA chez les procaryotes < Annexe


  • Annexe en préparation

Tanger le 3.11.19

Paeniclostridium sordellii AM370

psor opérons

  • Liens: gtRNAdb, NCBI , génome
  • Lien tableur: psor opérons
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales;Peptostreptococcaceae; Paeniclostridium.
  • Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
    - @2, cds de 62 aas, hp, à allure répétitive susceptible d'être créé par contrainte lors des conversions ou d'autres réparations: MWLFFLFFFLFFFLFFFFFLFFFLFFFFFLFFFFFFPIVVLQTEINFRYGYIYTIHSGIIF
    - @4, riboswitch se trouve dans un bloc à rRNA. Concerne cette remarque aussi le RNA non codant, ncRNA, à l'adresse 19421..19685.
  • Note: il n'y apas de gtRNAdb. Aussi j'ai comparé (EXACT NB.CAR STXT) les 1ers atgf atgi atgj du génome cdc, avec les atg de psor.
C1 Paeniclostridium sordellii AM370
27.3%GC8.8.19 Paris112 doublesintercalcdsaaavec aacdsacdsd
9847..10620CDS205205258
10826..1233216s196
12529..1544523s78
15524..156405s858585
15726..15947CDS74
18845..19297CDS331513
19301..19393tcc27
19421..19685ncRNA152152
19838..21478CDS*547
24343..24570CDS30930976
24880..2638616s196
26583..2949923s122
29622..297385s55
29744..29832tta+1313
29846..29921atgf3 aaa1515
29937..30011gaa6 atg99
30021..30094gga3 gta66
30101..30176gta1 cgt55
30182..30258gac1 ggc1616
30275..30350aac2 fois suite44
30355..30429acaaac aca aga44
30434..30518taccaa cac cca1515
30534..30617ctacta gaa gac1414
30632..30708agagga tac tca77
30716..30791caatgc tta ttc1111
30803..30878aaa66
30885..30973tca33
30977..31052ttc99
31062..31138atgj88
31147..31223atgi2121
31245..31321cca66
31328..31404cac44
31409..31482tgc2525
31508..31596tta1313
31610..31685atgf1515
31701..31775gaa99
31785..31858gga66
31865..31940gta55
31946..32022gac1616
32039..32114aac44
32119..32193aca44
32198..32282tac1515
32298..32381cta1111
32393..32467ggc1313
32481..32557aga77
32565..32640caa1111
32652..32727aaa66
32734..32822tca33
32826..32901ttc99
32911..32987atgj88
32996..33072atgi2121
33094..33170cca66
33177..33253cac99
33263..33338aaa2121
33360..33433tgc66
33440..33516cgt10
33527..33602gta162162162
33765..34016CDS84
34042..34455CDS249249138
34705..3621116s196
36408..3932423s78
39403..395195s402*402
comp39922..40113CDS34834864
40462..4196816s196
42165..4508123s78
45160..452765s180180*180
45457..47394CDS*646
101428..102144CDS276276239
102421..10392716s54
103982..104057gca114
104172..10709623s41
107138..107211gga11
107223..1073395s999999
comp107439..108617CDS393
111345..111884CDS431*431180
112316..11382216s54
113877..113952gca114
114067..11698223s193
117176..1172925s5
117298..117386tta99
117396..117472atgi123
117596..11910216s54
119157..119232gca114
119347..12226323s193
122457..1225735s5
122579..122667tta99
122677..122753atgi123
122877..12438316s54
124438..124513gca114
124628..12754923s78
127628..1277445s100100100
127845..129260CDS472
215388..216260CDS264264291
216525..21803016s123
218154..218229gca152
218382..22129623s50
221347..221420gga12
221433..2215495s109109109
221659..221940CDS525*52594
222466..22397216s196
224169..22708323s144
227228..2273445s228228*228
227573..227989CDS139
449964..450266CDS253253101
450520..45202616s196
452223..45513923s144
455284..4554005s112112112
comp455513..456616CDS368
498418..499074CDS189189219
499264..50077016s118
500889..500964gca95
501060..50397623s144
504121..5042375s131131131
504369..504551CDS61
546886..550416CDS4141*1177*41
comp550458..550544ttg138138
550683..553325CDS*881
608009..608683CDS195195225
608879..608975tga373737
comp609013..609732CDS240
815939..816655CDS717123971
816727..816800tgc1212
816813..816888aac33
816892..816966aca285285
817252..818727CDS492
1284870..1288097CDS111111*1076*111
1288209..1288297cta426*426
1288724..1290853CDS*710
1445161..1445664CDS135135168135
1445800..1445868other@1258258
1446127..1446813CDS229
2267513..2267698CDS@230630662*306
comp2268005..2268088cta404*404
2268493..2269758CDS422
3094098..3094784CDS404022940
comp3094825..30949415s78
comp3095020..309793623s194
comp3098131..309963716s276276
comp3099914..3101161CDS416
3159922..3160827CDS373730237
comp3160865..3160956agc120120
comp3161077..3161376CDS100
comp3274188..3274733CDS245245182*245
comp3274979..32750955s@312
comp3275108..3275181gga107
comp3275289..327821423s137
comp3278352..327985816s253253
comp3280112..3280690CDS193
comp3303104..3304150CDS124124349124
comp3304275..3304459riboswitch@496
comp3304556..33046725s11
comp3304684..3304758aca116
comp3304875..330778923s196
comp3307986..330949216s364*364
3309857..3310504CDS216
comp3438683..3439531CDS142142283142
comp3439674..3439750aga77
comp3439758..3439832ggc99
comp3439842..3439918gac55
comp3439924..3439999gta88
comp3440008..3440082gaa5
comp3440088..34402045s40
comp3440245..344316823s112
comp3443281..3443356gca109
comp3443466..344497216s138
comp3445111..3445187atgj+1313
comp3445201..3445276ttc3 atg66
comp3445283..3445359atc2 cca66
comp3445366..3445442cca2 gga3131
comp3445474..3445549tgg2 aac1111
comp3445561..3445637atgi66
comp3445644..3445720cca66
comp3445727..3445817agc1111
comp3445829..3445917tca66
comp3445924..3445999aaa1212
comp3446012..3446087caa66
comp3446094..3446170aga1919
comp3446190..3446263gga1111
comp3446275..3446359tac44
comp3446364..3446438aca44
comp3446443..3446518aac3131
comp3446550..3446625aac1616
comp3446642..3446718gac55
comp3446724..3446799gta66
comp3446806..3446879gga99
comp3446889..3446963gaa1515
comp3446979..3447054atgf1313
comp3447068..3447156tta5
comp3447162..34472785s213
comp3447492..345040623s196
comp3450603..345210916s239239
comp3452349..3452552CDS68
comp3523330..3524046CDS129129239129
comp3524176..3524251gta+88
comp3524260..3524334gaa2 fois2020
comp3524355..3524430aaagta gaa aaa1010
comp3524441..3524515aca1010
comp3524526..3524602gac77
comp3524610..3524685gta99
comp3524695..3524769gaa55
comp3524775..3524850aaa289289
3525140..3526039CDS300

psor cumuls

cumuls. Paeniclostridium sordellii AM370
opéronsFréquences intercalaires tRNAsFréquences intercalaires cdsFréquences aas cds
effectifgammessans rRNAsavec rRNAsgammescdsgammescdsdgammescdsa
avec rRNAopérons1710010101009
16 23 5s 06209655052012008
16 atc gca04006100440330013
16 23 5s a26000150106014004
max a44800020058015004
a doubles210000250510036001
autres912000300812037001
total aas8714000350314048001
sansopérons816000400116019001
1 aa6180004504180210000
max a8200005000200011001
a doubles100131
total aas17971462244
total aas104
remarques4
avec jaunemoyenne910206119304
variance5612173257
sans jaunemoyenne17395220
variance9045121

psor blocs

  • Lien tableur: psor blocs
  • Lien cdc blocs: le tabeau de cdc blocs est à comparer à celui de psor pour les types manquants, en gris dans cdc blocs.
  • Légende:
    - Les blocs sont rangés par type de I à IV pour les blocs 16s23s et de V à X pour les blocs 16sgca23s. Chaque bloc est noté par son type suivi d'un indice.
    - La 1ère partie du tableau représente la totalité des blocs; la 2ème les groupes où les blocs se suivent avec des intercalaires très faibles. Seul l'intercalaire séparant le bloc V2 de I4 est élevé et le plus grand du tableau, 525. Je considère qu'un intercalaire inférieur à 350 est faible relativement aux intercalaires intra bloc. Les intercalaires avec les CDS sont faibles ici puisque seulement 3 sont supérieurs à 350, 402 (I2), 431 (VI1) et 525 (I4). Voir le tableau des cumuls pour tout les intercalaires des cds où seulement 6 sur 46 dépassent 350, avec une moyenne de 173±90.
    - Les couleurs, rouge pour rRNA, vert pour une configuration peu courante, un gène tRNA entre 23s et 5s, et ribosw pour riboswitch. Le cyan pour repérer le même intercalaire par rapport à la direction 16s23s5s quand elle change quand on a des adresses complément.
  • Notes:
    - 3 blocs avec des tRNAs longs, 44 23 5, concentrant les 2/3 des tRNAs avec des blocs 16s23s. 15 tRNAs sont dans des blocs courts ou 16sgca23s. Les tRNAs extra blocs sont 17.
    - 10 blocs 16s23s contre 7 blocs 16sgca23s
    - Le regroupement des blocs par 3 et 2 concerne 10 blocs et restent donc 7 blocs solitaires, 3 sans tRNA et 4 avec 1 ou 2 tRNA.
    - Existence de 4 cds intra groupe de petite taille en aas, 84 138 64 pour le 2èmer groupe, et 94 pour le 4ème groupe.
    - Le 1er groupe de 3 blocs n'a pas de cds internes et est constitué de la duplication d'un même bloc.
    - Des intercalaires très faibles inter blocs
    - Des intercalaires intra blocs qui se répètent beaucoup mais peuvent être divisés ou multipliés par 2.
intercalaire				Total
16s-23s	9*196	137			10
23s-5s	5*78	4*144	3*193	40	13
16s-gca	4*54	3*120			7
gca-23s	5*114	95	152		7
5s-aas	4*5 (tta)	5 (gaa)		5
C1. Paeniclostridium sordellii AM370, blocs à rRNA
II2I3I4IIIIIIVIV1IV2
CDS124
CDS245ribosw96
CDS205249348525253405s125s11CDS3095
16s19619619619619678gga107aca11616s196213
23s78787814414419423s13723s19623s122196
5s8540218022811227616s25316s3645s5239
CDSCDSCDStta
VV2VIVI1VIIVII1VIIIVIII1IXXX1
CDS276264CDS431CDS189gaa5
16s5412316s5416s5416s5416s1185s40
gca114152gca114gca114gca114gca9523s112
23s415023s19323s19323s7823s144gca109
gga11125s55s55s1005s13116s138
5s99109tta9tta9CDSCDSatg
CDSatg123atg123
groupe1groupe2groupe3groupe4
CDS431CDS309CDS142CDS264
VI116s54IV116s196**4aas8V216s123
gca11423s122gaa5gca152
23s1935s55s4023s50
5s5tta1323s112gga12
tta9**42aas10gca1095s109
atg123gta162X116s138CDS525
VII116s54CDS25atg13I416s196
gca114CDS249**21aas1323s144
23s193I216s196tta55s228
5s523s785s213CDS
tta95s40223s196
atg123CDS348IV216s239
VIII116s54I316s196CDS
gca11423s78
23s785s180
5s100CDS
CDS

psor remarques

  • Lien tableur: psor remarques
  • Nombre de gènes protéines: 3327 (NCBI)
  • Rmarques @:
  1. - Un tRNA nommé other, non déterminé
  2. - cds de 62 aas, hp, à allure répétitive susceptible d'être créé par contrainte lors des conversions ou d'autres réparations: MWLFFLFFFLFFFLFFFFFLFFFLFFFFFLFFFFFFPIVVLQTEINFRYGYIYTIHSGIIF
  3. - une configuration rare 23s-aas-5s concerne 3 gga et 1 aca
  4. - Les RNAs non codants: riboswitch dans un bloc à rRNA et ncRNA dans un bloc sans rRNA, adresse 19421..19685.
  • Configuration des blocs: voir psor blocs.
  • Les séquences des doubles: Il y a très peu de doubles mais des duplications de séquences. Le signe + dans psor opérons indique les doubles.
    - séquence 44 aas: voir psor opérons, la couleur cyan pour la duplication de 20 aas et la couleur verte pour les insertions. Je n'ai pas pu distingué les 3 types d'atg dans 6 atg, qui certainement doivent être départagés en 2 atgf 2 atgj 2 atgi. Ce qui laisse 2 doubles aaa et gta.
    - séquence 23 aas: voir ci-dessous l'analogie de séquence entre 23 aas et le début de 44 aas. Seuls 3 aas ont des doubles cca gga aac, aucune séquence n'est dupliquée.
    - séquence 5 aas, c'est une petite séquence simple à la suite du blocs 23aas. Est-ce le fait d'être dans un bloc 416s-gca-23s?
    - séquence 8 aas: voir psor opérons, adresse 3523330..3524046, duplication de 3 aas. Est-ce que ça ne serait pas une séquence détachée d'un bloc 16s23s5s comme les 2 autres longs blocs.
23aas	tta atg gaa gga gta gac aac aac aca tac gga aga caa aaa tca   agc cca atg tgg cca atc   ttc atg
44aas	tta atg gaa gga gta gac aac     aca tac cta aga caa aaa tca                             ttc atg   atg cca cac - - - -

psor distribution

  • Lien tableur: psor distribution
  • Notes: tableau Cl12 blocs à de 3 tRNAs sauf
    - -5s: 3 gga et aca
    - 1-3 aas: 2 tta et 2 atgi
Cl1 psor, Paeniclostridium sordellii AM370. clostridia.
Cl11 psor. La distribution des tRNAs sans rRNA.
g1t1 
atgitcttatatgf
attactaatagt
cttcctcatcgc
gttgctgatggt
ttctcctactgc1
atcacc1aac1agc1
ctcccccaccgt
gtcgccgac1ggc
ttatcataatga1
ataaca2aaa2aga
cta2ccacaacga
gta2gcagaa2gga
ttg1tcgtagtgg
atgjacgaagagg
ctgccgcagcgg
gtggcggagggg
clos>1aa=1aa-5s+5s-16s+16stotal
psor125*17
Cl12 psor. La distribution des tRNAs avec rRNA.
g1t1 
atgi5tcttatatgf3
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc3tcctac3tgc2
atc1accaac4agc1
ctcccccac2cgt1
gtcgccgac4ggc2
tta5tca3taatga
ataaca4aaa4aga4
cta2cca4caa4cga
gta5gca7gaa4gga7
ttgtcgtagtgg1
atgj3acgaagagg
ctgccgcagcgg
gtggcggagggg
clos>1aa=1aa-5s+5s-16s+16stotal
psor4*76*787

Peptoclostridium difficile CD196

cdc opérons

  • Liens: gtRNAdb , NCBI , génome [orgn]
  • Lien tableur: cdc opérons
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales;Peptostreptococcaceae; Clostridioides.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
C2 Peptoclostridium difficile CD196
28.6%GC11.9.19 Paris83 doublesintercalcdsaaavec aacdsacdsdprotéines
dir9857..10630cds179179258SigB/SigF/SigG family RNA polymerase sigma factor
dir10810..1231716s52
dir12370..12445gca249
dir12695..1559623s111
dir15708..158245s126126126
dir15951..16460cds170transcription repressor NadR
dir19402..19857cds001520nucleoside deaminase
dir19858..19949tcc37
dir19987..20251ncRNA@17676
dir20328..21965cds546DNA polymerase III subunit gamma/tau
comp23419..24624cds505*505402glycosyl transferase
dir25130..2663716s279
dir26917..2981623s+180
dir29997..301135s3 aaa6
dir30120..30194aac3 gta66
dir30201..30286tta1515
dir30302..30377atgf77
dir30385..30459gaa99
dir30469..30542gga55
dir30548..30623gta55
dir30629..30705gac99
dir30715..30789aca1414
dir30804..30888tac88
dir30897..30980cta2929
dir31010..31086aga77
dir31094..31169caa8888
dir31258..31346tca33
dir31350..31425ttc66
dir31432..31508atgj1111
dir31520..31596atgi2323
dir31620..31696cca77
dir31704..31780cac88
dir31789..31864aaa77
dir31872..31945tgc66
dir31952..32026aac55
dir32032..32117tta1515
dir32133..32208atgf77
dir32216..32290gaa99
dir32300..32373gga55
dir32379..32454gta55
dir32460..32536gac99
dir32546..32620aca1414
dir32635..32719tac99
dir32729..32812cta2323
dir32836..32910ggc2424
dir32935..33011aga99
dir33021..33096caa88
dir33105..33180aaa22
dir33183..33271tca33
dir33275..33350ttc66
dir33357..33433atgj1111
dir33445..33521atgi1717
dir33539..33615cac88
dir33624..33699aaa77
dir33707..33780tgc77
dir33788..33864cgt1212
dir33877..33952gta757575
dir34028..34441cds308308138hp
dir34750..38181cds1144pyruvate carboxylase
dir127011..127715cds281281235N-acetylmuramoyl-L-alanine amidase CwlD
dir127997..12950516s279
dir129785..13268523s+131
dir132817..1329335s2 cca6
dir132940..133014aac44
dir133019..133093gaa55
dir133099..133174gta55
dir133180..133256gac1010
dir133267..133341aca1414
dir133356..133440tac99
dir133450..133523gga1010
dir133534..133610aga99
dir133620..133695caa1111
dir133707..133782aaa22
dir133785..133873tca1717
dir133891..133981agc88
dir133990..134066cca8585
dir134152..134227tgg6060
dir134288..134364cca66
dir134371..134447atc33
dir134451..134526ttc77
dir134534..134610atgj114
dir134725..13611516s68
dir136184..136259gca271
dir136531..13943023s126
dir139557..1396735s213213213
comp139887..141071cds372*372395pyridoxal phosphate-dependent aminotransferase
dir141444..143795cds2121784anaerobic ribonucleoside triphosphate reductase
dir143817..144356cds776*776180anaerobic ribonucleoside-triphosphate reductase activating protein
dir145133..14664016s52
dir146693..146768gca373
dir147142..15004123s126
dir150168..1502845s77
dir150292..150366aac55
dir150372..150457tta1515
dir150473..150548atgf77
dir150556..150630gaa1414
dir150645..150718gga55
dir150724..150799gta55
dir150805..150881gac1010
dir150892..150966ggc99
dir150976..151049aga975*975
dir152025..152864cds280TIGR00159 family protein
dir378341..380728cds583*583796cadmium-translocating P-type ATPase
dir381312..38281916s311
dir383131..38603023s126
dir386157..3862735s177177177
dir386451..387059cds203DedA family protein
comp833130..833894cds258258255DeoR/GlpR transcriptional regulator
dir834153..834243agc878787
dir834331..835119cds263flagellar motor protein
dir1089165..1090139cds239239325239Mannosyl-glycoprotein endo-beta-N-acetylglucosamidase
dir1090379..109188616s320
dir1092207..109510623s91
dir1095198..1095271gga@28
dir1095280..10953965s273273
dir1095670..1097688cds673N-acetylmuramoyl-L-alanine amidase
comp1181549..1182958cds1374*1374470MBOAT family protein
comp1184333..1184415ttg318318318
dir1184734..1187382cds883DNA polymerase I
dir1835768..1837498cds109109577109Na+/H+ antiporter NhaC family protein
dir1837608..1837688cta231231
<dir1837920..1838093cds58HXXEE domain-containing protein
dir2981767..2982444cds159159226159sortase SrtB
comp2982604..2982678aca@394
comp2982773..298567223s184
comp2985857..298736416s340340
dir2987705..2988643cds313delta-lactam-biosynthetic de-N-acetylase
comp3787361..3788431cds454*454357ABC transporter ATP-binding protein
comp3788886..37890025s126
comp3789129..379202823s281
comp3792310..379381716s191191191
comp3794009..3794587cds193bifunctional precorrin-2 dehydrogenase/sirohydrochlorin ferrochelatase
comp3944262..3944453cds11911964119DUF378 domain-containing protein
comp3944573..39446895s126
comp3944816..394771523s217
comp3947933..394944016s282282
comp3949723..3950004cds22122194hp
comp3950226..3951755cds510lysine--tRNA ligase
dir4084445..4085437cds382*382331DNA replication protein DnaC
comp4085820..4085894aca33
comp4085928..4086003gta4
comp4086008..4086082gaa6
comp4086089..4086164aaa326326326
comp4086491..4087780cds430adenylosuccinate synthase

cdc cumuls

cumuls. Peptoclostridium difficile CD196
opéronsFréquences intercalaires tRNAsFréquences intercalaires cdsFréquences aas cds
effectifgammessans rRNAsavec rRNAsgammescdsgammescdsdgammescdsa
avec rRNAopérons101011111003
16 23 5s 03202615012002005
16 gca 2353401410034003007
16 23 5s a260115036004005
max a4380020048015003
a doubles21002250410016003
autres21200300412027001
total aas751400350414018002
sansopérons51600400216019001
1 aa418004500180110000
max a420005001200111000
a doubles00541
total aas8368321331
total aas83
remarques3
avec jaunemoyenne1412313165378
variance1528394259
sans jaunemoyenne9206286
variance5107144

cdc blocs

  • Lien tableur: cdc blocs
  • Lien psor blocs: le tabeau de cdc blocs est à comparer à celui de psor pour les types manquants, ici en gris.
  • Légende: voir psor blocs.
  • Notes:
    - cdc a perdu 3 blocs de type I, 16s23s5s sans tRNAs; les 2 blocs de type V, 16s-gca-23sgga5s et les 2 blocs 16s-gca-23s5s-2aas de type VI et VII. Soit la moitié des blocs courts, 7 sur 14, et plus de la moitié des blocs 16s-gca, 4 sur 7. Les 3 blocs longs sont maintenus mais modifiés.
C2. cdc blocs
groupestypesabsents
cds281IIIIIIIVIV1IV2
IV216s279
23s131CDS583454119cds239
5s616s31112612616s320cds159cds505281
aac423s12628121723s91aca9416s279279
**16aas35s177191282gga823s18423s180131
ttc7CDS5s27316s3405s66
atgj114cdscdsaac64
VIII116s68
gca271VV2VIVI1VIIVII1
23s126
5s213
cds372
cds21VIIIVIII1IXXX1
cds776cds21
X116s52atgj114cds179cds776
gca37316s6816s5216s52
23s126gca271gca249gca373
5s723s12623s11123s126
aac55s2135s1265s7
**7aas9cds372cdsaac5
aga975
cds

cdc psor

  • Lien tableur: cdc psor
  • Comparaison bsu-lmo: Les séquences, les cumuls.
  • Légende:
    - La couleur cyan pour les différents entre cdc et psor; bois pour les identiques entre les clusters 43aas et 18aas de cdc d'une part et les clusters 44aas et 23aas de psor. Le gène aaa du cluster 18aas de cdc a son identique dans la 2ème partie du cluster 43aas et non dans la 1ère partie, car la duplication n'est pas exacte.
    - Le bleu pour des intercalaires exceptionnels.
    - Les blocs 16s indiquent des rRNAs de bordure, l'équivalent d'un cds.
    - Le jaune pour la conservation des cds: je ne l'ai appliqué ici qu'aux petits clusters sans rRNAs; Comparer les cumuls des intercalaires et protéines des cds de cdc et psor montre clairement que les clusters soit, sont très mobiles ou bien qu'il y a de nombreuses recombinansons entre le cluster et ses cds. Le jaune indique ici des intercalaires et des protéines presque identiques.
    - Les bordures très épaisses noires encadrent les 7 gènes du cluster 9aas identiques dans les duplicata du 43aas, comparaison cdc-cdc. Les bordures très épaisses bleues encadrent les 4 gènes du cluster 9aas de cdc et ceux du 23aas de psor, comparaison cdc-psor.
  • Notes:
    - Les 3 blocs longs de cdc commencent tous par aac. Chez psor 2 blocs longs et 2 courts commencent par tta et 1 bloc long gca commence par gaa.
    - Le jaune encadré montre que le cluster cta conservé dans cdc est celui ayant une protéine identique, 58 contre 62 aas dans psor. Or dans psor ce cluster présente des répétitions caractéristiques des contraintes imposées aux réparations.
    - Les fréquences des différences entre intercalaires (diff) sont reportées dans le dernier tableau C24 et sont établies sur la plage des différences entre intercalaires cdc et psor du tableau C21 pour des couples identiques. 16% des différences sont nulles (8 sur 49) et 50% ne dépassent pas 2 paires de bases. Ces résultats sont à mettre en parallèle avec ceux de la omparaison bsu-lmo, avec les séquences et les cumuls. La faible variabilité des intercalaires cdc-psor par rapport à bsu-lmo est due à leur plus grande filiation, niveau genre contre le niveau famille pour bsu-lmo.
C2. Comparaison cdc-psor
C21. Comparaison cdc-psor
cdcintercalpsorintercaldiff
cds505cds309
16s27916s196
23s18023s122
5s65s5
aac6tta13
tta15atg15-2
atgf7gaa98
gaa9gga60
gga5gta51
gta5gac16
gac9aac4
aca14aca4-10
tac8tac157
cta29cta14-15
aga7aga70
caa88caa11
tca3aaa6
ttc6tca30
atgj11ttc93
atgi23atg8-3
cca7atg21-2
cac8cca6-1
aaa7cac4
tgc6tgc25
aac5tta13-2
tta15atg158
atgf7gaa90
gaa9gga61
gga5gta50
gta5gac16
gac9aac4
aca14aca4-10
tac9tac156
cta23cta11-12
ggc24ggc13-11
aga9aga7-2
caa8caa113
aaa2aaa64
tca3tca30
ttc6ttc93
atgj11atg8-3
atgi17atg21
cac8cca6
aaa7cac91
tgc7aaa2114
cgt12tgc6-1
gta75cgt10-2
cdsgta162
cds
cds776
16s52
gca373
23s126
5s7atg138
aac516s109
tta15gca112
atgf723s40
gaa145s5
gga5gaa8
gta5gta50
gac10gac9-1
ggc9ggc7-2
aga975aga142
cdscds
cds281cds239
16s27916s196
23s13123s213
5s65s5
aac4tta13
gaa5atg15
gta5gaa9
gac10gga6
aca14gta5
tac9gac16
gga10aac31
aga9aac4
caa11aca4-10
aaa2tac112
tca17gga199
agc8aga6-3
cca85caa121
tgg60aaa64
cca6tca11-6
atc3agc6-2
ttc7cca6
atgj114atg11
16stgg31-29
cca60
atc63
ttc136
atg138
16s
cds129
gta8
gaa20
aaa10
cds382aca10
aca33gac7
gta4gta95
gaa6gaa5-1
aaa326aaa289
cdscds
C22. Comparaisons internes
cdcintercalcdcintercaldiff
cds505cds281
16s27916s279
23s18023s131
5s65s6
aac6aac4
tta15gaa5
atgf7gta5
gaa9gac10
gga5aca14
gta5tac90
gac9gga101
aca14aga90
tac8caa11
cta29aaa2
aga7tca172
caa88agc8
tca3cca85
ttc6tgg60
atgj11cca6
atgi23atc3
cca7ttc7
cac8atgj114
aaa716s
tgc6cds776
aac516s52
tta15gca373
atgf723s126
gaa95s7
gga5aac5
gta5tta150
gac9atgf71
aca14gaa140
tac9gga5
cta23gta5
ggc24gac10
aga9ggc90
caa8aga9753
aaa2cds0
tca3
ttc6
atgj11
atgi17
cac8
aaa7
tgc7
cgt12
gta75
cds
psorpsorintercaldiff
cds309cds239
16s19616s196
23s12223s213
5s55s5
tta13tta130
atg15atg150
gaa9gaa90
gga6gga60
gta5gta50
gac16gac160
aac4aac31
aca4aac4
tac15aca40
cta14tac11-4
aga7cta195
caa11aga6-1
aaa6caa121
tca3aaa60
ttc9tca11
atg8agc6
atg21cca6
cca6atg11
cac4tgg31
tgc25cca6
tta13atc60
atg15ttc130
gaa9atg1380
gga616s0
gta5atg1380
gac1616s1090
aac4gca112
aca423s400
tac155s5
cta11gaa8
ggc13gta5
aga7gac9-1
caa11ggc71
aaa6aga1420
tca3cds
ttc9
atg8
atg21
cca6
cac9
aaa21
tgc6
cgt10
gta162
cds
C23. Conservation des cds
cdcintercalpsorintercalprotéines
cds0cds3151 – 152
tcc37tcc27
ncRNA76ncRNA152547 – 546
cdscds
cds1374cds41470 – 1177
ttg318ttg138883 – 881
cdscds
cds109cds111577 – 1076
cta231cta426
cdscds58 – 577
cds258cds37255 – 302
agc87agc120
cdscds263 – 100
cds30662
cta404
cds422
cds135
other258
cds
cds195
tga37
cds
cds71
tgc12
aac3
aca285
cds
C24. Fréquence des différences des intercalaires
gammefréquence
-152
-14
-13
-121
-111
-103
-9
-8
-7
-61
-5
-4
-33
-27
-14
08
14
21
34
42
51
62
71
82
91
10
11
12
13
141
15
total49
sous t. -2+224

cdc remarques

  • Nombre de gènes protéines: cdc 3615, psor 3327 (NCBI)
  • Comparaison bsu-lmo: Les séquences, les cumuls. bsu-lmo nouveau
  • Rmarques @: On retrouve une partie des remarques de psor
  1. - Les RNAs non codants: seul le bloc cds-tcc-ncRNA-cds est maintenu.
  2. - Une configuration rare 23s-gga-5s complète au lieu de 3.
  3. - La configuration 16s23s-aca-5s-riboswitch perd 5s-riboswitch et devient 16s23s-aca.
  • Comparaison cdc-psor
    1. Les blocs à rRNAs: Les blocs disparaissent au moment des divisions et ce sont les non protégés par des séquences de tRNAs qui disparaissent en 1er. 7 clusters simples disparaissent et les groupes se défont.
    2. Les séquences longues:
      • Comparaison entre les 2 génomes, cdc-psor: Très peu de modifications, plutôt des mutations que des recombinaisons et encore moins des créations. Le cas de la disparition de aaa qui apparaît dans un intercalaire est emblématique.
      • Comparaisons intra génome, cdc-cdc et psor-psor. Là les remaniements sont légions et puissants: duplication de 20 tRNAs d'un seul coup, recombinaisons par lots ou tRNA par tRNA.
  • Comparaison clostridia-bacilli entre cdc-psor et bsu-lmo: la comparaison est saisissante et on arrive à repérer une recombinaison après division, celle de 16s23s5s en 16s-atcgca-23s5s entre bsu et lmo. La mutation de cta en ctg, entre génome, qui conserve la longueur du tRNA, ainsi que la agc en tcc dans le petit bloc aac-**-gaa en intra.
    - Seul les clostridia présentent des cds dans les groupes, les bacilli non. Les autres génomes de clostridia (voir fiche) présentent beaucoup de cds dans les clusters alors que les bacilli (fiche) jamais.
  • Conclusion: Tout se passe comme si le processus se déroulait d'un seul coup dans un génome, en dehors de la division. Puis pendant la 1ère division et les divisions suivantes certains clusters disparaissent facilement alors que se produisent quelques rares mutations et recombinaisons. C'est avant tout un processus de création ordonné donnant des séquences qui peuvent se dupliquer et se recombiner. Les séquences de tRNA stabilisent et maintiennent les blocs de rRNAs, un seul cluster à 6 tRNAs disparaît entre bsu et lmo, et aucun entre cdc et psor.

cdc distribution

Cl2 cdc, Peptoclostridium difficile CD196. clostridia.
Cl21 cdc. La distribution des tRNAs sans rRNA.
g1t1 
atgitcttatatgf
attactaatagt
cttcctcatcgc
gttgctgatggt
ttctcc1tactgc
atcaccaacagc1
ctcccccaccgt
gtcgccgacggc
ttatcataatga
ataaca1aaa1aga
cta1ccacaacga
gta1gcagaa1gga
ttg1tcgtagtgg
atgjacgaagagg
ctgccgcagcgg
gtggcggagggg
clos>1aa=1aa-5s+5s-16s+16stotal
cdc44*8
Cl22 psor. La distribution des tRNAs avec rRNA.
g1t1 
atgi2tcttatatgf3
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc3tcctac3tgc2
atc1acc2aac2agc1
ctcccccac2cgt1
gtcgccgac4ggc2
tta3tca3taatga
ataaca4aaa4aga4
cta2cca3caa3cga
gta5gca3gaa4gga5
ttgtcgtagtgg1
atgj3acgaagagg
ctgccgcagcgg
gtggcggagggg
clos>1aa=1aa-5s+5s-16s+16stotal
cdc2*70375

Peptoclostridium difficile M68

cdc8 opérons

  • Liens data bases: gtRNAdb , NCBI , génome
  • Lien tableur: cdc8 opérons
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales;Peptostreptococcaceae; Clostridioides.
  • Liens internes: noms abrégéscdc8 remarquescdc8 cumuls
  • Légende: voir cdc8 cumuls pour cdsa: cds en pbs, cdsd: cds dirigé; voir cdc8 remarques pour @ et +
    - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - 23s°: 23S ribosomal RNA rRNA prediction is too short
    - cca: tRNA dupliqué dans le cluster 43aas (4306341).
    - cca: tRNA non dupliqué dans le cluster 43aas (4306341), ou remarques @2 et @3.
    - 554: voir cdc8 cumuls, veut dire sans jaune, exclu de la moyenne.
C3 Peptoclostridium difficile M68
28.6%GC11.9.19 Paris110doublesintercalcdsaaavec aacdsacdsdprotéines
dir4299490..4300134cds214214645tyrosine-type recombinase/integrase
dir4300349..4300807cds@1554554459helix-turn-helix domain-containing protein
dir4301362..4303101cds001740hypothetical protein
dir4303102..4303305cds167167204hp
dir4303473..430429923s°132827
dir4304432..43045485s+6117
dir4304555..4304629aac4475
dir4304634..4304708gaa2 cca5575
dir4304714..4304789gta5576
dir4304795..4304871gac111177
dir4304883..4304957aca141475
dir4304972..4305056tac9985
dir4305066..4305139gga101074
dir4305150..4305226aga9977
dir4305236..4305311caa111176
dir4305323..4305398aaa2276
dir4305401..4305489tca181889
dir4305508..4305598agc8891
dir4305607..4305683cca858577
dir4305769..4305844tgg606076
dir4305905..4305981cca5577
dir4305987..4306063atc3377
dir4306067..4306142ttc7776
dir4306150..4306226atgj11477
dir4306341..430753816s0011980
dir4307539..4308225cds100100687xylose isomerase
dir1..79623s°181796
dir978..10945s6117
dir1101..1175aac+6675
dir1182..1267tta3 aaa151586
dir1283..1358atgf3 gta7776
dir1366..1440gaa9975
dir1450..1523gga5574
dir1529..1604gta5576
dir1610..1686gac9977
dir1696..1770aca141475
dir1785..1869tac101085
dir1880..1963cta282884
dir1992..2068aga7777
dir2076..2151caa898976
dir2241..2329tca3389
dir2333..2408ttc6676
dir2415..2491atgj111177
dir2503..2579atgi292977
dir2609..2685cca7777
dir2693..2769cac8877
dir2778..2853aaa7776
dir2861..2934tgc6674
dir2941..3015aac6675
dir3022..3107tta151586
dir3123..3198atgf7776
dir3206..3280gaa9975
dir3290..3363gga5574
dir3369..3444gta5576
dir3450..3526gac9977
dir3536..3610aca141475
dir3625..3709tac9985
dir3719..3802cta242484
dir3827..3901ggc242475
dir3926..4002aga9977
dir4012..4087caa8876
dir4096..4171aaa2276
dir4174..4262tca3389
dir4266..4341ttc6676
dir4348..4424atgj111177
dir4436..4512atgi171777
dir4530..4606cac8877
dir4615..4690aaa7776
dir4698..4771tgc7774
dir4779..4855cgt121277
dir4868..4943gta75757675
dir5019..5432cds308308414hp
dir5741..9172cds3432pyruvate carboxylase
dir94032..94736cds281281705281N-acetylmuramoyl-L-alanine amidase CwlD
dir95018..9599416s°100977
dir96095..9761323s°1261519
dir97740..978565s7117
dir97864..97938aac6675
dir97945..98030tta151586
dir98046..98121atgf7776
dir98129..98203gaa8875
dir98212..98285gga4474
dir98290..98365gta5576
dir98371..98447gac101077
dir98458..98532ggc9975
dir98542..98615aga95495474
dir99570..100409cds840TIGR00159 family protein
dir306829..309216cds7337332388cadmium-translocating P-type ATPase
<> comp309950..310076cds111271glycine/sarcosine/betaine reductase complex selenoprotein A
dir310078..31131323s°1261236
dir311440..3115565s177177117
dir311734..312342cds609DedA family protein
comp861856..862620cds258258765DeoR/GlpR transcriptional regulator
dir862879..862969agc87879187
dir863057..863845cds789flagellar motor protein
dir1106477..1107451cds238238975238Mannosyl-glycoprotein endo-beta-N-acetylglucosamidase
dir1107690..110919716s@23201508
dir1109518..111241623s912899
dir1112508..1112581gga874
dir1112590..11127065s273273117
dir1112980..1114998cds2019N-acetylmuramoyl-L-alanine amidase
comp1196804..1198213cds137813781410MBOAT family protein
comp1199592..1199674ttg31831883318
dir1199993..1202641cds2649DNA polymerase I
dir1850896..1852626cds1091091731109Na+/H+ antiporter NhaC family protein
dir1852736..1852816cta33433481
dir1853151..1853666cds516HXXEE domain-containing protein
dir3024038..3024715cds150150678150sortase SrtB
comp3024866..3024940aca@39375
comp3025034..302793323s1842900
comp3028118..302962516s3743741508
dir3030000..3030938cds939delta-lactam-biosynthetic de-N-acetylase
dir3805298..3806743cds2082081446tyrosine-type recombinase/integrase
comp3806952..3807028agg61617761
<comp3807090..3808790cds1701formate dehydrogenase subunit alpha
comp3875816..3876886cds4524521071ABC transporter ATP-binding protein
comp3877339..38774555s125117
comp3877581..388048023s2612900
comp3880742..388224916s1901901508190
comp3882440..3883018cds579bifunctional precorrin-2 dehydrogenase/sirohydrochlorin ferrochelatase
comp4017523..4017714cds118118192118DUF378 domain-containing protein
comp4017833..40179495s126117
comp4018076..402097523s3212900
comp4021297..402280416s2922921508
comp4023097..4023378cds221221282hp
comp4023600..4025129cds1530lysine--tRNA ligase
dir4135881..4136873cds383383993DNA replication protein DnaC
comp4137257..4137331aca333375
comp4137365..4137440gta4476
comp4137445..4137519gaa6675
comp4137526..4137601aaa33133176331
comp4137933..4139222cds1290adenylosuccinate synthase
dir4178197..4178970cds179179774SigB/SigF/SigG family RNA polymerase sigma factor
dir4179150..418058716s1611438
comp4180749..41808655s201117
comp4181067..418395923s2172893
comp4184177..418568416s1081508
comp4185793..4185869atgi111177
comp4185881..4185969tta589
comp4185975..41860915s201117
comp4186293..418919223s3752900
comp4189568..4189643gca5276
comp4189696..419095916s’@41001264
dir4191060..419222516s’521166
dir4192278..4192353gca24876
dir4192602..419319723s°100596
dir4193298..419387416s°321577
dir4194196..419642323s’1002228
dir4196524..419709116s°320568
dir4197412..419904423s°1001633
dir4199145..420159323s’1262449
dir4201720..42018365s127127117127
dir4201964..4202473cds510transcription repressor NadR
dir4205417..4205872cds004560nucleoside deaminase
dir4205873..4205964tcc@53792
dir4206002..4206266ncRNA7676265
dir4206343..4207980cds1638DNA polymerase III subunit gamma/tau
comp4209435..4210639cds4964961205glycosyl transferase
4211136..421264316s3211508
4212965..421312723s°100100163100
<>comp4213228..4213849cds111622CHAP domain-containing protein
comp4213961..4214620cds228228660228type A-1 chloramphenicol O-acetyltransferase
dir4214849..421619916s3211351
dir4216521..421700823s°101488
comp4217110..421852923s°2501420
comp4218780..4218855gca5276
comp4218908..421947116s°100564
comp4219572..421985623s°217285
comp4220074..422158116s1791791508179
>comp4221761..4222206cds386386446386B/F/G family RNA polymerase sigma-70 factor
dir4222593..422410016s3211508
dir4224422..422732123s1812900
dir4227503..42276195s6117
dir4227626..4227700aac6675
dir4227707..4227792tta151586
dir4227808..4227883atgf7776
dir4227891..4227965gaa9975
dir4227975..4228048gga5574
dir4228054..4228129gta5576
dir4228135..4228211gac9977
dir4228221..4228295aca141475
dir4228310..4228394tac101085
dir4228405..4228488cta282884
dir4228517..4228593aga7777
dir4228601..4228676caa898976
dir4228766..4228854tca3389
dir4228858..4228933ttc6676
dir4228940..4229016atgj111177
dir4229028..4229104atgi292977
dir4229134..4229210cca7777
dir4229218..4229294cac8877
dir4229303..4229378aaa35376
comp4229732..42298485s126117
comp4229975..423201023s'5822036
dir4232593..423409816s@62171506
dir4234316..423721523s1262900
dir4237342..42374585s216216117216
comp4237675..4238859cds3723721185pyridoxal phosphate-dependent aminotransferase
dir4239232..4241583cds21212352anaerobic ribonucleoside triphosphate reductase
dir4241605..4242144cds778778540anaerobic ribonucleoside-triphosphate reductase activating protein
dir4242923..424445916s@72611537
dir4244721..424761923s2012899
dir4247821..42479375s5117
dir4247943..4248031tta111189
dir4248043..4248119atgi10877
dir4248228..424973516s1841508
dir4249920..425056423s°100100645100
<dir4250665..4250923cds112112259112hp
comp4251036..425314523s’3752110
comp4253521..4253596gca5276
comp4253649..425422616s°282282578
dir4254509..4254712cds1212204hp
dir4254725..4256002cds1278phage portal protein

cdc8 cumuls

  • Lien tableur: cdc8 cumuls
  • Liens internes: cdc8 opérons
  • Légende:
    - avec et sans rRNA, fréquences des intercalaires dans les clusters avec rRNA ou sans rRNA.
    - cdsd, je ne choisis que le cds avec l'intercalaire le plus faible d'un cluster donné, en supposant que ce cds a été créé par le cluster lors des conversions.
    - cdsa, longueur du cds en aas ici. C'est le cdsa de cdc8 opérons divisé par 3.
    - 1: occurences exclues de la moyenne. Sont exclus de la moyenne les jaunes 554 de cdc8 opérons.
C3. cumuls. Peptoclostridium difficile M68
opéronsFréquences intercalaires tRNAsFréquences intercalaires cdsFréquences aas cds
effectifgammessans rRNAsavec rRNAsgammescdsgammescdsdgammescdsa
avec rRNAopérons211014131006
16 23 5s 04202775022002008
16 gca 23524016100740030011
16 23 5s a560015056004005
max a4380120058025005
a doubles21003250610036005
autres101200300512037001
total aas981400350414018001
sansopérons61600400416019001
1 aa518004500180110000
max a420005002200111000
a doubles00471
total aas9387482244
total aas108
remarques7
avec jaunemoyenne1413256155330
variance16252109234
sans jaunemoyenne10182208
variance611797

cdc8 blocs

  • Lien tableur: cdc8 blocs
  • Lien cdc blocs: La colonne "Bloc type" de cdc8 blocs correspond aux types définis dans cdc blocs.
  • Légende
    - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - 23s°: 23S ribosomal RNA rRNA prediction is too short
    - cca: remarques @2 et @3.
  • Notes:
    - Je définis le type de bloc en comparant avec un bloc de cdc_bloc ayant approximativement les mêmes intercalaires et quand c'est possible les tRNAs identiques qui l'accompagnent. L'identification des tRNAs est faite dans la comparaison entre cdc et cdc 8 dans 43aas, 18aas et 9aas.
    - Les groupes de clusters. Un groupe de cluster à rRNA, et ici avec les débris de rRNA aussi, est un ensemble de rRNAs espacés de tRNAs et de cds par des intercalaires faibles, inférieurs à 778 pbs ici. Les 2 intercalaires des cds terminaux peuvent être très élevés, indiquant que le cds n'est pas sous l'influence de la conversion appliquée au cluster. Au total cdc8 a 9 groupes dont 6 avec un seul bloc, et 3 avec plus de 2 comprenant la quasi totalité des rRNAs, 40/46.
    1. Les solitaires, 6 dont 5 bien typés, I2 I3 II III et X1.
    2. Le groupe à 2 blocs, IV1 et IV2 bien typés.
    3. Le groupe à 15 rRNAs dans lequel je n'ai pu typé que 2 blocs, I1 et VII1.
    4. Le groupe à 23 rRNAs dans lequel je n'ai pu typé que 3 blocs, I4 IV3 IV4.
    5. Le type IV4, 16s23s5s-tta-atgi, n'existe pas dans psor mais est ajouté ici parce qu'il est semblable aux types IV, 16s23s5s suivi de tRNAs. Mais en plus avec tta-atgi il est comparable aussi aux types VII1 et VIII1. Ce point est important quand on considère l'origine de cdc8 comme croisement de cdc et psor. Ce type IV4 va en faveur d'une évolution de cdc vers psor en passant par cdc8.
C3. cdc8 blocs
Bloc typegroupesintercalBloc typegroupesintercalBloc typegroupeintercal
cds554cds150cds496
cds0aca9316s321
cds16723s18423s°100
23s°132III16s374cds111
IV25s6cdscds228
aac416s321
**16aas7cds45223s°101
atgj1145s12523s°250
IV116s023s261gca52
cds100I216s19016s°100
23s°181cds23s°217
5s616s179
aac6cds118cds386
**41aas125s126IV316s321
gta7523s32123s181
cds308I316s2925s6
cdscdsaac6
**17aas8
cds281cds179aaa353
16s°10016s1615s126
23s°1265s20123s'582
X15s7I123s217I416s217
aac616s10823s126
**7aas9atgi115s216
aga954tta5cds372
cds5s201cds21
23s375cds778
cds733VII1gca52IV416s261
cds116s’10023s201
23s°12616s’525s5
5s177gca248tta11
cds23s°100atgi108
16s°32116s184
cds23823s'10023s°100
II16s32016s°320cds112
23s9123s°10023s’375
gga823s’126gca52
5s2735s12716s°282
cdscdscds

cdc8 cdc psor 43

  • Lien tableur: cdc8 cdc psor 43
  • Lien cdc psor: le tableau de comparaison cdc-psor
  • Légende
    - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - 23s°: 23S ribosomal RNA rRNA prediction is too short
    - cca: marque les tRNAs différents entre les 2 génomes.
    - diff pour différence entre les intercalaires (intercal) cdc moins cdc8.
    - séquences identiques (bordure épaisse): Une séquence identique entre les 2 génomes est encadrée par 2 tRNAs différents (cyan) dans l'un et par 2 bordures épaisses dans l'autre.
  • Notes:
    - identité entre cdc et cdc8 avec de rares différences faibles entre les intercalaires.
    - Aussi on retrouve les différences entre cdc et psor dans le tableau de droite.
C3. Comparaison cdc8-cdc-psor 43
C31. Comparaison cdc8-cdc 43
cdc843aascdc43aas
geneintercalgeneintercaldiff
16s1
cds10016s279
23s°18123s180-1
5s65s60
aac6aac60
tta15tta150
atgf7atgf70
gaa9gaa90
gga5gga50
gta5gta50
gac9gac90
aca14aca140
tac10tac8-2
cta28cta291
aga7aga70
caa89caa88-1
tca3tca30
ttc6ttc60
atgj11atgj110
atgi29atgi23-6
cca7cca70
cac8cac80
aaa7aaa70
tgc6tgc60
aac6aac5-1
tta15tta150
atgf7atgf70
gaa9gaa90
gga5gga50
gta5gta50
gac9gac90
aca14aca140
tac9tac90
cta24cta23-1
ggc24ggc240
aga9aga90
caa8caa80
aaa2aaa20
tca3tca30
ttc6ttc60
atgj11atgj110
atgi17atgi170
cac8cac80
aaa7aaa70
tgc7tgc70
cgt12cgt120
gta75gta750
cdscds
C32. Comparaison cdc8-psor 43
cdc843aaspsor44aas
geneintercalgeneintercaldiff
16s1
cds10016s196
23s°18123s122
5s65s5
aac6tta13-2
tta15atg158
atgf7gaa90
gaa9gga61
gga5gta50
gta5gac16
gac9aac4
aca14aca4-10
tac10tac155
cta28cta14-14
aga7aga70
caa89caa11
tca3aaa6
ttc6tca30
atgj11ttc93
atgi29atg8-3
cca7atg21-8
cac8cca6-1
aaa7cac4
tgc6tgc25
aac6tta13-2
tta15atg158
atgf7gaa90
gaa9gga61
gga5gta50
gta5gac16
gac9aac4
aca14aca4-10
tac9tac156
cta24cta11-13
ggc24ggc13-11
aga9aga7-2
caa8caa113
aaa2aaa64
tca3tca30
ttc6ttc93
atgj11atg8-3
atgi17atg21
cac8cca6
aaa7cac91
tgc7aaa2114
cgt12tgc6-1
gta75cgt10-2
cdsgta162
cds

cdc8 cdc psor 18

  • Lien tableur: cdc8 cdc psor 18
  • Lien cdc psor: le tableau de comparaison cdc-psor
  • Légende
    - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - 23s°: 23S ribosomal RNA rRNA prediction is too short
    - cca: marque les tRNAs différents entre les 2 génomes.
    - diff pour différence entre les intercalaires (intercal) colonne de droite moins colonne de gauche.
    - séquences identiques (bordure épaisse): Une séquence identique entre les 2 génomes est encadrée par 2 tRNAs différents (cyan) dans l'un et par 2 bordures épaisses dans l'autre.
  • Notes:
    - Sont comparés ici des suite de longueurs équivalentes entre les 3 génomes, 18aas 19aas 23aas,
    - avec 4 comparaisons cdc8 18aas/cdc 18aas, cdc8 19aas/psor 23aas, cdc8 18aas/psor 23aas, cdc8 19aas/cdc8 18aas,
    - cdc8 18aas et cdc 18aas sont identiques alors que, en intra, cdc8 19aas est très différent de cdc8 18aas.
    - cdc8 18aas est quasiment inclus dans psor 23aas: les 14 tRNAs de la fin de cdc8 se trouvent en fin de psor avec une seule insertion dans psor, mais les différences entre intercalaires sont élevées comme entre cdc et psor.
C3. Comparaison cdc8-cdc-psor 18
C33. Comparaison cdc8-cdc-psor 18
cdc818aascdc18aas
geneintercalgeneintercaldiff
cds214
cds554
cds0
cds16716s279
23s°13223s131-1
5s65s60
aac4aac40
gaa5gaa50
gta5gta50
gac11gac10-1
aca14aca140
tac9tac90
gga10gga100
aga9aga90
caa11caa110
aaa2aaa20
tca18tca17-1
agc8agc80
cca85cca850
tgg60tgg600
cca5cca61
atc3atc30
ttc7ttc70
atgj114atgj1140
cdc818aaspsor23aas
gèneintercalgèneintercaldiff
16s196
23s213
cds2145s5
cds554tta13
cds0atg15
cds167gaa9
23s°132gga6
5s6gta50
aac4gac16
gaa5aac31
gta5aac4
gac11aca4-10
aca14tac112
tac9gga199
gga10aga6-3
aga9caa121
caa11aaa64
aaa2tca11-7
tca18agc6-2
agc8cca6
cca85atg11
tgg60tgg31-29
cca5cca61
atc3atc63
ttc7ttc136
atgj114atg13824
C34. Comparaison cdc8-cdc-psor 19
cdc819aaspsor23aas
geneintercalgeneintercaldiff
16s32116s196
23s18123s213
5s65s5
aac6tta13-2
tta15atg158
atgf7gaa90
gaa9gga61
gga5gta50
gta5gac16
gac9aac31
aca14aac4
tac10aca4-10
cta28tac11
aga7gga19
caa89aga6-1
tca3caa12
ttc6aaa6
atgj11tca11
atgi29agc6
cca7cca6
cac8atg11
aaa353tgg31
cca6
atc6
ttc13
atg138
cdc819aascdc818aas
gèneintercalgèneintercaldiff
cds214
cds554
cds0
16s321cds167
23s18123s°132
5s65s6
aac6aac4
tta15gaa5
atgf7gta50
gaa9gac112
gga5aca140
gta5tac9
gac9gga10
aca14aga92
tac10caa11
cta28aaa2
aga7tca18
caa89agc8
tca3cca85
ttc6tgg60
atgj11cca5
atgi29atc3
cca7ttc7
cac8atgj114
aaa353

cdc8 cdc psor 9

  • Lien tableur: cdc8 cdc psor 9
  • Lien cdc psor: le tableau de comparaison cdc-psor
  • Légende
    - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - 23s°: 23S ribosomal RNA rRNA prediction is too short
    - cca: marque les tRNAs différents entre les 2 génomes.
    - diff pour différence entre les intercalaires (intercal) colonne de droite moins colonne de gauche.
    - séquences identiques (bordure épaisse): Une séquence identique entre les 2 génomes est encadrée par 2 tRNAs différents (cyan) dans l'un et par 2 bordures épaisses dans l'autre.
  • Notes:
    - Sont comparés ici des suites courtes, en intra cdc8 18aas/9aas et 19aas/9aas, cdc8 9aas/cdc 9aas et cdc8 VII1/psor VII1.
    - cdc8 9aas et cdc 9aas sont identiques
    - cdc8 9aas se retrouve entièrement (sauf 1 tRNA) dans cdc8 19aas avec cependant des diff élevés, mais il est très différent de cdc8 18aas (4 tRNAs différents).
    - La comparaison cdc8 VII1/psor VII1: le groupe de psor à 3 blocs 16s-gca-23s5s est caractérisé en plus par la séquence courte tta-atg (atg supposé atgi). On retrouve le bloc du milieu, VII1 dans cdc8, à l'envers (compléments) et on retrouve partiellement le bloc de fin VIII1 à l'endroit. Dans cdc8 ces blocs sont partiellement abîmés et se trouvent dans le groupe à 15 rRNAs (voir cdc8_blocs). Attention aux diff qui suivent le changement de sens.
    - 3 intercalaires sont préservés entre cdc8 VII1 et celui de psor, 16s-gca 5s-tta tta-atgi. De même pour 16s-gca du bloc VIII1.
C3. Comparaison cdc8-cdc-psor 9
C35. Comparaison cdc8-cdc-psor 9
cdc818aascdc89aas
geneintercalgeneintercaldiff
cds214
cds554
cds0cds281
cds16716s°100
23s°13223s°126
5s65s7
aac4aac6
gaa5tta15
gta5atgf7
gac11gaa8
aca14gga4
tac9gta50
gga10gac10
aga9ggc9
caa11aga954
aaa2cds
tca18
agc8
cca85
tgg60
cca5
atc3
ttc7
atgj114
cdc819aascdc89aas
geneintercalgeneintercaldiff
cds281
16s32116s°100
23s18123s°126
5s65s7
aac6aac60
tta15tta159
atgf7atgf7-8
gaa9gaa81
gga5gga4-5
gta5gta50
gac9gac10
aca14ggc9
tac10aga954
cta28cds
aga7
caa89
tca3
ttc6
atgj11
atgi29
cca7
cac8
aaa353
C36. Comparaison cdc8-cdc-psor groupe
cdc89aascdc9aas
geneintercalgeneintercaldiff
cds28116s52
16s°100gca373
23s°12623s126
5s75s7
aac6aac5-1
tta15tta150
atgf7atgf70
gaa8gaa146
gga4gga51
gta5gta50
gac10gac100
ggc9ggc90
aga954aga97521
cdscds
cdc8I4cdcVIII1
geneintercalgeneintercaldiff
16s68
16s217gca271
23s12623s1260
5s2165s213-3
cds372cds3720
cds21cds210
cds778cds776-2
16s26116s52
23s201gca373
5s523s126-75
5s72
psorVII1cdc8VII1
geneintercalgeneintercaldiff
CDS431cds179
16s5416s161
gca1145s201
23s19323s217
5s516s108
tta9atgi112
atg123tta50
16s545s2018
gca11423s375261
23s193gca52-2
5s516s’100-23
tta916s’52
atg123gca248
16s5423s°100-2
gca11416s°321134
23s7823s'100
5s10016s°320
CDS23s°100
23s’126
5s127
cds

cdc8 cdc protéines

  • Notes:
    - L'altération poussée des rRNAs dans cdc8 qui saute aux yeux quand on comapre les blocs en tRNAs et intercalaires, m'a poussé à comparer les tailles en pbs ici des rRNAs et des cds qui les entourent avec l'idée que ces cds sont issus de la conversion de ces rRNAs. D'où l'idée de création de gène par conversion à l'instar du processus CRISPR.

Alignement sur cdc

  • Lien tableur: Alignement sur cdc
  • Lien noms abrégés
  • Légende: abrégé pour noms abrégés des protéines.
    - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - 23s°: 23S ribosomal RNA rRNA prediction is too short
    - SigB: Protéine existant dans cdc et cdc8 mais est décalée dans cdc8 par les grands remaniements. Voir alignement sur cdc8, tableau qui suit.
  • Notes:
    - cdc présente 15 clusters avec ou sans rRNAs. 5 clusters sans rRNAs sont reproduits tels quels dans cdc8. Les clusters avec rRNAs se répartissent en 3 16sgca23s et 7 16s23s. Dans cdc8 les 3 16sgca23s sont modifiés ou altérés, 3 16s23s sont altérés et les 4 autres sont reproduits tels quels.
    - Les 3 16sgca23s5s perdent leur gca mais gardent le 5s. Deux sont durement altérés dont un porte une séquence de 9 tRNAs et l'autre rien. La modification du 3ème consiste en la suppression du gca seulement sans tocher le reste. Cependant l'intercalaire 16s-23s de 415 pbs dans cdc est divisé par 2 dans cdc8, 217 pbs.
    - Les 3 16s23s5s altérés le sont fortement, 2 portent des séquences longues de tRNAs, 43 et 18, le 3ème est sans tRNAs.
    - La colonne "ordre dans cdc" servira à repérer les grands remaniement quand je ferai l'alignement sur cdc8. De même pour les protéines en bleu foncé.
C3. cdc-cdc8, alignement des protéines sur cdc
C37. cdc protéines
ordresensadressegeneintercalpbsabrégé
0dir9857..10630cds179774SigB
dir10810..1231716s521508
dir12370..12445gca24976
1dir12695..1559623s1112902
dir15708..158245s126117
dir15951..16460cds11510NadR
dir16472..17353cds457882mecano
dir17811..19082cds3191272S-ligase
dir19402..19857cds0456Nuc-de
dir19858..19949tcc3792
2dir19987..20251ncRNA76265
dir20328..21965cds1638III-tau
comp23419..24624cds5051206Glyco-tr
dir25130..2663716s2791508
dir26917..2981623s1802900
dir29997..301135s6117
3dir30120..30194aac675
dir**41aas12
dir33877..33952gta7576
dir34028..34441cds308414hp-414
dir34750..38181cds3432pyruvate
dir127011..127715cds281705CwlD
dir127997..12950516s2791509
dir129785..13268523s1312901
dir132817..1329335s6117
4dir132940..133014aac475
dir**16aas8
dir134534..134610atgj11477
dir134725..13611516s681391
dir136184..136259gca27176
dir136531..13943023s1262900
dir139557..1396735s213117
comp139887..141071cds3721185B6
5dir141444..143795cds212352Art-red
dir143817..144356cds776540Art-reda
dir145133..14664016s521508
dir146693..146768gca37376
dir147142..15004123s1262900
dir150168..1502845s7117
6dir150292..150366aac575
dir**7aas6
dir150976..151049aga97574
dir152025..152864cds840TIGR
dir378341..380728cds5832388cad
dir381312..38281916s3111508
dir383131..38603023s1262900
7dir386157..3862735s177117
dir386451..387059cds609DedA
comp833130..833894cds258765DeoR
8dir834153..834243agc8791
dir834331..835119cds789flagellar
dir1089165..1090139cds239975Mannosyl
dir1090379..109188616s3201508
dir1092207..109510623s912900
dir1095198..1095271gga874
9dir1095280..10953965s273117
dir1095670..1097688cds2019Ala amid
comp1181549..1182958cds13741410MBOAT
10comp1184333..1184415ttg31883
dir1184734..1187382cds2649PolyI
dir1835768..1837498cds1091731NhaC
11dir1837608..1837688cta23181
<dir1837920..1838093cds174HXXEE
dir2981767..2982444cds159678SrtB
comp2982604..2982678aca9475
comp2982773..298567223s1842900
12comp2985857..298736416s3401508
dir2987705..2988643cds939lactam
comp3787361..3788431cds4541071ABC
comp3788886..37890025s126117
13comp3789129..379202823s2812900
comp3792310..379381716s1911508
comp3794009..3794587cds579precorrin
comp3944262..3944453cds119192DUF378
comp3944573..39446895s126117
14comp3944816..394771523s2172900
comp3947933..394944016s2821508
comp3949723..3950004cds221282hp-282
comp3950226..3951755cds1530K-ligase
dir4084445..4085437cds382993DnaC
comp4085820..4085894aca3375
15comp4085928..4086003gta476
comp4086008..4086082gaa675
comp4086089..4086164aaa32676
comp4086491..4087780cds1290succinate
C38. cdc8 protéines
sensadressegeneintercalpbsabrégé
dir4194196..419642323s’1002228
dir4196524..419709116s°320568
dir4197412..419904423s°1001633
dir4199145..420159323s’1262449
dir4201720..42018365s127117
dir4201964..4202473cds11510NadR
dir4202485..4203366cds458882mecano
dir4203825..4205096cds3201272S-ligase
dir4205417..4205872cds0456Nuc-de
dir4205873..4205964tcc3792
dir4206002..4206266ncRNA76265
dir4206343..4207980cds1638III-tau
dir4306341..430753816s01198
dir4307539..4308225cds100687xylose
dir1..79623s°181796
dir978..10945s6117
dir1101..1175aac675
dir**41aas12
dir4868..4943gta7576
dir5019..5432cds308414hp-414
dir5741..9172cds3432pyruvate
dir4300349..4300807cds554459Helix
dir4301362..4303101cds01740hp-1740
dir4303102..4303305cds167204hp-204
dir4303473..430429923s°132827
dir4304432..43045485s6117
dir4304555..4304629aac475
dir**16aas8
dir4306150..4306226atgj11477
dir4232593..423409816s2171506
dir4234316..423721523s1262900
dir4237342..42374585s216117
comp4237675..4238859cds3721185B6
dir4239232..4241583cds212352Art-red
dir4241605..4242144cds778540Art-reda
dir94032..94736cds281705CwlD
dir95018..9599416s°100977
dir96095..9761323s°1261519
dir97740..978565s7117
dir97864..97938aac675
dir**7aas6
dir98542..98615aga95474
dir99570..100409cds840TIGR
dir306829..309216cds7332388cad
<>comp309950..310076cds1127seleno
dir310078..31131323s°1261236
dir311440..3115565s177117
dir311734..312342cds609DedA
comp861856..862620cds258765DeoR
dir862879..862969agc8791
dir863057..863845cds789flagellar
dir1106477..1107451cds238975Mannosyl
dir1107690..110919716s3201508
dir1109518..111241623s912899
dir1112508..1112581gga874
dir1112590..11127065s273117
dir1112980..1114998cds2019Ala amid
comp1196804..1198213cds13781410MBOAT
comp1199592..1199674ttg31883
dir1199993..1202641cds2649PolyI
dir1850896..1852626cds1091731NhaC
dir1852736..1852816cta33481
dir1853151..1853666cds516HXXEE
dir3024038..3024715cds150678SrtB
comp3024866..3024940aca9375
comp3025034..302793323s1842900
comp3028118..302962516s3741508
dir3030000..3030938cds939lactam
comp3875816..3876886cds4521071ABC
comp3877339..38774555s125117
comp3877581..388048023s2612900
comp3880742..388224916s1901508
comp3882440..3883018cds579precorrin
comp4017523..4017714cds118192DUF378
comp4017833..40179495s126117
comp4018076..402097523s3212900
comp4021297..402280416s2921508
comp4023097..4023378cds221282hp-282
comp4023600..4025129cds1530K-ligase
dir4135881..4136873cds383993DnaC
comp4137257..4137331aca3375
comp4137365..4137440gta476
comp4137445..4137519gaa675
comp4137526..4137601aaa33176
comp4137933..4139222cds1290succinate

Alignement sur cdc8

  • Lien tableur: Alignement sur cdc8
  • Lien noms abrégés
  • Légende:
    - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - 23s°: 23S ribosomal RNA rRNA prediction is too short
    - SigB: Protéine existant dans cdc et cdc8 mais est décalée dans cdc8 par les grands remaniements. Voir alignement sur cdc, tableau précédent.
  • Notes:
    - Ici je n'ai pas fait de parallélisme cdc8/cdc. Il suffit de voir la colonne ordre de cdc décrit dans le tableau précédent (alignement sur cdc) pour se rendre compte des grands remaniements du chromosome. Dans cette colonne j'ai ajouté "insert" pour insertion par rapport à cdc.
    - Pour comparer cdc8 à psor pour certains clusters j'ai du intervertir l'ordre des tableaux, le tableau de gauche doit être la suite de celui de droite.
    - Les insertions accumulent les 2 grands groupes qu'on a vu dans cdc8-blocs, à 15 et 23 rRNAs. Par contre en dehors des insertions on trouve 3 groupes altérés à 1 ou 2 clusters, et tous les groupes non altérés sauf l'ordre 5 de cdc.
    - comparaison avec psor: on devine les types VI VII VIII, mais il y a de nouveau type le IV4 par exemple qu'on a signalé dans cdc8-blocs.
C3. cdc-cdc8, alignement des protéines sur cdc8
C40. cdc8 début
cdc8
ordre cdcsensadressegèneintercalpbsabrégé
insertdir4299490..4300134cds214645Y-r1
insertdir4300349..4300807cds554459Helix
dir4301362..4303101cds01740hp-1740
dir4303102..4303305cds167204hp-204
dir4303473..430429923s°132827
4dir4304432..43045485s6117
dir4304555..4304629aac475
dir4304634..4304708gaa575
dir4304555..4304629aac475
dir**16aas8
dir4306150..4306226atgj11477
dir4306341..430753816s01198
dir4307539..4308225cds100687xylose
dir1..79623s°181796
3dir978..10945s6117
dir1101..1175aac675
dir**41aas12
dir4868..4943gta7576
dir5019..5432cds308414hp-414
dir5741..9172cds3432pyruvate
dir94032..94736cds281705CwlD
dir95018..9599416s°100977
dir96095..9761323s°1261519
6dir97740..978565s7117
dir97864..97938aac675
dir**7aas6
dir98542..98615aga95474
dir99570..100409cds840TIGR
<> cp309950..310076cds1127seleno
dir310078..31131323s°1261236
7dir311440..3115565s177117
dir311734..312342cds609DedA
comp861856..862620cds258765DeoR
8dir862879..862969agc8791
dir863057..863845cds789flagellar
dir1106477..1107451cds238975Mannosyl
dir1107690..110919716s3201508
dir1109518..111241623s912899
dir1112508..1112581gga874
9dir1112590..11127065s273117
dir1112980..1114998cds2019Ala amid
comp1196804..1198213cds13781410MBOAT
10comp1199592..1199674ttg31883
dir1199993..1202641cds2649PolyI
dir1850896..1852626cds1091731NhaC
11dir1852736..1852816cta33481
dir1853151..1853666cds516HXXEE
dir3024038..3024715cds150678SrtB
comp3024866..3024940aca9375
12comp3025034..302793323s1842900
comp3028118..302962516s3741508
dir3030000..3030938cds939lactam
insertdir3805298..3806743cds2081446Y-r2
insertcomp3806952..3807028agg6177
insert<comp3807090..3808790cds1701fdHa
comp3875816..3876886cds4521071ABC
comp3877339..38774555s125117
13comp3877581..388048023s2612900
comp3880742..388224916s1901508
comp3882440..3883018cds579precorrin
comp4017523..4017714cds118192DUF378
comp4017833..40179495s126117
14comp4018076..402097523s3212900
comp4021297..402280416s2921508
comp4023097..4023378cds221282hp-282
comp4023600..4025129cds1530K-ligase
dir4135881..4136873cds383993DnaC
comp4137257..4137331aca3375
15comp4137365..4137440gta476
comp4137445..4137519gaa675
comp4137526..4137601aaa33176
comp4137933..4139222cds1290succinate
C40. cdc8 suite
cdc8psor
ordre cdcsensadressegèneintercalpbsabrégéadressegèneintercalpbsabrégé
0dir4178197..4178970cds179774SigB127845..129260CDS1001416R-deca
insertdir4179150..418058716s1611438127628..1277445s78
insertcomp4180749..41808655s201117124628..12754923s114
insertcomp4181067..418395923s2172893124438..124513gca54
insertcomp4184177..418568416s1081508122877..12438316s123
insertcomp4185793..4185869atgi1177122677..122753atg9
insertcomp4185881..4185969tta589122579..122667tta5
insertcomp4185975..41860915s201117122457..1225735s193
insertcomp4186293..418919223s3752900119347..12226323s114
insertcomp4189568..4189643gca5276119157..119232gca54
insertcomp4189696..419095916s’1001264117596..11910216s123
insertdir4191060..419222516s’521166117396..117472atg9
insertdir4192278..4192353gca24876117298..117386tta5
insertdir4192602..419319723s°100596117176..1172925s193
insertdir4193298..419387416s°321577114067..11698223s114
insertdir4194196..419642323s’1002228113877..113952gca54
dir4196524..419709116s°320568112316..11382216s431
1dir4197412..419904423s°1001633111345..111884CDS540Art-reda
dir4199145..420159323s’1262449
dir4201720..42018365s127117
dir4201964..4202473cds11510NadR
dir4202485..4203366cds458882mecano
dir4203825..4205096cds3201272S-ligase
dir4205417..4205872cds0456Nuc-de
dir4205873..4205964tcc3792
2dir4206002..4206266ncRNA76265
dir4206343..4207980cds1638III-tau
insertcomp4209435..4210639cds4961205Glyco-tr
insert4211136..421264316s3211508
insert4212965..421312723s°100163
insert<>comp4213228..4213849cds622CHAP
insertcomp4213961..4214620cds228660A-1chlor
insertdir4214849..421619916s3211351
insertdir4216521..421700823s°101488
insertcomp4217110..421852923s°2501420
insertcomp4218780..4218855gca5276
insertcomp4218908..421947116s°100564
insertcomp4219572..421985623s°217285
insertcomp4220074..422158116s1791508
insert>comp4221761..4222206cds386446SigB23452349..3452552CDS239204hp-204
insertdir4222593..422410016s32115083450603..345210916s196
insertdir4224422..422732123s18129003447492..345040623s213
insertdir4227503..42276195s61173447162..34472785s5
insertdir4227626..4227700aac6753447068..3447156tta13
insertdir4227707..4227792tta15863446979..3447054atg15
insertdir4227808..4227883atgf7763446889..3446963gaa9
insertdir4227891..4227965gaa9753446806..3446879gga6
insertdir4227975..4228048gga5743446724..3446799gta5
insertdir4228054..4228129gta5763446642..3446718gac16
insertdir4228135..4228211gac9773446550..3446625aac31
insertdir4228221..4228295aca14753446443..3446518aac4
insertdir4228310..4228394tac10853446364..3446438aca4
insertdir4228405..4228488cta28843446275..3446359tac11
insertdir4228517..4228593aga7773446190..3446263gga19
insertdir4228601..4228676caa89763446094..3446170aga6
insertdir4228766..4228854tca3893446012..3446087caa12
insertdir4228858..4228933ttc6763445924..3445999aaa6
insertdir4228940..4229016atgj11773445829..3445917tca11
insertdir4229028..4229104atgi29773445727..3445817agc6
insertdir4229134..4229210cca7773445644..3445720cca6
insertdir4229218..4229294cac8773445561..3445637atg11
insertdir4229303..4229378aaa353763445474..3445549tgg31
insertcomp4229732..42298485s1261173445366..3445442cca6
insertcomp4229975..423201023s’58220363445283..3445359atc6
dir4232593..423409816s21715063445201..3445276ttc13
dir4234316..423721523s12629003445111..3445187atg
dir4237342..42374585s216117
comp4237675..4238859cds3721185B6
5dir4239232..4241583cds212352Art-red
dir4241605..4242144cds778540Art-reda
insertdir4242923..424445916s2611537
insertdir4244721..424761923s2012899
insertdir4247821..42479375s5117111345..111884CDS431540Art-reda
insertdir4247943..4248031tta1189112316..11382216s54
insertdir4248043..4248119atgi10877113877..113952gca114
insertdir4248228..424973516s1841508114067..11698223s193
insertdir4249920..425056423s°100645117176..1172925s5
insert<dir4250665..4250923cds112259hp-259117298..117386tta9
insertcomp4251036..425314523s’3752110117396..117472atg123
insertcomp4253521..4253596gca5276117596..11910216s54
insertcomp4253649..425422616s°282578119157..119232gca114
insertdir4254509..4254712cds12204hp-204119347..12226323s193
insertdir4254725..4256002cds1278phagePP122457..1225735s5
122579..122667tta9
débutdébutdébutdébutdébutdébutdébut122677..122753atg123
insertdir4299490..4300134cds214645Y-r1122877..12438316s54
insertdir4300349..4300807cds554459Helix124438..124513gca114
dir4301362..4303101cds01740hp-1740124628..12754923s78
dir4303102..4303305cds167204hp-204127628..1277445s100
4dir4303473..430429923s°132827127845..129260CDS1416R-deca

cdc8 cdc création de cds

  • Lien tableur: cdc8 cdc création de cds
  • Lien abrégé
  • Notes:
    - Dans la colonne abrégé sont marqués les cds spécifiques à cdc8, cyan dans Alignement sur cdc8.
    - Certains de ces cds, étant donné leur position dans un bloc de rRNAs dégradés, seraient des candidats de gènes créés de novo lors des conversions qui ont altéré ce bloc. Il est évident qu'on peut toujours rétorquer que ce gène a été copié ou intégré à ce niveau par la conversion. Mais si ce gène ou plusieurs n'existaient pas dans cdc mais seulement dans cdc8, alors l'hypothèse de création de novo serait renforcée.
    - 7 gènes de cdc8, Y-r1 Helix xylose seleno CHAP A-1chlor sigB2, répondent aux critères de la conversion mais n'existent pas dans cdc. Ces cds sont colorés en jaunes et repérés par leur taille en pbs.
    - 4 gènes parmi les 7, seleno CHAP A-1chlor sigB2, n'existent qu'en un seul exemplaire, et ne peuvent donc être extraits à la limite que d'un cds hypothétique, hypothetical protein.
    - Les 3 gènes restants, Y-r1 Helix xylose, ont des cds analogues, c.a.d portant le même nom dans mes recherches et pourraient être extraits de ces analogues d'autant plus qu'ils ont des noms portant la mention type ou domaine.
    - Le gène PhagePP est à la limite du critère de conversion puisqu'il est en fin de bloc mais séparé de 12 pbs du cds hp-204 qui est plus proche de la création de novo puisqu'il est hypothétique. Il appartiendrait au 2ème groupe de gènes ayant des analogues. Cependant j'ai trouvé un gène dans cdc et un gène dans psor qui ont des tailles quasi identiques. Aussi j'ai recherché les cdcs encadrant ces gènes, ils sont tous différents dans les 3 génomes. PhagePP serait analogue donc à Y-r1 Helix xylose.
    Le nom complet du cds Clp est "Clp protéase" et celui de PhageHM est "phage head morphogenesis, SPP1 gp7 family domain protein".
    - J'ai inclue aussi 2 cds appartenant à un cluster sans rRNA, Y-r2 et fdhA. Y-r2 avec sa taille de 1446 se comporte comme Y-r1, il n'existe pas dans cdc. fdhA est le contre exemple de cds qui n'est pas créé de novo, il n'est pas dans une zone altérée par la conversion des rRNA, et il existe dans cdc, mais pas dans psor qui est plus loin phylogénétiquement.
C3. cdc8 cdc création de cds
abrégécdc8pbscdcpbspsorpbs
seleno A309950..3100761270-
Y-r457663..457878216457207..457422216-
1237414..12379865731223841..1224413573
1291413..12923279151277836..1278750915
1418672..14195809091405262..1406170909
2120221..21213481128
2785863..2786042180
3564835..3565434600
Y-r23805298..38067431446
Y-r14299490..4300134645
Helix351106..351336231391813..392001189-
379952..380503552429510..430061552
456588..456776189461727..462398672
1187185..11877365521169984..1170535552
1466364..14667834201292255..1292926672
1467749..14681473991454375..1454773399
1605760..16063445851517855..1518619765
1694358..16947503931592306..1592890585
1936722..19372675461682266..1682658393
2105662..210671110501695592..1696284693
2196549..219820416561916424..1916630207
2342487..23426902041922813..1923358546
2353934..23545786452164151..21658061656
2378761..237989111312308386..2308589204
2721795..27223165222319833..2320477645
3485137..34860248882344477..23456071131
3570953..35711832312501260..2501931672
3571660..35718782192688255..2688776522
3804379..38046272493459701..3460588888
3804878..38052794023475449..3475589141
4286854..4287222369
4288799..4289518720
4300349..4300807459
xylose3383443..338478013383349843..335118013380
<4307539..4308225687
CHAP<4213228..>42138496220-
A-1chlor4213961..421462066000
SigB24221761..422220644600
fdHa4221761..422220617013711229..37133732145-
R-deca00127845..1292601416
876023..8775221500
phagePP1448919..144998310651435547..143661110651489507..14907691263
1450539..14509854471437167..1437613447
1709611..171105014401697521..16989631443
1718404..17188444411708192..1708632441
3560756..356191011553841162..38423671206
4254725..42560021278
4260531..42615861056
4262058..4262474417
hp-2044254509..4254712204
phagePP4254725..42560021278
phageHM4255980..4256741762
hp-5433840525..3841067543
phagePP3841162..38423671206
hydrolase3842345..3842512168
terminase1487770..14894911722
phagePP1489507..14907691263
Clp1490762..1491607846

cdc8 cdc abrégé protéines

C3. C39 abrégé des protéines
abrégénom protéine
A-1chlortype A-1 chloramphenicol O-acetyltransferase
ABCABC transporter ATP-binding protein
Ala amidN-acetylmuramoyl-L-alanine amidase
Art-redanaerobic ribonucleoside triphosphate reductase
Art-redaanaerobic ribonucleoside-triphosphate reductase activating protein
B6pyridoxal phosphate-dependent aminotransferase
cadcadmium-translocating P-type ATPase
CHAPCHAP domain-containing protein
CwlDN-acetylmuramoyl-L-alanine amidase CwlD
DedADedA family protein
DeoRDeoR/GlpR transcriptional regulator
DnaCDNA replication protein DnaC
DUF378DUF378 domain-containing protein
fdHaformate dehydrogenase subunit alpha
flagellarflagellar motor protein
Glyco-trglycosyl transferase
Helixhelix-turn-helix domain-containing protein
hp-1740hp-1740
hp-204hp-204
hp-282hp-282
hp-414hp-414
HXXEEHXXEE domain-containing protein
III-tauDNA polymerase III subunit gamma/tau
K-ligaselysine--tRNA ligase
lactamdelta-lactam-biosynthetic de-N-acetylase
MannosylMannosyl-glycoprotein endo-beta-N-acetylglucosamidase
MBOATMBOAT family protein
mecanomechanosensitive ion channel
NadRtranscription repressor NadR
NhaCNa+/H+ antiporter NhaC family protein
Nuc-denucleoside deaminase
phagePPphage portal protein
PolyIDNA polymerase I
precorrinbifunctional precorrin-2 dehydrogenase/sirohydrochlorin ferrochelatase
pyruvatepyruvate carboxylase
R-decaarginine decarboxylase
selenoglycine/sarcosine/betaine reductase complex selenoprotein A
SigBSigB/SigF/SigG family RNA polymerase sigma factor
SigB2B/F/G family RNA polymerase sigma-70 factor
S-ligaseserine--tRNA ligase
SrtBsortase SrtB
succinateadenylosuccinate synthase
TIGRTIGR00159 family protein
xylosexylose isomerase
Y-r1tyrosine-type recombinase/integrase – 1
Y-r2tyrosine-type recombinase/integrase – 2

cdc8 cdc psor stats

C3 cdc8 cdc psor base NCBI
NCBI du 13.11.19cdc8cdcpsor
date15-MAR-201718-MAY-201708-JAN-2018
DNA circulaire4 308 3254 110 5543 550 458
Genes (total)4 0253 8073 528
CDS (total)3 8703 6913 368
Genes (coding)3 7633 6153 327
CDS (coding)3 7633 6153 327
Genes (RNA)155116160
RRNAs (5S, 16S, 23S)14, 16, 139, 10, 1017, 17, 17
complete rRNAs14, 16, 139, 10, 1017, 17, 17
tRNAs10883105
ncRNAs444
Pseudo Genes (total)1077641
Pseudo Genes (ambiguous residues)0 of 1070 of 760 of 41
Pseudo Genes (frameshifted)60 of 10742 of 764 of 41
Pseudo Genes (incomplete)35 of 10730 of 7618 of 41
Pseudo Genes (internal stop)31 of 10718 of 7622 of 41
Pseudo Genes (multiple problems)18 of 10712 of 763 of 41
CRISPR Arrays49-
Décompte du 19.11.19
hypothetical protein6095231 256
hp / cds (total)0,160,140,37

cdc8 remarques

  • Lien noms abrégés
  • Liens pour ce chapitre: noms abrégés opérons cumuls blocs cdc8 cdc psor 43 cdc8 cdc psor 18 cdc8 cdc psor 9 Alignement sur cdc Alignement sur cdc8.
  • Remarques des 7 @ dans opérons :
    1. @ Dans la comparaison cdc8-cdc du bloc à 18aas, les rRNAs 23s et 16s disparaissent. Les 4 cds récupérés et le 23s° (voir opérons pour les noms et les longueurs des cds)
      - correspondraient à la somme des longueurs de 16s (1500 pbs) et 23s (2900 pbs), soit 4400 pbs
      - correspondraient à la longueur totale entre le 1er cds et le 5s, 4304299-4299490 = 4810 pbs
      - la somme des 4 cds récupérés et du 23s° est de 3875 pbs. Les longueurs des cds en aas sont dans l'ordre 215 153 580 68.
      - Le plus intéressant c'est que, si on suppose que les 2 protéines hypothétiques 580 et 68 sont dues aux remaniements,
      - les 2 protéines qui les précèdent sont qualifiées de type intégrase et de protéine contenant un domaine. C'est comme si les remaniements (certainement des conversions géniques) utilisaient une partie d'un gène protéique comme matrice de copie.
    2. @ configuration de bloc peu courante, avec gga: même bloc que cdc et psor.
    3. @ configuration de bloc peu courante, avec aca, et perte de 5s: même bloc que cdc et psor sans 5s.
    4. @ On retrouve le groupe1 de psor, avec 2 gca: VII1 en comp suivi de VIII1 en dir
      - L’intercalaire 23s-gca de VII1 est de 375, beaucoup plus élevé que celui de psor , 114.
      - De même pour VIII1, 248 contre 114.
    5. @ Conservation du bloc tcc-ncRNA dans cdc8 cdc et psor, avec les mêmes intercalaires.
    6. @ Conservation des 3 cds , avec leurs intercalaires, du seul groupe de cdc, mais les gca disparaissent.
    7. @ Nouveau bloc analogue au VI1 et VII1 de psor, sans gca, et qui n’existe pas chez cdc: 16s23s5s-tta-atgi. Avec ces 2 dernières remarques c'est comme si les remaniements des blocs à RNA consistaient à supprimer les gca des blocs 16sgca23s5s, et en le faisant ils laissaient des morceaux de 16s et 23s.
  • Décompte des rRNAs de cdc8 d'après Alignement sur cdc8.
Les RNAs		
16s	14	
16s’	2	
16s°	5	
23s	9	
23s’	4	
23s°	11	
5s	14	
taille d’un bloc normal		
16s	16	1508  soit 10/14
23s	13	2900  soit  9/9
5s	14	117   soit 14/14
  • Notes:
    - Les autres cds créés création de cds
    - Alignement sur cdc8: cdc8 résulte d'une recombinaison d'une clostridia de type cdc et d'une autre de type psor Alignement sur cdc8
    - Orientation des créations stats: soit création en masse par la mobilité et l'insertion des blocs 16s23s5s (cas de psor) puis dégradation de ces blocs dans une étape intermédiaire (cas de cdc8) qui aboutit à un état stable (cas de cdc), soit création par une évolution progressive de cdc vers psor en passant par cdc8. Le 1er cas serait soutenu la proportion très élevée des hp par rapport au total de 37% (voir stats) alors que le 2ème cas serait soutenu par par le type IV4 de cluster dans cdc8 et n'existe ni dans cdc ni dans psor, 16s23s5s-tta-atgi (voir alignement sur cdc8).
    - Les 3 types de création: avec altération des rRNAs (cdc8), dans les blocs 16s23s5s ou 16s-aaas-23s5s (décompte des cds dans un échantillon de clostridia) et après les blocs à la suite des tRNAs ou non (psor opérons).
    - Hypothèse de la création des gènes

cdc8 distribution

  • Lien tableur: cdc8 distribution
  • Notes: Tableau Cl32
    - -5s: gga et aca
    - 1-3: 2 tta et 2 atgi
Cl3 cdc8, Peptoclostridium difficile M68. clostridia.
Cl31 cdc. La distribution des tRNAs sans rRNA.
g1t1 
atgitcttatatgf
attactaatagt
cttcctcatcgc
gttgctgatggt
ttctcc1tactgc
atcaccaacagc1
ctcccccaccgt
gtcgccgacggc
ttatcataatga
ataaca1aaa1aga
cta1ccacaacga
gta1gcagaa1gga
ttg1tcgtagtgg
atgjacgaagagg1
ctgccgcagcgg
gtggcggagggg
clos>1aa=1aa-5s+5s-16s+16stotal
cdc845*9
Cl32 psor. La distribution des tRNAs avec rRNA.
g1t1 
atgi5tcttatatgf4
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc4tcctac4tgc2
atc1accaac5agc1
ctcccccac3cgt1
gtcgccgac5ggc2
tta6tca4taatga
ataaca5aaa5aga5
cta3cca4caa4cga
gta6gca4gaa5gga6
ttgtcgtagtgg1
atgj4acgaagagg
ctgccgcagcgg
gtggcggagggg
clos>1aa=1aa-5s+5s-16s+16stotal
cdc82*93*499

Clostridium botulinum CDC_297

  • Notes: Il n'y a pas de code KEGG pour ce génome, je lui ai donné le code cbc*, mais pour les têtes de chapitre je mets cbc.

cbc opérons

  • Lien tableur: cbc* opérons
  • Liens: gtRNAdb , NCBI , génome
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae;Clostridium.
  • Légende:
    - cyan pour les doubles signalés par le signe + dans la colonne doubles.
    - cds, ce cds a la particularité d'être très court et collé au cluster à rRNA. Il fait 108 pbs et sa séquence est,
    MNEGCDRILIVVARWQVSKNKKMLTKIKKRATIIKH.
    - @ voir le chapitre remarques de ce génome.
C4. Clostridium botulinum CDC_297
28%GC30.6.19 Paris52doublesintercalaaavec aa
comp1309334..1309408gag
comp1385938..1386012aac8
comp1386021..13861345s108
comp1386243..138914023s228
comp1389369..139086616s@1
comp1392997..1393072ttc7
comp1393080..13931935s108
comp1393302..139619923s228
comp1396428..139792516s
comp1408673..1408762tcc
comp1412183..1412259agg
comp1415464..1415540cgt8484
comp1415625..1415715agc+2020
comp1415736..1415826tca2 agc306306
comp1416133..1416223agc2 tca2020
comp1416244..1416334tca@4
comp1425969..1426044gca33
comp1426048..1426124atgi8
comp1426133..14262465s79
comp1426326..142782316s@2117
comp1427941..1428051cds
1694943..1695017cag
comp1722580..1722664tac55
comp1722670..1722745aca
comp1841437..1841510tgc
comp1842698..18428115s108
comp1842920..184581723s228
comp1846046..184754316s
1890534..1890608gaa+1717
1890626..1890701gta3 gaa99
1890711..1890787gac3 gta44
1890792..1890867aca3 gac55
1890873..1890947gaa2 aca1818
1890966..1891041gta77
1891049..1891125gac5757
1891183..1891257gaa1717
1891275..1891350gta99
1891360..1891436gac44
1891441..1891516aca
comp1948153..1948228cca
1969157..1969245tta44
1969250..1969325atgf+5353
1969379..1969454atgf2 atgf1010
1969465..1969541atg
1987541..198904016s@3226
1989267..199216623s93
1992260..19923755s7
1992383..1992457aac+2727
1992485..1992559aac
2013239..2013313ggg1818
2013332..2013407acc
2222515..2222590tgg
2294767..2294842cca+77
2294850..2294923gga2 cca66
2294930..2295006aga2 gga55
2295012..2295087aag2626
2295114..2295189cca2929
2295219..2295292gga2424
2295317..2295393cga
2402556..2402631gta55
2402637..2402713gac33
2402717..2402792ttc44
2402797..2402871ggc99
2402881..2402954tgc
2517305..2517391ttg
2548708..2548792ctc
2583298..2583388tga

cbc cumuls

C4. cumuls. Clostridium botulinum CDC_297
opéronsFréquences intercalaires tRNAs
effectifgammessans rRNAsavec rRNAs
avec rRNAopérons5100
16 23 5s 0120221
16 atc gca04031
16 23 5s a36020
max a28000
a doubles110010
spéciaux112000
total aas614000
sansopérons1716000
1 aa1018000
max a1120000
a doubles400
total aas46282
total aas52
remarques4
avec jaunemoyenne1715
variance19
sans jaunemoyenne15
variance14

cbc blocs

C4. Clostridium botulinum CDC_297, cbc* blocs
aac87-
5s108108108226
23s22822822893
16s-7
gca3
atgi8
5s79
16s

cbc remarques

@1	Les 4 blocs 16.23.5.aa ont des intercalaires identiques à 1 base près.
	- 1 a 0aa, 2 ont 1aa et 1 a 2aas (@3.
	
@2	C’est 1 bloc 16.23.5.aa qui a perdu 23s.
	- L'intercalaire 5s-aa est le même que pour les 4 blocs de @1.
	- Il a 2aas dont le 1er est atgi, rare avec les rRNAs.
	- Il est précédé d'une protéine de 36aas avec un intercalaire de 117.
	- Est-ce qu'elle appartient à l'opéron?
	
@3	C’est 1 bloc 16.23.5.aa  de @1 avec 1 aa double.
	- L'intercalaire 23-5  est très faible, 14% de moins par rapport à @1, 15/108.
	
@4	Dépassement de la règle des intercalaires, 210 bases, 306. 
	- Il se trouve entre 2 séquences de 2 aas.
	- Est-ce 2 opérons?
	
Séquences des doubles : 	
	- 1 opéron à 1 doublet.
	- 2 opérons à 2 séquences de 2 aas chacun.
	- 1 opéron de 11 aas avec 4 séquences de 3 aas, moins 1 aa.

cbc distribution

  • Lien tableur: cbc distribution
  • Notes:
    - 1-3aas: gca atgi aac ttc aac2
    - >1aa: atgf2
Cl4 cbc. Clostridium botulinum CDC_297 . clostridia.
g1t1 
atgi1tcttatatgf2
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc2tcc1tac1tgc2
atcacc1aac3agc2
ctc1ccccaccgt1
gtcgccgac4ggc1
tta1tca2taatga1
ataaca3aaaaga1
ctacca3caacga1
gta4gca1gaa3gga2
ttg1tcgtagtgg1
atgj1acgaag1agg1
ctgccgcag1cgg
gtggcggag1ggg1
clos>1aa=1aa-5s+5s-16s+16stotal
cbc*36106*52

Clostridium botulinum BKT015925

cbn opérons

  • Lien tableur: cbn opérons
  • Liens: gtRNAdb , NCBI , génome
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae;Clostridium.
  • Légende:
    - cyan pour les doubles signalés par le signe + dans la colonne doubles.
    - @ voir le chapitre remarques de ce génome.
C5. Clostridium botulinum BKT015925
28%GC30.6.19 Paris86doublesintercalaaavec aa
20666..20741acg
36413..36487gaa+1212
36500..36575gta2 gaa1313
36589..36665gac2 gta55
36671..36746aca2 gac1818
36765..36839gaa2 aca1212
36852..36927gta1313
36941..37017gac55
37023..37098aca
137366..137441cca
161964..162052tta+55
162058..162133atgf3 tta55
162139..162215atgj3 atgf4646
162262..162350tta2 atgj55
162356..162431atgf3030
162462..162538atgj4646
162585..162673tta55
162679..162754atgf
76258..176332aac
180177..18169516s@5233
181929..18483623s45
184882..184956aac+14
184971..1850875s7
185095..185169aac2 aac
222409..222484acc
comp578417..578492cag
comp944747..944833ttg
955546..955630ctt
1026946..1027021gta171717
1027039..1027115gac141414
1027130..1027205ttc444
1027210..1027284ggc888
1027293..1027367tgc+575757
1027425..1027499tgc2 tgc
comp2030816..2030890aac45
comp2030936..203384223s96
comp2033939..2034015atc77
comp2034023..2034098gca121
comp2034220..203573416s
comp2283768..22838845s95
comp2283980..228688623s233
comp2287120..228863816s@3464
comp2289103..2289176gga1515
comp2289192..2289268atc77
comp2289276..2289351gca
comp2350598..2350674cga+2121
comp2350696..2350769gga4 gga2828
comp2350798..2350873aaa2 aaa44
comp2350878..2350952caa2 caa44
comp2350957..2351032cac2 cac55
comp2351038..2351112aag3 aag33
comp2351116..2351192aga3 aga66
comp2351199..2351272gga2 cca44
comp2351277..2351352cca2 ggc2121
comp2351374..2351449aag55
comp2351455..2351531aga55
comp2351537..2351610gga55
comp2351616..2351690ggc33
comp2351694..2351777cta2222
comp2351800..2351875aaa44
comp2351880..2351954caa44
comp2351959..2352034cac55
comp2352040..2352115aag55
comp2352121..2352197aga55
comp2352203..2352276gga55
comp2352282..2352356ggc66
comp2352363..2352438cca
comp2432784..2432859tgg
comp2454880..2454964tac+3939
comp2455004..2455079gta2 tac88
comp2455088..2455172tac44
comp2455177..2455252aca
comp2697795..26979115s@131
comp2697943..270084723s233
comp2701081..270259916s
comp2703946..2704021aaa311311
comp2704333..2704408ttc5
comp2704414..27045305s336
comp2704867..2704942ttc5
comp2704948..27050645s97
comp2705162..270806623s233
comp2708300..270981416s
comp2721253..2721328aaa@25
comp2721334..27214505s95
comp2721546..272445223s233
comp2724686..272620316s
comp2731902..2731976gag6161
comp2732038..2732112caa66
comp2732119..2732195aga44
comp2732200..2732273gga1919
comp2732293..2732376cta1616
comp2732393..2732467gaa4
comp2732472..27325885s97
comp2732686..273559223s@494
comp2735687..2735763atc3
comp2735767..2735842gca74
comp2735917..273743516s
comp2742262..2742351tcc
comp2743220..2743312tcg
comp2743891..2743967agg
comp2748534..2748610cgt144144
comp2748755..2748845agc2323
comp2748869..2748959tca+6969
comp2749029..2749119tca2 tca
comp2758688..2758763gca44
comp2758768..2758844atgi3
comp2758848..27589645s73
comp2759038..276194223s233
comp2762176..276369416s
comp2150504..21506205s31
comp2150652..215356023s233
comp2153794..215530816s
comp2169525..21696415s32
comp2169674..217257923s233
comp2172813..217433116s
sur plasmidetgg

cbn cumuls

C5. cumuls. Clostridium botulinum BKT015925
opéronsFréquences intercalaires tRNAs
effectifgammessans rRNAsavec rRNAs
avec rRNAopérons10100
16 23 5s 0320349
16 gca atc24070
16 23 5s a46030
max a88011
a doubles110000
spéciaux112000
total aas2214000
sansopérons1816010
1 aa1218000
max a2220000
a doubles600
total aas644610
total aas86
remarques5
avec jaunemoyenne17
variance25
sans jaunemoyenne1414
variance1517

cbn blocs

C5. Clostridium botulinum BKT015925, cbn blocs
5s313132
23s233233233
16s
ttc5
5s336
aaa53ttc5
5s95735s955s97
23s23323323s23323s233
16saaaatgi16s46416s
gga15
16s233
23s45
aac14
5s7
aac
gaa4
5s97aac45
23s9423s96
atc3atc7
gca74gca121
16s16s

cbn remarques

*Remarques
@1	Les 3 opérons 16-23-5s ont les mêmes intercalaires, 233-31 bases.
	
@2	Les 4 opérons 16-23-5s -aa  ont tous à peu près les mêmes intercalaires 233-95-5.
	- Mais ils sont tous différents:
	+ 1 seul  opéron répond au critère des intercalaires, il a 1aa.
	+ 1 seul opéron ne répond pas strictement au critère des intercalaires.
	Ses 3aas sont du côté du 16s et l’intercalaire avec le 1er aa est très
	Élevé, 464.
	+ L'opéron à 2aas a l'intercalaire 23-5s très faible de 23% inférieur à 95, 22/95.
	+ L'opéron à 3aas répondant aux critères  a un 5s en plus.
	
@3	Le critère d’un intercalaire entre 2aas, supérieur à 210 bases, se trouve 
	dans le 4ème opéron à rRNA, mais il est accompagné d’un intercalaire très
	élevé entre 5s et le 1er aa, comme pour le 2ème opéron à rRNA.
	
@4	C’est un opéron à rRNA atypique : 2aas double entourant le 5s.
	- Mais coserve l’intercalaire 16-23s de 233 bases comme les 7 opérons de ce type.
	
@5	Les 2 opérons à 16-atc gca présentent, ici, la particularité d’inverser ses 2 aas, gca-atc.
	- Ils ont aussi, à peu près,  les mêmes intercalaires 16-gca-atc-23s, 74 4 94.
	- L'opéron à rRNA présentant le max d'aas, au nombre de 8, est de ce type.
	Il a le même intercalaire 23-5s que tous les autres opérons à rRNA, 97 bases.
	
*Séquences des doubles :  tous les opérons à plus de 3aas ont des doubles, 6/6.	
	- Les répétitions vont de 5 à 2.
	- 3 opérons sur 6 ont des séquences qui se répètent, avec 22aas et 2 avec 8aas.
	- L'opéron contenant le max d'aas, 22, a 2 séquences de 6 aas qui se répètent.
	- On peut repérer dans cet opéron d'autres séquences de 3 aas.
	- Ces séquences sont séparées par 1 ou 2 aas différents.

cbn distribution

  • Lien tableur: cbn distribution
  • Notes:
    - Tableau Cl51: gca, 1-3aas et -16s. aac, 1aa et 1-3aas.
    - Tableau Cl52: 4-8aas, gag caa aga gga cta gaa. >1aa, tgc2 et tca2 en gras.
Cl5 cbn, Clostridium botulinum BKT015925. clostridia.
Cl51 cbc. 1aa -16s 1-3aas. clostridia.
g1t1 
atgi1tcttatatgf
attactaatagt
ctt1cctcatcgc
gttgctgatggt
ttc2tcc1tactgc
atc1acc1aac2agc
ctcccccaccgt
gtcgccgacggc
ttatcataatga
ataacaaaa2aga
ctacca1caacga
gtagca2gaagga1
ttg1tcg1tagtgg2
atgjacg1aagagg1
ctgccgcag1cgg
gtggcggagggg
clos>1aa=1aa-5s+5s-16s+16stotal
cbn127*3*22
Cl52 cbn. >1aa -5s 4-8aas +16s.
g1t1 
atgitcttatatgf3
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc1tcctac2tgc2
atc2accaac2agc1
ctcccccac2cgt1
gtcgccgac3ggc3
tta3tca2taatga
ataaca3aaa2aga4
cta2cca2caa3cga1
gta4gca2gaa3gga5
ttgtcgtagtgg
atgj2acgaag3agg
ctgccgcagcgg
gtggcggag1ggg
clos>1aa=1aa-5s+5s-16s+16stotal
cbn522*6*464

Clostridium lentocellum DSM 5427

cle opérons

  • Lien tableur: cle opérons
  • Liens: gtRNAdb, NCBI , génome
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Lachnospiraceae;Cellulosilyticum.
  • Légende:
    - cyan pour les doubles signalés par le signe + dans la colonne doubles.
    - @ voir le chapitre remarques de ce génome.
  • Note: il n'y apas de gtRNAdb. Aussi j'ai comparé (EXACT NB.CAR STXT) les 1ers atgf atgi atgj du génome cdc, avec les atg de cle.
C6. Clostridium lentocellum DSM 5427
34.3%GC30.6.19 Paris104doublesintercalaaavec aa
10157..10246agc@1202
10449..1198116s72
12054..121715s4
12176..12248gca262
12511..1541423s55
15470..15543gac6161
15605..15677gta77
15685..15757aca3434
15792..15872tac1212
15885..15961atgj33
15965..16040ttc33
16044..16116aaa
30118
46235..4776716s@321284
69052..7196423s
4873
76838..7837116s72
78444..785615s5
78567..78639gca282
78922..8182923s
904
82734..828515s4
82856..82928ggc
1463
84392..8592916s72
86002..861195s4
86124..86196gca280
86477..8938623s
7380
96767..968845s89
96974..97047ggc
5082
102130..102204cag
104716..104799tta1313
104813..104898tca
141499..14303416s138
143173..1432905s7
143298..143374atc258
143633..14653823s
150968..1510855s@44
151090..151161gaa457
151619..15316016s605
153766..15667123s475
157147..157219aaa99
157229..157299gga66
157306..157379aga
4223
161603..1617205s4
161725..161797ggc
11104
172902..172973gaa2323
172997..173071cca4545
173117..173189aaa1111
173201..173274gac5656
173331..173403gta77
173411..173494tta187187
173682..173754aca2626
173781..173861tac1010
173872..173948atgj3131
173980..174052ttc
248498
422551..42408616s
113898
537985..54089023s
25153
566044..566117cac2323
566141..566212caa3232
566245..566330tca
571984..57351916s72
573592..5737095s4
573714..573786gca282
574069..57697523s
25302
602278..60381216s137
603950..6040675s
11014
615082..61798723s
21159
639147..63936216s°@5
98139
737502..7376195s4
737624..737696ggc
3291
740988..741058gga
759839..759920cta
911999..912083ctt+148148
912232..912316ctt2 ctt
1035192..1035265cga
1061152..1061225agg
comp1136376..1136448ccc
1229184..123071816s@272
1230791..12309085s7
1230916..1230989atc5353
1231043..1231115gca261
1231377..123428223s110
1234393..1234464aac+99
1234474..1234545gaa2 tgc66
1234552..1234622tgc2 aac2323
1234646..1234717aac5858
1234776..1234846tgc
1280211..1280283atgf
1283250..1283320gga+55
1283326..1283399aga2 gga55
1283405..1283478cac2 aga3131
1283510..1283581caa2 caa2323
1283605..1283677aaa3030
1283708..1283792cta2323
1283816..1283886gga55
1283892..1283965aga66
1283972..1284043caa
1299560..1299632ggc44
1299637..1299711cca
1346208..1346290ctg
1363346..1363428ctg
1515234..1515305gaa6262
1515368..1515442cca2222
1515465..1515537aaa
1597292..1597364acg
1611976..1612042acg
2065352..2065425ata
comp2090478..2090550acc
2394421..2394501tac33
2394505..2394577ttc
2592342..2592422ttg
2606024..2606104ttg
comp2737232..2737304gcc
comp2798802..2798874aag
comp2881571..2881642gag
comp3215471..3215545cca
comp3252582..3252655atgj77
comp3252663..3252735gta44
comp3252740..3252813gac1010
comp3252824..3252896tgg2020
comp3252917..3252988aac
683
comp3253672..3253748atgj77
comp3253756..3253828gta99
comp3253838..3253910tgg1818
comp3253929..3254000aac60
comp3254061..325696723s
362637
comp3619605..3619677aca+44
comp3619682..3619755cgt2 cgt5050
comp3619806..3619879cgt2 aca2727
comp3619907..3619990tta33
comp3619994..3620069gta4747
comp3620117..3620190gac2222
comp3620213..3620289atgi2323
comp3620313..3620385aca1414
comp3620400..3620471gaa99
comp3620481..3620552aac110
comp3620663..362356823s261
comp3623830..3623902gca5353
comp3623956..3624029atc7
comp3624037..36241545s72
comp3624227..362576116s149
comp3625911..3625999tcc3333
comp3626033..3626118tca
comp3714637..3714709gta11
comp3714711..3714787atgj

cle cumuls

C7.cumuls. Clostridium lentocellum DSM 5427
opéronsFréquences intercalaires
effectifsgammessans rRNAsavec rRNAs
avec rRNAopérons19110
16 5 aa 235201415
16 5 atc gca240106
solo116025
max a148011
a doubles210000
indéterminé112000
total aas4614000
sansopérons2916010
1 aa1918000
max a1020010
a doubles200
total aas593027
total aas105
remarques5
avec jaunemoyenne29
variance41
sans jaunemoyenne1922
variance1619

cle blocs

C6. Clostridium lentocellum DSM 5427, cle blocs
Solitaires
16s*216s°@5
23s*3
5s3*489
ggc
aac60
23s
16s137
5s
16s727272
5s544
gca282280282
23s
agc202
16s13816s72
5s75s4
atc258gca262
23s23s55
gac61
aac110
16s7223s261
5s7gca53
atc53atc7
gca2615s72
23s11016s149
aac9tcc33
5s4@4
gaa457
16s605
23s475
aaa9

cle remarques

Remarques :	Pas de blocs 16-23-5s ni de séquence 16-atc-gca-23.
	
@1	5 blocs 16-5-aa-23s avec les mêmes intercalaires, à peu près, 72 4 280.
	- 4 blocs avec gca dont 3 à 1aa et 1 avec 9aas. 
	- Le bloc à 9aas a un aa avant le 16s, compatible.
	- 1 bloc avec atc seul et les intercalaires modifiées, 138 7 258.
	
@2	2 blocs 16-5-atc-gca-23s, avec les mêmes intercalaires, 72 7 53 261.
	- Les 2 blocs contiennent des doubles, 2 paires chacun avec 7 et 14aas.
	- Le bloc contenant le max de 14aas a 2aas avant le 16s compatibles.
	
@3	Les solos ne contiennent qu’un seul rRNA avec ou sans aas.
	- 5s-1aa, il y en a 4 et l'intercalaire est équivalente de celle des blocs.
	- 23s, il y en a 4 dont 1 seul avec 4aas
	- 16s, 2 sans aas et 1 du 16s5s avec une intercalaire comme le bloc atc, 137.
	
@4	Apparemment un trio de solos. Les 3 intercalaires supérieures à 450 permettent
	de diviser le groupe en 3 opérons, 5saa avec une intercalaire semblable aux 
	autres 5saa, 23s avec 3aas aux petites intercalaires et 1 16s sasns aas.
	
@5	16s°: 16S ribosomal RNA rRNA prediction is too short
	
Séquences des doubles : très peu de doublons. 	
	- 2 opérons avec rRNAs ont des doublons sur 5 possédant au moins 2 aas.
	- 2 opérons sans rRNAs sur 10 possédant au moins 2 aas.
	- 4 doublons pour chaque type d'opérons.
	- 1 seule paire répétée chez les opérons sans rRNAs.

cle distribution

  • Lien tableur: cle distribution
  • Notes:
    - Tableau Cl61: ctt2 en gras, très rare
    - Tableau Cl62
    1-3aas: aaa aga gga
    -5s: Ces 5s sont seuls sans 16s ni 23s. Ce sont 4 5s ggc et 1 5s gaa
    Blocs à rRNA: ils ont la forme 16s5saa23s
    cgt2 double en gras
Cl6 cle, Clostridium lentocellum DSM 5427. clostridia.
Cl61 cle. Distribution des blocs sans rRNA.
g1t1 
atgitcttatatgf1
attactaatagt
ctt2cctcatcgc
gttgctgatggt
ttc2tcctac2tgc
atcacc1aac1agc
ctcccc1cac2cgt
gtcgcc1gac2ggc1
tta2tca2taatga
ata1aca1aaa3aga2
cta2cca4caa3cga1
gta3gcagaa2œ3
ttg2tcgtagtgg1
atgj3acg2aag1agg1
ctg2ccgcag1cgg
gtggcggag1ggg
clos>1aa=1aa-5s+5s-16s+16stotal
cle401959
Cl62 cle. Distribution des blocs avec rRNA.
g1t1 
atgi1tcttatatgf
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc1tcc1tac1tgc2
atc3accaac4agc1
ctcccccaccgt2
gtcgccgac2ggc4
tta1tca1taatga
ataaca3aaa2aga1
ctaccacaacga
gta3gca6gaa3gga1
ttgtcgtagtgg1
atgj2acgaagagg
ctgccgcagcgg
gtggcggagggg
clos>1aa=1aa-5s+5s-16s+16stotal
cle34*3964

Heliobacterium modesticaldum Ice1 ATCC 51547

hmo opérons

  • Lien tableur: hmo opérons
  • Liens: gtRNAdb , NCBI , génome
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Heliobacteriaceae;Heliobacterium.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
    - cds: cds inséré dans un cluster avec ou sans rRNA.
C7. Heliobacterium modesticaldum Ice1 ATCC 51547
57%GC24.7.19 Paris109doublesintercalcdsaaavec aacdsacdsd
103699..104088CDS380130
104469..105695CDS186186409186
comp105882..105956ggc11
comp105958..106044ctg321321
comp106366..106929CDS@1241241188241
comp107171..107246aca202202202
comp107449..108183CDS111772245
comp219956..220483CDS260260176260
comp220744..220820gac55
comp220826..220901gta1010
comp220912..220987gaa44
comp220992..221067aaa1818
comp221086..221160caa103
comp221264..22418223s237
comp224420..224495gcc64
comp224560..2246765s@2328
comp225005..22653616s651651
comp227188..228162CDS98792325
comp326955..328340CDS178178462178
comp328519..328601cta6565
comp328667..328743aga6060
comp328804..328880cca568568
comp329449..330090CDS57730214
comp387821..388105CDS13513595
388241..388317ccc77
388325..388410tac474747
comp388458..388742CDS58849395
comp977236..978504CDS439439423
comp978944..98186023s237
comp982098..982173gcc64
comp982238..9823545s328
comp982683..98420816s460
comp984669..984744tgg@355
comp984750..984824cgg207207207
comp985032..987656CDS26258875
comp1013915..1014760CDS105105282105
comp1014866..1014942gac7575
comp1015018..1015093gaa265265
comp1015359..1016642CDS40115428
1056758..1058014CDS121121419121
comp1058136..1058233tga173173
1058407..1058733CDS62951109
1121685..1122878CDS588588398
1123467..112499816s328
1125327..11254435s64
1125508..1125583gcc233
1125817..112873423s337337337
>1129072..1129785CDS24938238
1154724..1155224CDS9999167
1155324..1155413tca565656
comp1155470..1156627CDS13350386
1169978..1171828CDS129129617129
1171958..1172034cgt8585
1172120..1172196agg181181
1172378..1172812CDS626214562
1172875..1172966tcg548548
1173515..1174330CDS6655272
comp1180986..1182974CDS444444663
1183419..1183512tcc393939
1183552..1183817ncRNA1190889
1195726..1195998CDS18118191
1196180..1196255gcg151151151
1196407..1197051CDS86894215
comp1283946..1285331CDS177177462177
1285509..1285584atgf55
1285590..1285667atgj77
1285675..1285750gaa542542
1286293..1287630CDS63447446
1351078..1352549CDS704704491
1353254..135478616s252
1355039..13551555s64
1355220..1355296atc194
1355491..135840823s112
1358521..1358595aac109109109
comp1358705..1358926CDS13955574
1498482..1498898CDS535535139
comp1499434..1499509acg238238238
1499748..1500836CDS262182363
1763019..1763858CDS686828068
1763927..1764003gac44
1764008..1764083ttc33
1764087..1764161ggc9292
comp1764254..1764493CDS72728072
1764566..1764641tgc1818
1764660..1764746tta253253
comp1765000..1765467CDS52131156
1817599..1818318CDS487487240
1818806..182033716s252
1820590..18207065s64
1820771..1820847atc66
1820854..1820929gca229
1821159..182407623s112
1824189..1824263aac66
1824270..1824345atgf243243243
1824589..1825014CDS168198142
1993213..1994328CDS9999372
1994428..1994502atgi414141
1994544..1995368CDS284281275
2279650..2279997CDS541541116
2280539..228207016s253
2282324..22824405s64
2282505..2282580gcc234
2282815..228573523s119
2285855..2285948tcc66
2285955..2286031ccg1010
2286042..2286115gga1414
2286130..2286205cac11
2286207..2286281tgc99
2286291..2286367gtc33
2286371..2286446ttc66
2286453..2286537tac44
2286542..2286616caa1717
2286634..2286709aaa44
2286714..2286789gaa55
2286795..2286870gta55
2286876..2286952gac77
2286960..2287050agc4343
2287094..2287170ccc3030
2287201..2287287ctg33
2287291..2287365ggc44
2287370..2287446cgt44
2287451..2287526acc352352352
2287879..2288343CDS33184155
comp2321528..2322544CDS268268339
comp2322813..2322889gtc99
comp2322899..2322973cgg818181
comp2323055..2323243CDS337563
2326619..2327947CDS464464443464
2328412..232994316s327
2330271..23303875s226
2330614..233353223s98
2333631..2333706aaa44
2333711..2333786acc88
2333795..2333877ctc898989
comp2333967..2334704CDS7389246
2342094..2342804CDS155155237155
comp2342960..2343030ttc213213
2343244..2343936CDS563563231
2344500..234602516s252
2346278..23463945s64
2346459..2346535atc141
2346677..234959423s100
2349695..2349769aac66
2349776..2349851atgf102102102
2349954..2350976CDS113601341
2464578..2465114CDS271271179271
comp2465386..2465461aca432432
2465894..2466226CDS4722111
2470949..2471977CDS696934369
2472047..2472133ctg678678
2472812..2473192CDS22232127
2495425..2496048CDS402402208
comp2496451..2496527gtc44
comp2496532..2496609atgj175175175
2496785..2497120CDS217217112
comp2497338..2497420ctc77
comp2497428..2497503acc1818
comp2497522..2497596tgg1414
comp2497611..2497684ggg1919
comp2497704..2497778ggc77
comp2497786..2497873ttg88
comp2497882..2497958gtg-10-10-10
comp2497949..2498185CDS66667966
2498252..2498328ccg314314
comp2498643..2499506CDS55292288
2554799..2554984CDS10910962109
2555094..2555169gaa22
2555172..2555247ttc66
2555254..2555338tac44
2555343..2555417caa1818
2555436..2555511aaa44
2555516..2555590ggc99
2555600..2555675cac117117
comp2555793..2557049CDS235940419
comp2792990..2793442CDS219219151219
comp2793662..279658323s236
comp2796820..2796895gca66
comp2796902..2796978atc64
comp2797043..27971595s328
comp2797488..279901916s505
comp2799525..2799599ggc+11
comp2799601..2799687ctg2 ggc3232
comp2799720..2799796ccc4242
comp2799839..2799915cgt44
comp2799920..2799994ggc120120
comp2800115..2800192atgj4242
comp2800235..2800325agc1616
comp2800342..2800417atgf66
comp2800424..2800498aac77
comp2800506..2800581gaa44
comp2800586..2800661aaa1818
comp2800680..2800754caa44
comp2800759..2800843tac9191
comp2800935..2801011gtc77
comp2801019..2801093tgc325325
2801419..2801724CDS230813102
3032538..3032729CDS10910964109
comp3032839..303575723s233
comp3035991..3036066gcc64
comp3036131..30362475s253
comp3036501..303802616s779779
comp3038806..3040017CDS232404
comp3040250..3042013CDS588

hmo cumuls

  • Lien tableur: hmo cumuls
  • Légende:
    - avec et sans rRNA, fréquences des intercalaires dans les clusters avec rRNA ou sans rRNA.
    - cdsd, je ne choisis que le cds avec l'intercalaire le plus faible d'un cluster donné, en supposant que ce cds a été créé par le cluster lors des conversions.
    - cdsa, longueur du cds en aas ici.
    - 1: occurences exclues de la moyenne. Sont exclus de la moyenne les jaunes 554 de hmo opérons.
C7. cumuls. Heliobacterium modesticaldum Ice1 ATCC 51547
opéronsFréquences intercalaires tRNAsFréquences intercalaires cdsFréquences aas cds
effectifgammessans rRNAsavec rRNAsgammescdsgammescdsdgammescdsa
avec rRNAopérons101121140110010
16 5s gcc 23520203450380820016
16 5s atc 232400210011120730014
16 5 23s a16013150916044008
max a2080202009200450011
a doubles110011250824046000
16 5s atc gca212001300528047002
total aas6014000350432008000
sansopérons2416000400136029001
1 aa12180004504400010000
max a7200005002440011000
a doubles0001110
total aas492138563259
total aas109
remarques3
avec jaunemoyenne
variance
sans jaunemoyenne88196137230
variance6712071128

hmo blocs

  • Lien tableur: hmo blocs
  • Légende:
    - tgg: L'intercalaire, en jaune aussi, est entre tgg et 16s.
  • Notes:
    - Les spécificités gcc atc atc-gca et tRNA avant 16s
    - Homogénéité des intercalaires intra bloc
C7. Heliobacterium modesticaldum Ice1 ATCC 51547, hmo blocs.
tgg
CDS541651588779460
16s253328328253328
5s6464646464
gcc234237233233237
23s119103337109439
tcctcccaacdscdscds
CDS704563CDS464
16s25225216s327
5s64645s226
atc19414123s98
23s112100aaa
aacaacaac
ggc
CDS487505
16s252328
5s6464
atc66
gca229236
23s112219
aacaaccds

hmo remarques

  • Remarques des 3 @ dans opérons :
    1. @ Les cds en vert.
      - Ces cds sont insérés dans un cluster avec ou sans rRNA. Ce sont des candidats pour la création. Plus les 2 intercalaires avec les voisins sont petits plus ils sont intéressants. Il y en a 6 dont un seul, *, est accolé à un 16s. Un intercalaire est même négatif, c’est-à-dire que le cds démarre dans le tRNA, adresse 2497949. Dansl’ordre des adresses croissantes les intercalaires sont les suivants : 321-241 181-62 92-72 213-563* 175-217 -10-66.
      - Voir hmo cumuls : 9 intercalaires entre tRNAs dans un cluster ont plus de 40 pbs et 1 fait 120 pbs (adresse 2799920).
      - Dans hmo_opérons j'ai ajouté l'intercalaire entre 2 clusters, qui contient plusieurs autres gènes, pour faire ressortir la proximité des cds intra cluster avec les rRNAs et les tRNAs.
    2. @ Voir hmo blocs.
      - Il y a 10 blocs avec rRNA et tous sont complets. Cependant le 5s est anormalement positionné entre 16s et 23s au lieu d’être en 3ème position. Ce type de génome est rare, voir les statistiques des blocs à rRNAs.
      - Il n'y a qu'un seul bloc sans aas, adresse 2328412, mais ce génome a 5 blocs sur 10 qui est rare dans cette position, gcc, au lieu de gca, plus courant. Les 4 autres blocs arborent des aas courants dans cette position, 2 atc-gca et 2 atc.
    3. @ tRNAs avant 16s
      - Des tRNAs se trouvent avant le 16s, adresses 982683 et 2797488, le 1er avec 2 et le 2ème avec 15 tRNAs.
      - Les 2 intercalaires aa-16s sont du même de grandeur général qu'un cds-16s, 460 et 505 pbs ici.
  • Séquences des doubles: Voir hmo cumuls :beaucoup de séquences longues et à peine un double dans la séquence 15aas-16s5s-gcc-23s.
  • Notes:
    - Les 5 cds, candidats à la création, sont insérés dans des clusters sans rRNAs et 1 seul est collé à 16s.
    - Le 5s est positionné anormalement en 16s5s23s, dans les 10 blocs que possède le génome.
    - Un tRNA intra bloc très rare, gcc au lieu de gca, dans 5 cas sur 10. 4 autres sont courants, 2 atc et 2 atc-gca.

hmo distribution

  • Lien tableur: hmo distribution
  • Notes: Tableau Cl72,
    - les 1-3aas sont au nombre de 10 et sont soulignés, aac est composé de 1 >3aas et 3 1-3aas alors que aaa est composé respectivement de 3 et 1, et atgf de 2 et 1 respectivement.
    - Les blocs à rRNA sont de la forme 16s5saa23s
Cl7 hmo, Heliobacterium modesticaldum Ice1 ATCC 51547. clostridia.
Cl71 hmo. Distribution des blocs sans rRNA.
g1t1 
atgi1tcttatatgf1
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc3tcc1tac2tgc1
atcacc1aacagc
ctc1ccc1cac1cgt1
gtc2gccgac2ggc4
tta1tca1taatga1
ataaca2aaa1aga1
cta1cca1caa1cga
gtagcagaa3gga
ttg1tcg1tagtgg1
atgj2acg1aagagg1
ctg2ccg1cagcgg1
gtg1gcg1gagggg1
clos>1aa=1aa-5s+5s-16s+16stotal
hmo371249
Cl72 hmo. Distribution des blocs avec rRNA.
g1t1 
atgitcttatatgf3
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc1tcc1tac2tgc2
atc4acc2aac4agc2
ctc1ccc2cac1cgt2
gtc2gcc5gac2ggc3
ttatcataatga
ataacaaaa4aga
ctaccacaa3cga
gta2gca2gaa3gga1
ttgtcgtagtgg1
atgj1acgaagagg
ctg2ccg1cagcgg1
gtggcggagggg
clos>1aa=1aa-5s+5s-16s+16stotal
hmo491160

Clostridium beijerinckii strain NCIMB 14988

cbei opérons

  • Lien tableur: cbei opérons
  • Liens: gtRNAdb [], NCBI , génome []
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae;Clostridium.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
    - cyan pour les doubles signalés par le signe + dans la colonne doubles.
    - @ voir le chapitre remarques de ce génome.
  • Notes:
    - Les atg ont été résolus en comparant avec ceux de cdc avec stxt. A faire pour psor aussi.
C8. Clostridium beijerinckii strain NCIMB 14988
29.65%GC29.7.19 Paris93doublesintercalcdsaaavec aacdsacdsd
6477551..6480031CDS496496827
6480528..648204416s213
6482258..648517123s108
6485280..64853945s14
15..91atgi11
93..168gca858585
254..769CDS1940172
2710..2937CDS11911976119
3057..3147tca+3030
3178..3268agc2 tca241241
3510..3600tca2 agc1818
3619..3709agc125125
3835..4350CDS9470172
13821..14726CDS187187302
14914..14988cgt343434
comp15023..15913CDS109014297
124928..125338CDS275275137275
125614..125702tta+2020
125723..125798atgf4 tta77
125806..125882atgj4 atgf66
125889..125977tta2 atgj2222
126000..126075atgf77
126083..126159atgj66
126166..126254tta2121
126276..126351atgf7070
126422..126510tta2121
126532..126607atgf664664
127272..129683CDS8954804
138638..140143CDS307307502
140451..140525aac+234234
140760..140834aac3 aac439439
141274..141348aac@6299299299
141648..143039CDS1587464
comp144627..145649CDS543543341
146193..14770916s140
147850..147925gca33
147929..148005atc111
148117..15103023s70
151101..1512175s55
151223..151298ttc4
151303..151377tgc167167167
151545..151841CDS2560899
177450..178097CDS7676216
178174..178249acc656565
178315..179508CDS134221398
313730..316207CDS909082690
316298..316382cta44
316387..316461ggg120120
comp316582..316986CDS85487135
402474..402953CDS125125160125
403079..403154cca+1717
403172..403245gga2*149149
403395..403471agacca gga aga66
403478..403553cca1616
403570..403643gga3535
403679..403755aga55
403761..403836cac33
403840..403914caa2*77
403922..403997aaacaa aaa cta1818
404016..404100ctaggc gga55
404106..404180ggc2525
404206..404279gga55
404285..404360aag5757
404418..404492caa77
404500..404575aaa1818
404594..404678cta55
404684..404758ggc2525
404784..404857gga4646
404904..404980cga325325
<405306..405467CDS839354
413861..415921CDS385385687
416307..41782316s@5132
417956..418032atc84
418117..42103123s71
421103..421177aac345345345
421523..422449CDS63814309
486264..486668CDS159159135159
486828..486912tac+99
486922..486997gta3 tac2727
487025..487099aca2 gta1212
487112..487196tac2 aca99
487206..487281gta3030
487312..487386aca1212
487399..487483tac451451
487935..489110CDS50956392
540067..540969CDS187187301187
541157..541231tgg208208
541440..541820CDS97127
comp541918..542985CDS252252356252
543238..543312tgg354354
543667..544683CDS347735339
892419..893339CDS560560307
893900..89541616s137
895554..895629gca118
895748..89866123s204
898866..8989825s552552552
899535..900446CDS351304
900798..902048CDS704704417
902753..90426916s339
904609..90752223s273
907796..9079125s696969
comp907982..908449CDS43545156
951995..952630CDS979721297
952728..952813ctc396396
953210..954919CDS784414570
1739334..1739933CDS380380200380
1740314..1740389cac33
1740393..1740467cag55
1740473..1740548aaa443443
comp1740992..1742350CDS151829453
1894180..1895406CDS343440934
comp1895441..1895527ttg574574
1896102..1896794CDS200701231
2097496..2097915CDS722722140
2098638..210015416s502
2100657..210356923s205
2103775..21038915s315315315
2104207..2104905CDS234313233
2339219..2340322CDS662662368
2340985..234250116s338
2342840..234575523s140
2345896..2345970aac3
2345974..23460905s429429429
2346520..2348088CDS3574523
2351663..2352139CDS568568159
2352708..235422416s338
2354563..235747723s140
2357618..2357692aac3
2357696..23578125s909090
2357903..2358316CDS406783138
2765100..2765525CDS625625142
2766151..276766716s503
2768171..277108223s202
2771285..27714015s5
2771407..2771482ttc66
2771489..2771565gac2525
2771591..2771665gaa448448448
2772114..2774864CDS781818917
3556683..3557051CDS565565123565
3557617..3557691gag925925
comp3558617..3559759CDS192275381
comp3752035..3752652CDS245245206245
comp3752898..3752985agt@1711711
comp3753697..3755112CDS501326472
comp4256439..4258403CDS267267655267
comp4258671..4258746aaa7979
comp4258826..4258901cac77
comp4258909..4258985aga3535
comp4259021..4259094gga752752
4259847..4260392CDS619853182
comp4880246..4880488CDS50850881508
comp4880997..48811135s274
comp4881388..488430023s578
comp4884879..488639516s703703
comp4887099..4888034CDS1272704312
comp6160739..6161977CDS343343413
6162321..6162396cca242242242
6162639..6163283CDS2040215
6165324..6165734CDS222222137
comp6165957..6166032ttc5
comp6166038..61661545s@2188188188
6166343..6167074CDS8085244
comp6175160..6175597CDS249249146249
comp6175847..6175922gca11
comp6175924..6176000atgi44
comp6176045..61761615s138
comp6176300..617921623s339
comp6179556..618107216s567567
comp6181640..6182446CDS223269
6182670..6183419CDS190190250190
comp6183610..6183685aaa+5
comp6183691..61838075s2 aaa159159159
comp6183967..6184914CDS@3294294316294
comp6185209..6185284aaa7
comp6185292..61854085s138
comp6185547..618846323s339
comp6188803..619031916s771771
comp6191091..6192203CDS7306371
comp6199510..6202059CDS661661850
comp6202721..62028375s@4139
comp6202977..620589323s339
comp6206233..620774916s1102
comp6208852..62089685s138
comp6209107..621202323s339
comp6212363..621387916s502502502
comp6214382..6215329CDS90019316
comp6305349..6306314CDS123123322123
comp6306438..6306527tcc281281
comp6306809..6307984CDS66527392
6374512..6375684CDS125125391125
comp6375810..6375884agg303303
comp6376188..6378578CDS13398797
comp6391977..6392753CDS114114259114
comp6392868..63929845s134
comp6393119..639603323s214
comp6396248..639776416s1120
comp6398885..63990015s139
comp6399141..640205523s214
comp6402270..640378616s748748
comp6404535..6405107CDS31702191
6436810..6437790CDS192192327
comp6437983..6438059gac+66
comp6438066..6438141gta3*1414
comp6438156..6438230gaagac gta2929
comp6438260..6438334acagaa aca – 11010
comp6438345..6438421gac66
comp6438428..6438503gta1616
comp6438520..6438594gaa2929
comp6438624..6438698aca1010
comp6438709..6438785gac66
comp6438792..6438867gta1414
comp6438882..6438956gaa162162162
comp6439119..6439685CDS37865189

cbei cumuls

  • Lien tableur: cbei cumuls
  • Légende:
    - avec et sans rRNA, fréquences des intercalaires dans les clusters avec rRNA ou sans rRNA.
    - cdsd, je ne choisis que le cds avec l'intercalaire le plus faible d'un cluster donné, en supposant que ce cds a été créé par le cluster lors des conversions.
    - cdsa, longueur du cds en aas ici.
    - 1: occurences exclues de la moyenne. Sont exclus de la moyenne les jaunes 554 de cbei opérons.
  • Notes:
C8. cumuls. Clostridium beijerinckii strain NCIMB 14988
opéronsFréquences intercalaires tRNAsFréquences intercalaires cdsFréquences aas cds
effectifgammessans rRNAsavec rRNAsgammescdsgammescdsdgammescdsa
avec rRNAopérons1710210101004
16 23 5s 072034350250220019
16 atc gca1401211007100630011
16 23 5s a460201507150540020
max a48020200920075006
a doubles110000250525036003
autres612000300630057002
total aas1914000350635028001
sansopérons2016010400440019004
1 aa11180004503450210001
max a19200005002500011000
a doubles5302140
total aas74546723771
total aas93
remarques6
avec jaunemoyenne
variance
sans jaunemoyenne187350195328
variance179225111206

cbei blocs

C8. Clostridium beijerinckii strain NCIMB 14988, cbei blocs.
16s213503339
23s108202138
5s14544
atgiatgittcatgi
16s339502578
23s273205274
5s
aaa5
5s1595s139134
cds29423s339214
aaa716s11021120
5s1385s138139
23s33923s339214
16s16s
16s33833816s140
23s140140gca3
aac33atc111
5saacaac23s70
5s5
ttc
16s13716s132
gca118atc84
23s20423s71
5saac
ttc5
5s

cbei remarques

  • Remarques des 6 @ de cbei opérons
    1. @ Un tRNA très rare même chez les eucaryotes, agt.
    2. @ Un 5s isolé avec un tRNA.
    3. @ Les cds candidats à la création
      - Un cds inséré dans un cluster, candidat pour la création. Ses 2 intercalaires sont faibles, 159 et 294, se trouvent dans les 36 1ers sur un total de 72 ( voir cbei cumuls ). C’est une protéine moyenne de 316 aas.
      - Les groupes de 2 clusters réunis par 2 cds. Ces cds sont colorés en vert comme candidats à la création:
      • le groupe contenant @3, adresse 6181640, intercalaires des cds 567 223 190, taille en aas 269 250 ;
      • le groupe d’ adresse 541440 contient 2 tgg, intercalaires des cds 208 97 252, taille en aas 127 356 ;
      • le groupe d’ adresse 899535, intercalaires des cds 552 351 704, taille en aas 304 417 ;
    4. @ Un cluster à 2 blocs complets en rRNAs, séparés par un intercalaire de 1102 pbs pouvant contenir un protéine moyenne comme @3. Adresse 6202721. Et le même cluster se retrouve à l’adresse 6392868 avec le même intercalaire 1120. Les 2 clusters se différencient, en intra, uniquement par l’intercalaire 23s-5s qui est le même pour les 2 blocs du premier, 339, et pour le deuxième, 214. Ce qui prouve que ce n’est pas une simple copie.
    5. @ Les blocs 16s-atc-23s5s sont relativement nombreux quand les 16s-atcgca-23s5s existent. Voir la fiche des clostridia. Ici le 5s est remplacé par un tRNA aac ce qui renforce l’hypothèse de 5s comme modèle.
    6. @ Un rare triplet pour un firmicutes et en plus les 2 intercalaires sont de la même longueur que les 2 intercalaires avec les 2 cds du cluster, 307 234 439 299, alors que la moyenne des intercalaires entre aas, sans rRNA, et sans jaunes n’est que de 18 (écart 17), celle des cds 350 (écart 225), voir cbei cumuls.
  • Séquence des doubles
    - Les doubles ne se trouvent que dans les clusters sans rRNAs puisqu’ils totalisent 74 tRNAs sur 93 et les tRNAs des clusters avec rRNA se trouvent à l’intérieur.
    - A part le triplet de @6 les clusters avec des doubles, signalés par le signe +, totalisent 5 sur 8 contenant plus d’un tRNA. Ce ne sont uniquement que des duplications de séquences colorées en cyan ou séparées par une bordure épaisse.
    - Les longueurs des séquences dupliquées sont: 2*2 4*3 1*4 1*5
  • Notes
    - Les blocs à rRNAs, voir cbei blocs. Ils sont caractérisés par très peu de tRNAs internes ou externes et par 5 groupes de 2 clusters chacun (@3), totalisant 10 blocs sur 16 . La distribution est la suivante :
    • 11 clusters complets sans tRNAs internes
    • 2 clusters peu courants avec un tRNA entre 23s et 5s,
    • 3 clusters avec tRNAs internes gcaatc gca atc voir la fiche des firmicutes.
    - 7 cds insérés dans les groupes à 2 clusters, candidats à la création .
    - Le 5s perçu comme un modèle dans @5, 16s-atc-23s-aac
    - Beaucoup de duplications dans les clusters sans rRNAs, caractéristique des firmicutes renforcée par la présence
    • d’un cluster avec un triplet aux intercalaires de type cds plutôt que tRNAs.
    • et des longueurs de séquences dupliquées variables: 2*2 4*3 1*4 1*5.
    • Ces longs clusters sans rRNAs seraient alors issus des clusters longs à rRNAs , qui , quand ils existent dans les autres génomes étudiés des firmicutes, présentent des duplications analogues.

cbei distribution

  • Lien tableur: cbei distribution
  • Notes:
    - Tous les +5s sont des 1-3aas
    - aaa es composé de 2 +5s et 4 >1aa
    - gca de 2 +16s, 2 +5s
    - aac de 3 -5s et de 3 >1aa
Cl8 cbei, Clostridium beijerinckii strain NCIMB 14988. clostridia.
g1t1 
atgi2tcttatatgf4
attactaatagt1
cttcctcatcgc
gttgctgatggt
ttc3tcc1tac3tgc1
atc2acc1aac6agc2
ctc1ccccac3cgt1
gtcgccgac4ggc2
tta4tca2taatga
ataaca4aaa6aga3
cta3cca3caa2cga1
gta5gca4gaa4gga5
ttg1tcgtagtgg2
atgj2acgaag1agg1
ctgccgcag1cgg
gtggcggag1ggg1
clos>1aa=1aa-5s+5s-16s+16stotal
cbei6311312*493

Negativicutes

Acidaminococcus fermentans DSM 20731

afn opérons

  • Lien tableur: afn opérons
  • Liens: gtRNAdb , NCBI , génome []
  • Phylogénie: Bacteria; Firmicutes; Negativicutes; Acidaminococcales; Acidaminococcaceae; Acidaminococcus.
N1. Acidaminococcus fermentans DSM 20731
56%GC30.6.19 Paris 60doublesintercalaire
24678..2624216s@1359
26602..2950723s228
29736..298525s
36819..36894acg
57713..5927716s359
59637..6254323s228
62772..628885s
169459..169534gcc
249791..249867agg
comp274627..274703cgt
311123..311198aca22
311221..311305tac5
311311..311386atg3
311390..311465acc6
311472..311548atgf
380482..38204616s251
382298..38520423s229
385434..3855505s
461553..461627aac3
461631..461705gaa8
461714..461789gta50
461840..461916cca11
461928..462001gga8
462010..462086aga
526984..527070ctg+30
527101..527186ctc2 ctg52
527239..527325ctg
578049..578123ggc
636984..63854816s@294
638643..638719atc66
638786..638861gca273
639135..64204023s139
642180..6422965s
712229..712304cac18
712323..712398caa3
712402..712477aaa16
712494..712577cta
comp724421..724497gtc
774880..774956gac4
774961..775036ttc8
775045..775119ggc9
775129..775202tgc13
775216..775304tta
796654..796728cgg
842393..842469gac2
842472..842547ttc8
842556..842630ggc9
842640..842713tgc
889670..889746ccc
906136..906210aac
1022783..1022859gac2
1022862..1022936ggc1
1022938..1023011tgg
1555201..1555277ccg
comp1567911..1567999tca
comp1613773..1613863agc
1702659..1702744ttg
comp1711770..17118865s228
comp1712115..171502123s359
comp1715381..171694516s
comp1823852..1823927gta6
comp1823934..1824008gaa8
comp1824017..1824092aag
1909446..1909536tcc
comp1911342..1911429tcg
comp1974984..1975058atgi
comp1984782..1984856gag12
comp1984869..1984942cag+111
comp1985054..1985127cag2 cag
comp2072279..20723955s228
comp2072624..207552923s298
comp2075828..2075903gca66
comp2075970..2076046atc94
comp2076141..207770516s
2148343..2148418gcg
comp2287117..2287192aaa
comp2303018..2303094gtg
comp2323563..2323636ggg

afn cumuls

cumuls. afn
opéronsFréquences
effectifsgammessans rRNAsavec rRNAs
avec rRNAopérons611-
16 23 5s 042021
16 atc gca2402
16 23 5s a0602
max a2800
a doubles01000
spéciaux01201
total aas41400
sansopérons291600
1 aa201800
max a62000
a doubles20
total aas56270
total aas60
remarques2
avec jaunemoyenne16
variance23
sans jaunemoyenne12
variance13

afn blocs

N1. afn blocs
16s359156535915652511565
23s228290622829072292907
5s117117117
16s9415655s228117
atc6623s2982906
gca273gca66
23s1392906atc94
5s11716s1565
5s228117
23s3592907
16s1565

afn remarques

  • Lien tableur: afn remarques
  • Remarques : 4 blocs 16-23-5s sans aas et très peu de doubles. Très simple.
    1. @ 4 blocs 16-23-5s sans aas .
      - 3 opérons ont leurs intercalaires identiques, 359 228.
      - 1 opéron a son intercalaire 16s-23s diminué de 30%, 108/359, l’autre intercalaire est commune aux 4 opérons.
    2. @ 2 blocs 16-atc gca 23s-5s, classiques mais sans aas en plus.
      - 3 intercallaires sont identiques et celui entre 23s-5s varie du simple au double, 94 66 298 228 et 94 66 273 139.
  • Séquences des doubles : Très peu de doubles, 2 opérons à 2aas et plus sur 11 ont des doubles.
    - 2 doublets au total: opéron ctc + 2ctg et opéron gag + 2cag.

negativicutes distribution

  • Lien tableur: negativicutes distribution
    Légende: prélèvement de la base gtRNAdb le 22.1.21
    • - totaux en en-tête, 60 total de gtRNAdb contenant des pseudo et inconnus; 60 total du cumul.
    • - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    • - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    • - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
    • - Voir la légende des tris et couleurs, g1 t1.
N1. afn, Acidaminococcus fermentans DSM 20731
g1t16060
atgi1tcttatatgf1
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc2tcc1tac1tgc2
atc2acc1aac2agc1
ctc1ccc1cac1cgt1
gtc1gcc1gac3ggc4
tta1tca1taatga
ataaca1aaa2aga1
cta1cca1caa1cga
gta2gca2gaa2gga1
ttg1tcg1tagtgg1
atg1acg1aag1agg1
ctg2ccg1cag2cgg1
gtg1gcg1gag1ggg1

afn distribution

  • Lien tableur: afn distribution
  • Notes:
    - cag2 est un double, en gras
    - ggc est composé de 1 1aa et 3 >1aa, les autres soulignés contiennent 1 et 1 respectivement.
Cl9 afn, Acidaminococcus fermentans DSM 20731. Negativicutes.
Cl91 distribution du total
g1t1 
atgi1tcttatatgf1
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc1tcc2tac1tgc2
atc2acc1aac2agc1
ctc1ccc1cac1cgt1
gtc1gcc1gac3ggc4
tta1tca1taatga
ataaca1aaa2aga1
cta1cca1caa1cga
gta2gca2gaa2gga1
ttg1tcg1tagtgg1
atgj1acg1aag1agg1
ctg2ccg1cag2cgg1
gtg1gcg1gag1ggg1
clos>1aa1aa-5s+5s-16s+16stotal
afn3620460
Cl92 afn, distribution des solitaires
g1t1 
atgi1tcttatatgf
attactaatagt
cttcctcatcgt
gttgctgatggt
ttctcc1tactgc
atcaccaac1agc1
ctcccc1caccgc1
gtc1gcc1gacggc1
ttatca1taatga
ataacaaaa1aga
ctaccacaacga
gtagcagaagga
ttg1tcg1tagtgg
atgjacg1aagagg1
ctgccg1cagcgg1
gtg1gcg1gagggg1
afn>1aa1aa-5s+5s-16s+16stotal
type2020
Cl93 afn, distribution des >1aa et duplicata
g1t1 
atgitcttatatgf1
attactaatagt
cttcctcatcgt
gttgctgatggt
ttc1tcc1tac1tgc2
atcacc1aac1agc
ctc1ccccac1cgc
gtcgccgac3ggc3
tta1tcataatga
ataaca1aaa1aga1
cta1cca1caa1cga
gta2gcagaa2gga1
ttgtcgtagtgg1
atgj1acgaag1agg
ctg2ccgcag2cgg
gtggcggag1ggg
ade>1aadupli-5s+5s-16s+16stotal
type34236

afn par rapport au groupe de référence

Comparaison avec la référence
tRNAsblocs tRNAsblocs rRNAs
afn1aa>1aadup+5s1-3aasautrestotal
21faible113216
16moyen512421
14fort41923
20342460
10g+cga62210
2agg+cgg22
4carre ccc314
5autres
113216
total tRNAs ‰
afn1aa>1aadup+5s1-3aasautresafn ‰ref.‰
21faible183503326726
16moyen83200067350324
14fort673170383650
333567336760729
10g+cgg100333316710
2agg+cga3333
4carre ccc50176716
5autres
1835033267
blocs tRNAs ‰ total colonne %
afn1aa>1aaduptotalref.‰1aa>1aadup
21faible196543628626559
16moyen892143043242535
14fort713394116502056
35760736567292034
10g+cgg10736361791055
2agg+cga363618
4carre ccc5418711627
5autres
196543628611

clostridia synthèse

clostridia distribution par génome

clostridia distribution par génome
baci>1aa1aa-5s+5s-16s+16sduplica1-3aastotal
psor12547274104
cdc44270383
cdc84528944108
cbc*3410002654
cbn481226344790
cle3819263928107
hmo3712391110109
cbei63113041293
total2407813302642851748

clostridia distribution du total

  • Lien tableur: clostridia distribution du total
  • Légende:
    - Couleurs du 1er tableau: voir la distribution des bacilli
    - Couleurs du 2ème tableau: d'après les couleurs du pieds du tableau
    - Couleurs du 3ème tableau: comme le tableau 2. Cependant les duplicata ne sont pas comptés dans le total de 55 mais dans le total des >1aa du 1er tableau.
    - Tableau des indices, en-tête: total des génomes, total des tRNAs, indice ttt, indice tgt.
Clostridia. Distribution du total.
clostridia. Distribution du total: >1aa 1aa +5s >3.
g1t1 
atgi10tcttatatgf32
attactaatagt
ctt3cctcatcgt
gttgctgatggt
ttc19tcc7tac23tgc16
atc3acc9aac22agc13
ctc3ccc4cac16cgc11
gtc4gcc1gac32ggc20
tta22tca19taatga3
ata1aca30aaa31aga24
cta19cca25caa22cga4
gta41gcagaa36gga29
ttg9tcg2tagtgg11
atgj23acg4aag6agg6
ctg6ccg2cag4cgg1
gtg1gcg1gag4ggg3
clos8>1aa1aa-5s+5s-16s+16stotal
type24878302628
clostridia. Distribution du total. -16s +5s <4
g1t1 
atgi8tcttatatgf2
attactaatagt
cttcctcatcgt
gttgctgatggt
ttc6tcc1tactgc1
atc1acc1aac7agc1
ctc1ccccaccgc
gtcgccgac1ggc4
tta4tca1taatga
ataacaaaa6aga1
ctaccacaacga
gtagca5gaa2gga2
ttgtcgtagtgg1
atgjacgaagagg
ctgccgcagcgg1
gtggcggagggg
clos8>1aa1aa-5s+5s-16s+16stotal
type51657
clostridia. Distribution du total. duplica -5s +16s
g1t1 
atgitcttatatgf2
attactaatagt
ctt2cctcatcgc
gttgctgatggt
ttctcctactgc2
atc11accaac5agc
ctcccccaccgc
gtcgcc5gacggc
ttatca2taatga
ataaca3aaaaga
ctaccacaacga
gtagca26gaagga5
ttgtcgtagtgg
atgjacgaagagg
ctgccgcagcgg
gtggcggagggg
clos8dupli1aa-5s+5s-16s+16stotal
type8134255
clostridia. indices du 27.5.20 174 génomes
g1t1618111444,00,6
atgi159tct1,1tatatgf187
att1,1actaatagt0,6
ctt15,5cct2,3catcgc
gtt0,6gctgatggt
ttc206tcc103tac187tgc151
atc152acc102aac248agc133
ctc81ccc62cac140cgt116
gtc53gcc61gac242ggc220
tta172tca142taa1,1tga55
ata2,9aca218aaa271aga174
cta148cca163caa156cga48
gta286gca219gaa239gga243
ttg108tcg83tag2,3tgg120
atgj132acg77aag120agg96
ctg76ccg64cag77cgg60
gtg34gcg35gag83ggg70
intermaxmintotal

clostridia distribution par type

Clostridia. Distribution par type.
clostridia. distribution des solitaires
g1t1 
atgi1tcttatatgf1
attactaatagt1
ctt1cctcatcgt
gttgctgatggt
ttc1tcc6tactgc1
atcacc3aac1agc3
ctc2ccc1caccgc1
gtcgcc1gacggc
ttatca1taatga3
ata1aca2aaaaga
cta5cca4caacga1
gtagcagaagga1
ttg8tcg2tagtgg5
atgjacg4aag1agg5
ctg3ccg1cag3cgg
gtggcg1gag3ggg
clos81aa78
clostridia. distribution du type >1aa sans duplicata.
g1t1 
atgitcttatatgf8
attactaatagt
cttcctcatcgt
gttgctgatggt
ttc6tcctac10tgc3
atcacc3aac5agc5
ctc1ccc1cac8cgc3
gtc2gccgac15ggc11
tta11tca6taatga
ataaca15aaa14aga10
cta6cca10caa8cga3
gta20gcagaa17gga13
ttg1tcgtagtgg2
atgj10acgaag5agg1
ctg1ccgcag1cgg1
gtg1gcggagggg3
clos8>1aa240
clostridia. distribution du type +5s >3.
g1t1 
atgi9tcttatatgf11
attactaatagt
cttcctcatcgt
gttgctgatggt
ttc12tcc1tac13tgc10
atc3acc3aac16agc5
ctcccc2cac8cgc7
gtc2gccgac17ggc9
tta11tca10taatga
ataaca13aaa17aga14
cta8cca11caa14cga
gta21gcagaa19gga15
ttgtcgtagtgg4
atgj13acgaagagg
ctg2ccg1cagcgg
gtggcggag1ggg
clos8+5s302

clostridia par rapport au groupe de référence

Comparaison avec la référence
tRNAsblocs tRNAsblocs rRNAs
clos81aa>1aadup+5s1-3aasautrestotal
21faible3119262565
16moyen366641012042269
14fort1115521952914406
7824083025161740
10g+cga1613231
2agg+cgg5218
4carre ccc4441513
5autres628
3119262565
total tRNAs ‰
clos81aa>1aadup+5s1-3aasautresclos ‰ref.‰
21faible422638378826
16moyen498951362757364324
14fort1520932643919549650
105324114086982740729
10g+cga221834210
2agg+cgg73111
4carre ccc555171816
5autres803011
4226383788
blocs tRNAs ‰ total colonne %
clos81aa>1aaduptotalref.‰1aa>1aadup
21faible9558616026408
16moyen110202123253244628
14fort3447565156501465
2397362532672978240
10g+cga4940891052
2agg+cgg1562116
4carre ccc1212251613
5autres1862519
9558616031
Cet article est issu de Wikiversity. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.