< Recherche:Les clusters de gènes tRNA et rRNA chez les procaryotes < Annexe
- Annexe en préparation
Tanger le 3.11.19
Paeniclostridium sordellii AM370
psor opérons
- Liens: gtRNAdb, NCBI , génome
- Lien tableur: psor opérons
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales;Peptostreptococcaceae; Paeniclostridium.
- Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
- - @2, cds de 62 aas, hp, à allure répétitive susceptible d'être créé par contrainte lors des conversions ou d'autres réparations: MWLFFLFFFLFFFLFFFFFLFFFLFFFFFLFFFFFFPIVVLQTEINFRYGYIYTIHSGIIF
- - @4, riboswitch se trouve dans un bloc à rRNA. Concerne cette remarque aussi le RNA non codant, ncRNA, à l'adresse 19421..19685.
- Note: il n'y apas de gtRNAdb. Aussi j'ai comparé (EXACT NB.CAR STXT) les 1ers atgf atgi atgj du génome cdc, avec les atg de psor.
27.3%GC | 8.8.19 Paris | 112 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd |
---|---|---|---|---|---|---|---|---|---|
9847..10620 | CDS | 205 | 205 | 258 | |||||
10826..12332 | 16s | 196 | |||||||
12529..15445 | 23s | 78 | |||||||
15524..15640 | 5s | 85 | 85 | 85 | |||||
15726..15947 | CDS | 74 | |||||||
18845..19297 | CDS | 3 | 3 | 151 | 3 | ||||
19301..19393 | tcc | 27 | |||||||
19421..19685 | ncRNA | 152 | 152 | ||||||
19838..21478 | CDS | *547 | |||||||
24343..24570 | CDS | 309 | 309 | 76 | |||||
24880..26386 | 16s | 196 | |||||||
26583..29499 | 23s | 122 | |||||||
29622..29738 | 5s | 5 | 5 | ||||||
29744..29832 | tta | + | 13 | 13 | |||||
29846..29921 | atgf | 3 aaa | 15 | 15 | |||||
29937..30011 | gaa | 6 atg | 9 | 9 | |||||
30021..30094 | gga | 3 gta | 6 | 6 | |||||
30101..30176 | gta | 1 cgt | 5 | 5 | |||||
30182..30258 | gac | 1 ggc | 16 | 16 | |||||
30275..30350 | aac | 2 fois suite | 4 | 4 | |||||
30355..30429 | aca | aac aca aga | 4 | 4 | |||||
30434..30518 | tac | caa cac cca | 15 | 15 | |||||
30534..30617 | cta | cta gaa gac | 14 | 14 | |||||
30632..30708 | aga | gga tac tca | 7 | 7 | |||||
30716..30791 | caa | tgc tta ttc | 11 | 11 | |||||
30803..30878 | aaa | 6 | 6 | ||||||
30885..30973 | tca | 3 | 3 | ||||||
30977..31052 | ttc | 9 | 9 | ||||||
31062..31138 | atgj | 8 | 8 | ||||||
31147..31223 | atgi | 21 | 21 | ||||||
31245..31321 | cca | 6 | 6 | ||||||
31328..31404 | cac | 4 | 4 | ||||||
31409..31482 | tgc | 25 | 25 | ||||||
31508..31596 | tta | 13 | 13 | ||||||
31610..31685 | atgf | 15 | 15 | ||||||
31701..31775 | gaa | 9 | 9 | ||||||
31785..31858 | gga | 6 | 6 | ||||||
31865..31940 | gta | 5 | 5 | ||||||
31946..32022 | gac | 16 | 16 | ||||||
32039..32114 | aac | 4 | 4 | ||||||
32119..32193 | aca | 4 | 4 | ||||||
32198..32282 | tac | 15 | 15 | ||||||
32298..32381 | cta | 11 | 11 | ||||||
32393..32467 | ggc | 13 | 13 | ||||||
32481..32557 | aga | 7 | 7 | ||||||
32565..32640 | caa | 11 | 11 | ||||||
32652..32727 | aaa | 6 | 6 | ||||||
32734..32822 | tca | 3 | 3 | ||||||
32826..32901 | ttc | 9 | 9 | ||||||
32911..32987 | atgj | 8 | 8 | ||||||
32996..33072 | atgi | 21 | 21 | ||||||
33094..33170 | cca | 6 | 6 | ||||||
33177..33253 | cac | 9 | 9 | ||||||
33263..33338 | aaa | 21 | 21 | ||||||
33360..33433 | tgc | 6 | 6 | ||||||
33440..33516 | cgt | 10 | |||||||
33527..33602 | gta | 162 | 162 | 162 | |||||
33765..34016 | CDS | 84 | |||||||
34042..34455 | CDS | 249 | 249 | 138 | |||||
34705..36211 | 16s | 196 | |||||||
36408..39324 | 23s | 78 | |||||||
39403..39519 | 5s | 402 | *402 | ||||||
comp | 39922..40113 | CDS | 348 | 348 | 64 | ||||
40462..41968 | 16s | 196 | |||||||
42165..45081 | 23s | 78 | |||||||
45160..45276 | 5s | 180 | 180 | *180 | |||||
45457..47394 | CDS | *646 | |||||||
101428..102144 | CDS | 276 | 276 | 239 | |||||
102421..103927 | 16s | 54 | |||||||
103982..104057 | gca | 114 | |||||||
104172..107096 | 23s | 41 | |||||||
107138..107211 | gga | 11 | |||||||
107223..107339 | 5s | 99 | 99 | 99 | |||||
comp | 107439..108617 | CDS | 393 | ||||||
111345..111884 | CDS | 431 | *431 | 180 | |||||
112316..113822 | 16s | 54 | |||||||
113877..113952 | gca | 114 | |||||||
114067..116982 | 23s | 193 | |||||||
117176..117292 | 5s | 5 | |||||||
117298..117386 | tta | 9 | 9 | ||||||
117396..117472 | atgi | 123 | |||||||
117596..119102 | 16s | 54 | |||||||
119157..119232 | gca | 114 | |||||||
119347..122263 | 23s | 193 | |||||||
122457..122573 | 5s | 5 | |||||||
122579..122667 | tta | 9 | 9 | ||||||
122677..122753 | atgi | 123 | |||||||
122877..124383 | 16s | 54 | |||||||
124438..124513 | gca | 114 | |||||||
124628..127549 | 23s | 78 | |||||||
127628..127744 | 5s | 100 | 100 | 100 | |||||
127845..129260 | CDS | 472 | |||||||
215388..216260 | CDS | 264 | 264 | 291 | |||||
216525..218030 | 16s | 123 | |||||||
218154..218229 | gca | 152 | |||||||
218382..221296 | 23s | 50 | |||||||
221347..221420 | gga | 12 | |||||||
221433..221549 | 5s | 109 | 109 | 109 | |||||
221659..221940 | CDS | 525 | *525 | 94 | |||||
222466..223972 | 16s | 196 | |||||||
224169..227083 | 23s | 144 | |||||||
227228..227344 | 5s | 228 | 228 | *228 | |||||
227573..227989 | CDS | 139 | |||||||
449964..450266 | CDS | 253 | 253 | 101 | |||||
450520..452026 | 16s | 196 | |||||||
452223..455139 | 23s | 144 | |||||||
455284..455400 | 5s | 112 | 112 | 112 | |||||
comp | 455513..456616 | CDS | 368 | ||||||
498418..499074 | CDS | 189 | 189 | 219 | |||||
499264..500770 | 16s | 118 | |||||||
500889..500964 | gca | 95 | |||||||
501060..503976 | 23s | 144 | |||||||
504121..504237 | 5s | 131 | 131 | 131 | |||||
504369..504551 | CDS | 61 | |||||||
546886..550416 | CDS | 41 | 41 | *1177 | *41 | ||||
comp | 550458..550544 | ttg | 138 | 138 | |||||
550683..553325 | CDS | *881 | |||||||
608009..608683 | CDS | 195 | 195 | 225 | |||||
608879..608975 | tga | 37 | 37 | 37 | |||||
comp | 609013..609732 | CDS | 240 | ||||||
815939..816655 | CDS | 71 | 71 | 239 | 71 | ||||
816727..816800 | tgc | 12 | 12 | ||||||
816813..816888 | aac | 3 | 3 | ||||||
816892..816966 | aca | 285 | 285 | ||||||
817252..818727 | CDS | 492 | |||||||
1284870..1288097 | CDS | 111 | 111 | *1076 | *111 | ||||
1288209..1288297 | cta | 426 | *426 | ||||||
1288724..1290853 | CDS | *710 | |||||||
1445161..1445664 | CDS | 135 | 135 | 168 | 135 | ||||
1445800..1445868 | other | @1 | 258 | 258 | |||||
1446127..1446813 | CDS | 229 | |||||||
2267513..2267698 | CDS | @2 | 306 | 306 | 62 | *306 | |||
comp | 2268005..2268088 | cta | 404 | *404 | |||||
2268493..2269758 | CDS | 422 | |||||||
3094098..3094784 | CDS | 40 | 40 | 229 | 40 | ||||
comp | 3094825..3094941 | 5s | 78 | ||||||
comp | 3095020..3097936 | 23s | 194 | ||||||
comp | 3098131..3099637 | 16s | 276 | 276 | |||||
comp | 3099914..3101161 | CDS | 416 | ||||||
3159922..3160827 | CDS | 37 | 37 | 302 | 37 | ||||
comp | 3160865..3160956 | agc | 120 | 120 | |||||
comp | 3161077..3161376 | CDS | 100 | ||||||
comp | 3274188..3274733 | CDS | 245 | 245 | 182 | *245 | |||
comp | 3274979..3275095 | 5s | @3 | 12 | |||||
comp | 3275108..3275181 | gga | 107 | ||||||
comp | 3275289..3278214 | 23s | 137 | ||||||
comp | 3278352..3279858 | 16s | 253 | 253 | |||||
comp | 3280112..3280690 | CDS | 193 | ||||||
comp | 3303104..3304150 | CDS | 124 | 124 | 349 | 124 | |||
comp | 3304275..3304459 | riboswitch | @4 | 96 | |||||
comp | 3304556..3304672 | 5s | 11 | ||||||
comp | 3304684..3304758 | aca | 116 | ||||||
comp | 3304875..3307789 | 23s | 196 | ||||||
comp | 3307986..3309492 | 16s | 364 | *364 | |||||
3309857..3310504 | CDS | 216 | |||||||
comp | 3438683..3439531 | CDS | 142 | 142 | 283 | 142 | |||
comp | 3439674..3439750 | aga | 7 | 7 | |||||
comp | 3439758..3439832 | ggc | 9 | 9 | |||||
comp | 3439842..3439918 | gac | 5 | 5 | |||||
comp | 3439924..3439999 | gta | 8 | 8 | |||||
comp | 3440008..3440082 | gaa | 5 | ||||||
comp | 3440088..3440204 | 5s | 40 | ||||||
comp | 3440245..3443168 | 23s | 112 | ||||||
comp | 3443281..3443356 | gca | 109 | ||||||
comp | 3443466..3444972 | 16s | 138 | ||||||
comp | 3445111..3445187 | atgj | + | 13 | 13 | ||||
comp | 3445201..3445276 | ttc | 3 atg | 6 | 6 | ||||
comp | 3445283..3445359 | atc | 2 cca | 6 | 6 | ||||
comp | 3445366..3445442 | cca | 2 gga | 31 | 31 | ||||
comp | 3445474..3445549 | tgg | 2 aac | 11 | 11 | ||||
comp | 3445561..3445637 | atgi | 6 | 6 | |||||
comp | 3445644..3445720 | cca | 6 | 6 | |||||
comp | 3445727..3445817 | agc | 11 | 11 | |||||
comp | 3445829..3445917 | tca | 6 | 6 | |||||
comp | 3445924..3445999 | aaa | 12 | 12 | |||||
comp | 3446012..3446087 | caa | 6 | 6 | |||||
comp | 3446094..3446170 | aga | 19 | 19 | |||||
comp | 3446190..3446263 | gga | 11 | 11 | |||||
comp | 3446275..3446359 | tac | 4 | 4 | |||||
comp | 3446364..3446438 | aca | 4 | 4 | |||||
comp | 3446443..3446518 | aac | 31 | 31 | |||||
comp | 3446550..3446625 | aac | 16 | 16 | |||||
comp | 3446642..3446718 | gac | 5 | 5 | |||||
comp | 3446724..3446799 | gta | 6 | 6 | |||||
comp | 3446806..3446879 | gga | 9 | 9 | |||||
comp | 3446889..3446963 | gaa | 15 | 15 | |||||
comp | 3446979..3447054 | atgf | 13 | 13 | |||||
comp | 3447068..3447156 | tta | 5 | ||||||
comp | 3447162..3447278 | 5s | 213 | ||||||
comp | 3447492..3450406 | 23s | 196 | ||||||
comp | 3450603..3452109 | 16s | 239 | 239 | |||||
comp | 3452349..3452552 | CDS | 68 | ||||||
comp | 3523330..3524046 | CDS | 129 | 129 | 239 | 129 | |||
comp | 3524176..3524251 | gta | + | 8 | 8 | ||||
comp | 3524260..3524334 | gaa | 2 fois | 20 | 20 | ||||
comp | 3524355..3524430 | aaa | gta gaa aaa | 10 | 10 | ||||
comp | 3524441..3524515 | aca | 10 | 10 | |||||
comp | 3524526..3524602 | gac | 7 | 7 | |||||
comp | 3524610..3524685 | gta | 9 | 9 | |||||
comp | 3524695..3524769 | gaa | 5 | 5 | |||||
comp | 3524775..3524850 | aaa | 289 | 289 | |||||
3525140..3526039 | CDS | 300 |
psor cumuls
- Lien tableur: psor cumuls
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | ||
avec rRNA | opérons | 17 | 1 | 0 | 0 | 1 | 0 | 1 | 0 | 100 | 9 |
16 23 5s 0 | 6 | 20 | 9 | 65 | 50 | 5 | 20 | 1 | 200 | 8 | |
16 atc gca | 0 | 40 | 0 | 6 | 100 | 4 | 40 | 3 | 300 | 13 | |
16 23 5s a | 2 | 60 | 0 | 0 | 150 | 10 | 60 | 1 | 400 | 4 | |
max a | 44 | 80 | 0 | 0 | 200 | 5 | 80 | 1 | 500 | 4 | |
a doubles | 2 | 100 | 0 | 0 | 250 | 5 | 100 | 3 | 600 | 1 | |
autres | 9 | 120 | 0 | 0 | 300 | 8 | 120 | 3 | 700 | 1 | |
total aas | 87 | 140 | 0 | 0 | 350 | 3 | 140 | 4 | 800 | 1 | |
sans | opérons | 8 | 160 | 0 | 0 | 400 | 1 | 160 | 1 | 900 | 1 |
1 aa | 6 | 180 | 0 | 0 | 450 | 4 | 180 | 2 | 1000 | 0 | |
max a | 8 | 200 | 0 | 0 | 500 | 0 | 200 | 0 | 1100 | 1 | |
a doubles | 1 | 0 | 0 | 1 | 3 | 1 | |||||
total aas | 17 | 9 | 71 | 46 | 22 | 44 | |||||
total aas | 104 | ||||||||||
remarques | 4 | ||||||||||
avec jaune | moyenne | 9 | 10 | 206 | 119 | 304 | |||||
variance | 5 | 6 | 121 | 73 | 257 | ||||||
sans jaune | moyenne | 173 | 95 | 220 | |||||||
variance | 90 | 45 | 121 |
psor blocs
- Lien tableur: psor blocs
- Lien cdc blocs: le tabeau de cdc blocs est à comparer à celui de psor pour les types manquants, en gris dans cdc blocs.
- Légende:
- - Les blocs sont rangés par type de I à IV pour les blocs 16s23s et de V à X pour les blocs 16sgca23s. Chaque bloc est noté par son type suivi d'un indice.
- - La 1ère partie du tableau représente la totalité des blocs; la 2ème les groupes où les blocs se suivent avec des intercalaires très faibles. Seul l'intercalaire séparant le bloc V2 de I4 est élevé et le plus grand du tableau, 525. Je considère qu'un intercalaire inférieur à 350 est faible relativement aux intercalaires intra bloc. Les intercalaires avec les CDS sont faibles ici puisque seulement 3 sont supérieurs à 350, 402 (I2), 431 (VI1) et 525 (I4). Voir le tableau des cumuls pour tout les intercalaires des cds où seulement 6 sur 46 dépassent 350, avec une moyenne de 173±90.
- - Les couleurs, rouge pour rRNA, vert pour une configuration peu courante, un gène tRNA entre 23s et 5s, et ribosw pour riboswitch. Le cyan pour repérer le même intercalaire par rapport à la direction 16s23s5s quand elle change quand on a des adresses complément.
- Notes:
- - 3 blocs avec des tRNAs longs, 44 23 5, concentrant les 2/3 des tRNAs avec des blocs 16s23s. 15 tRNAs sont dans des blocs courts ou 16sgca23s. Les tRNAs extra blocs sont 17.
- - 10 blocs 16s23s contre 7 blocs 16sgca23s
- - Le regroupement des blocs par 3 et 2 concerne 10 blocs et restent donc 7 blocs solitaires, 3 sans tRNA et 4 avec 1 ou 2 tRNA.
- - Existence de 4 cds intra groupe de petite taille en aas, 84 138 64 pour le 2èmer groupe, et 94 pour le 4ème groupe.
- - Le 1er groupe de 3 blocs n'a pas de cds internes et est constitué de la duplication d'un même bloc.
- - Des intercalaires très faibles inter blocs
- - Des intercalaires intra blocs qui se répètent beaucoup mais peuvent être divisés ou multipliés par 2.
intercalaire Total 16s-23s 9*196 137 10 23s-5s 5*78 4*144 3*193 40 13 16s-gca 4*54 3*120 7 gca-23s 5*114 95 152 7 5s-aas 4*5 (tta) 5 (gaa) 5
I | I2 | I3 | I4 | II | III | IV | IV1 | IV2 | |||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
CDS | 124 | ||||||||||||
CDS | 245 | ribosw | 96 | ||||||||||
CDS | 205 | 249 | 348 | 525 | 253 | 40 | 5s | 12 | 5s | 11 | CDS | 309 | 5 |
16s | 196 | 196 | 196 | 196 | 196 | 78 | gga | 107 | aca | 116 | 16s | 196 | 213 |
23s | 78 | 78 | 78 | 144 | 144 | 194 | 23s | 137 | 23s | 196 | 23s | 122 | 196 |
5s | 85 | 402 | 180 | 228 | 112 | 276 | 16s | 253 | 16s | 364 | 5s | 5 | 239 |
CDS | CDS | CDS | tta | ||||||||||
V | V2 | VI | VI1 | VII | VII1 | VIII | VIII1 | IX | X | X1 | |||
CDS | 276 | 264 | CDS | 431 | CDS | 189 | gaa | 5 | |||||
16s | 54 | 123 | 16s | 54 | 16s | 54 | 16s | 54 | 16s | 118 | 5s | 40 | |
gca | 114 | 152 | gca | 114 | gca | 114 | gca | 114 | gca | 95 | 23s | 112 | |
23s | 41 | 50 | 23s | 193 | 23s | 193 | 23s | 78 | 23s | 144 | gca | 109 | |
gga | 11 | 12 | 5s | 5 | 5s | 5 | 5s | 100 | 5s | 131 | 16s | 138 | |
5s | 99 | 109 | tta | 9 | tta | 9 | CDS | CDS | atg | ||||
CDS | atg | 123 | atg | 123 | |||||||||
groupe1 | groupe2 | groupe3 | groupe4 | ||||||||||
CDS | 431 | CDS | 309 | CDS | 142 | CDS | 264 | ||||||
VI1 | 16s | 54 | IV1 | 16s | 196 | **4aas | 8 | V2 | 16s | 123 | |||
gca | 114 | 23s | 122 | gaa | 5 | gca | 152 | ||||||
23s | 193 | 5s | 5 | 5s | 40 | 23s | 50 | ||||||
5s | 5 | tta | 13 | 23s | 112 | gga | 12 | ||||||
tta | 9 | **42aas | 10 | gca | 109 | 5s | 109 | ||||||
atg | 123 | gta | 162 | X1 | 16s | 138 | CDS | 525 | |||||
VII1 | 16s | 54 | CDS | 25 | atg | 13 | I4 | 16s | 196 | ||||
gca | 114 | CDS | 249 | **21aas | 13 | 23s | 144 | ||||||
23s | 193 | I2 | 16s | 196 | tta | 5 | 5s | 228 | |||||
5s | 5 | 23s | 78 | 5s | 213 | CDS | |||||||
tta | 9 | 5s | 402 | 23s | 196 | ||||||||
atg | 123 | CDS | 348 | IV2 | 16s | 239 | |||||||
VIII1 | 16s | 54 | I3 | 16s | 196 | CDS | |||||||
gca | 114 | 23s | 78 | ||||||||||
23s | 78 | 5s | 180 | ||||||||||
5s | 100 | CDS | |||||||||||
CDS |
psor remarques
- Lien tableur: psor remarques
- Nombre de gènes protéines: 3327 (NCBI)
- Rmarques @:
- - Un tRNA nommé other, non déterminé
- - cds de 62 aas, hp, à allure répétitive susceptible d'être créé par contrainte lors des conversions ou d'autres réparations: MWLFFLFFFLFFFLFFFFFLFFFLFFFFFLFFFFFFPIVVLQTEINFRYGYIYTIHSGIIF
- - une configuration rare 23s-aas-5s concerne 3 gga et 1 aca
- - Les RNAs non codants: riboswitch dans un bloc à rRNA et ncRNA dans un bloc sans rRNA, adresse 19421..19685.
- Configuration des blocs: voir psor blocs.
- Les séquences des doubles: Il y a très peu de doubles mais des duplications de séquences. Le signe + dans psor opérons indique les doubles.
- - séquence 44 aas: voir psor opérons, la couleur cyan pour la duplication de 20 aas et la couleur verte pour les insertions. Je n'ai pas pu distingué les 3 types d'atg dans 6 atg, qui certainement doivent être départagés en 2 atgf 2 atgj 2 atgi. Ce qui laisse 2 doubles aaa et gta.
- - séquence 23 aas: voir ci-dessous l'analogie de séquence entre 23 aas et le début de 44 aas. Seuls 3 aas ont des doubles cca gga aac, aucune séquence n'est dupliquée.
- - séquence 5 aas, c'est une petite séquence simple à la suite du blocs 23aas. Est-ce le fait d'être dans un bloc 416s-gca-23s?
- - séquence 8 aas: voir psor opérons, adresse 3523330..3524046, duplication de 3 aas. Est-ce que ça ne serait pas une séquence détachée d'un bloc 16s23s5s comme les 2 autres longs blocs.
23aas tta atg gaa gga gta gac aac aac aca tac gga aga caa aaa tca agc cca atg tgg cca atc ttc atg 44aas tta atg gaa gga gta gac aac aca tac cta aga caa aaa tca ttc atg atg cca cac - - - -
psor distribution
- Lien tableur: psor distribution
- Notes: tableau Cl12 blocs à de 3 tRNAs sauf
- - -5s: 3 gga et aca
- - 1-3 aas: 2 tta et 2 atgi
|
|
Peptoclostridium difficile CD196
cdc opérons
- Liens: gtRNAdb , NCBI , génome [orgn]
- Lien tableur: cdc opérons
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales;Peptostreptococcaceae; Clostridioides.
- Légende: cdsa: cds aas, cdsd: cds dirigé
28.6%GC | 11.9.19 Paris | 83 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
dir | 9857..10630 | cds | 179 | 179 | 258 | SigB/SigF/SigG family RNA polymerase sigma factor | ||||
dir | 10810..12317 | 16s | 52 | |||||||
dir | 12370..12445 | gca | 249 | |||||||
dir | 12695..15596 | 23s | 111 | |||||||
dir | 15708..15824 | 5s | 126 | 126 | 126 | |||||
dir | 15951..16460 | cds | 170 | transcription repressor NadR | ||||||
dir | 19402..19857 | cds | 0 | 0 | 152 | 0 | nucleoside deaminase | |||
dir | 19858..19949 | tcc | 37 | |||||||
dir | 19987..20251 | ncRNA | @1 | 76 | 76 | |||||
dir | 20328..21965 | cds | 546 | DNA polymerase III subunit gamma/tau | ||||||
comp | 23419..24624 | cds | 505 | *505 | 402 | glycosyl transferase | ||||
dir | 25130..26637 | 16s | 279 | |||||||
dir | 26917..29816 | 23s | + | 180 | ||||||
dir | 29997..30113 | 5s | 3 aaa | 6 | ||||||
dir | 30120..30194 | aac | 3 gta | 6 | 6 | |||||
dir | 30201..30286 | tta | 15 | 15 | ||||||
dir | 30302..30377 | atgf | 7 | 7 | ||||||
dir | 30385..30459 | gaa | 9 | 9 | ||||||
dir | 30469..30542 | gga | 5 | 5 | ||||||
dir | 30548..30623 | gta | 5 | 5 | ||||||
dir | 30629..30705 | gac | 9 | 9 | ||||||
dir | 30715..30789 | aca | 14 | 14 | ||||||
dir | 30804..30888 | tac | 8 | 8 | ||||||
dir | 30897..30980 | cta | 29 | 29 | ||||||
dir | 31010..31086 | aga | 7 | 7 | ||||||
dir | 31094..31169 | caa | 88 | 88 | ||||||
dir | 31258..31346 | tca | 3 | 3 | ||||||
dir | 31350..31425 | ttc | 6 | 6 | ||||||
dir | 31432..31508 | atgj | 11 | 11 | ||||||
dir | 31520..31596 | atgi | 23 | 23 | ||||||
dir | 31620..31696 | cca | 7 | 7 | ||||||
dir | 31704..31780 | cac | 8 | 8 | ||||||
dir | 31789..31864 | aaa | 7 | 7 | ||||||
dir | 31872..31945 | tgc | 6 | 6 | ||||||
dir | 31952..32026 | aac | 5 | 5 | ||||||
dir | 32032..32117 | tta | 15 | 15 | ||||||
dir | 32133..32208 | atgf | 7 | 7 | ||||||
dir | 32216..32290 | gaa | 9 | 9 | ||||||
dir | 32300..32373 | gga | 5 | 5 | ||||||
dir | 32379..32454 | gta | 5 | 5 | ||||||
dir | 32460..32536 | gac | 9 | 9 | ||||||
dir | 32546..32620 | aca | 14 | 14 | ||||||
dir | 32635..32719 | tac | 9 | 9 | ||||||
dir | 32729..32812 | cta | 23 | 23 | ||||||
dir | 32836..32910 | ggc | 24 | 24 | ||||||
dir | 32935..33011 | aga | 9 | 9 | ||||||
dir | 33021..33096 | caa | 8 | 8 | ||||||
dir | 33105..33180 | aaa | 2 | 2 | ||||||
dir | 33183..33271 | tca | 3 | 3 | ||||||
dir | 33275..33350 | ttc | 6 | 6 | ||||||
dir | 33357..33433 | atgj | 11 | 11 | ||||||
dir | 33445..33521 | atgi | 17 | 17 | ||||||
dir | 33539..33615 | cac | 8 | 8 | ||||||
dir | 33624..33699 | aaa | 7 | 7 | ||||||
dir | 33707..33780 | tgc | 7 | 7 | ||||||
dir | 33788..33864 | cgt | 12 | 12 | ||||||
dir | 33877..33952 | gta | 75 | 75 | 75 | |||||
dir | 34028..34441 | cds | 308 | 308 | 138 | hp | ||||
dir | 34750..38181 | cds | 1144 | pyruvate carboxylase | ||||||
dir | 127011..127715 | cds | 281 | 281 | 235 | N-acetylmuramoyl-L-alanine amidase CwlD | ||||
dir | 127997..129505 | 16s | 279 | |||||||
dir | 129785..132685 | 23s | + | 131 | ||||||
dir | 132817..132933 | 5s | 2 cca | 6 | ||||||
dir | 132940..133014 | aac | 4 | 4 | ||||||
dir | 133019..133093 | gaa | 5 | 5 | ||||||
dir | 133099..133174 | gta | 5 | 5 | ||||||
dir | 133180..133256 | gac | 10 | 10 | ||||||
dir | 133267..133341 | aca | 14 | 14 | ||||||
dir | 133356..133440 | tac | 9 | 9 | ||||||
dir | 133450..133523 | gga | 10 | 10 | ||||||
dir | 133534..133610 | aga | 9 | 9 | ||||||
dir | 133620..133695 | caa | 11 | 11 | ||||||
dir | 133707..133782 | aaa | 2 | 2 | ||||||
dir | 133785..133873 | tca | 17 | 17 | ||||||
dir | 133891..133981 | agc | 8 | 8 | ||||||
dir | 133990..134066 | cca | 85 | 85 | ||||||
dir | 134152..134227 | tgg | 60 | 60 | ||||||
dir | 134288..134364 | cca | 6 | 6 | ||||||
dir | 134371..134447 | atc | 3 | 3 | ||||||
dir | 134451..134526 | ttc | 7 | 7 | ||||||
dir | 134534..134610 | atgj | 114 | |||||||
dir | 134725..136115 | 16s | 68 | |||||||
dir | 136184..136259 | gca | 271 | |||||||
dir | 136531..139430 | 23s | 126 | |||||||
dir | 139557..139673 | 5s | 213 | 213 | 213 | |||||
comp | 139887..141071 | cds | 372 | *372 | 395 | pyridoxal phosphate-dependent aminotransferase | ||||
dir | 141444..143795 | cds | 21 | 21 | 784 | anaerobic ribonucleoside triphosphate reductase | ||||
dir | 143817..144356 | cds | 776 | *776 | 180 | anaerobic ribonucleoside-triphosphate reductase activating protein | ||||
dir | 145133..146640 | 16s | 52 | |||||||
dir | 146693..146768 | gca | 373 | |||||||
dir | 147142..150041 | 23s | 126 | |||||||
dir | 150168..150284 | 5s | 7 | 7 | ||||||
dir | 150292..150366 | aac | 5 | 5 | ||||||
dir | 150372..150457 | tta | 15 | 15 | ||||||
dir | 150473..150548 | atgf | 7 | 7 | ||||||
dir | 150556..150630 | gaa | 14 | 14 | ||||||
dir | 150645..150718 | gga | 5 | 5 | ||||||
dir | 150724..150799 | gta | 5 | 5 | ||||||
dir | 150805..150881 | gac | 10 | 10 | ||||||
dir | 150892..150966 | ggc | 9 | 9 | ||||||
dir | 150976..151049 | aga | 975 | *975 | ||||||
dir | 152025..152864 | cds | 280 | TIGR00159 family protein | ||||||
dir | 378341..380728 | cds | 583 | *583 | 796 | cadmium-translocating P-type ATPase | ||||
dir | 381312..382819 | 16s | 311 | |||||||
dir | 383131..386030 | 23s | 126 | |||||||
dir | 386157..386273 | 5s | 177 | 177 | 177 | |||||
dir | 386451..387059 | cds | 203 | DedA family protein | ||||||
comp | 833130..833894 | cds | 258 | 258 | 255 | DeoR/GlpR transcriptional regulator | ||||
dir | 834153..834243 | agc | 87 | 87 | 87 | |||||
dir | 834331..835119 | cds | 263 | flagellar motor protein | ||||||
dir | 1089165..1090139 | cds | 239 | 239 | 325 | 239 | Mannosyl-glycoprotein endo-beta-N-acetylglucosamidase | |||
dir | 1090379..1091886 | 16s | 320 | |||||||
dir | 1092207..1095106 | 23s | 91 | |||||||
dir | 1095198..1095271 | gga | @2 | 8 | ||||||
dir | 1095280..1095396 | 5s | 273 | 273 | ||||||
dir | 1095670..1097688 | cds | 673 | N-acetylmuramoyl-L-alanine amidase | ||||||
comp | 1181549..1182958 | cds | 1374 | *1374 | 470 | MBOAT family protein | ||||
comp | 1184333..1184415 | ttg | 318 | 318 | 318 | |||||
dir | 1184734..1187382 | cds | 883 | DNA polymerase I | ||||||
dir | 1835768..1837498 | cds | 109 | 109 | 577 | 109 | Na+/H+ antiporter NhaC family protein | |||
dir | 1837608..1837688 | cta | 231 | 231 | ||||||
<dir | 1837920..1838093 | cds | 58 | HXXEE domain-containing protein | ||||||
dir | 2981767..2982444 | cds | 159 | 159 | 226 | 159 | sortase SrtB | |||
comp | 2982604..2982678 | aca | @3 | 94 | ||||||
comp | 2982773..2985672 | 23s | 184 | |||||||
comp | 2985857..2987364 | 16s | 340 | 340 | ||||||
dir | 2987705..2988643 | cds | 313 | delta-lactam-biosynthetic de-N-acetylase | ||||||
comp | 3787361..3788431 | cds | 454 | *454 | 357 | ABC transporter ATP-binding protein | ||||
comp | 3788886..3789002 | 5s | 126 | |||||||
comp | 3789129..3792028 | 23s | 281 | |||||||
comp | 3792310..3793817 | 16s | 191 | 191 | 191 | |||||
comp | 3794009..3794587 | cds | 193 | bifunctional precorrin-2 dehydrogenase/sirohydrochlorin ferrochelatase | ||||||
comp | 3944262..3944453 | cds | 119 | 119 | 64 | 119 | DUF378 domain-containing protein | |||
comp | 3944573..3944689 | 5s | 126 | |||||||
comp | 3944816..3947715 | 23s | 217 | |||||||
comp | 3947933..3949440 | 16s | 282 | 282 | ||||||
comp | 3949723..3950004 | cds | 221 | 221 | 94 | hp | ||||
comp | 3950226..3951755 | cds | 510 | lysine--tRNA ligase | ||||||
dir | 4084445..4085437 | cds | 382 | *382 | 331 | DNA replication protein DnaC | ||||
comp | 4085820..4085894 | aca | 33 | |||||||
comp | 4085928..4086003 | gta | 4 | |||||||
comp | 4086008..4086082 | gaa | 6 | |||||||
comp | 4086089..4086164 | aaa | 326 | 326 | 326 | |||||
comp | 4086491..4087780 | cds | 430 | adenylosuccinate synthase |
cdc cumuls
- Lien tableur: cdc cumuls
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | ||
avec rRNA | opérons | 10 | 1 | 0 | 1 | 1 | 1 | 1 | 100 | 3 | |
16 23 5s 0 | 3 | 20 | 2 | 61 | 50 | 1 | 20 | 0 | 200 | 5 | |
16 gca 235 | 3 | 40 | 1 | 4 | 100 | 3 | 40 | 0 | 300 | 7 | |
16 23 5s a | 2 | 60 | 1 | 150 | 3 | 60 | 0 | 400 | 5 | ||
max a | 43 | 80 | 0 | 200 | 4 | 80 | 1 | 500 | 3 | ||
a doubles | 2 | 100 | 2 | 250 | 4 | 100 | 1 | 600 | 3 | ||
autres | 2 | 120 | 0 | 300 | 4 | 120 | 2 | 700 | 1 | ||
total aas | 75 | 140 | 0 | 350 | 4 | 140 | 1 | 800 | 2 | ||
sans | opérons | 5 | 160 | 0 | 400 | 2 | 160 | 1 | 900 | 1 | |
1 aa | 4 | 180 | 0 | 450 | 0 | 180 | 1 | 1000 | 0 | ||
max a | 4 | 200 | 0 | 500 | 1 | 200 | 1 | 1100 | 0 | ||
a doubles | 0 | 0 | 5 | 4 | 1 | ||||||
total aas | 8 | 3 | 68 | 32 | 13 | 31 | |||||
total aas | 83 | ||||||||||
remarques | 3 | ||||||||||
avec jaune | moyenne | 14 | 12 | 313 | 165 | 378 | |||||
variance | 15 | 283 | 94 | 259 | |||||||
sans jaune | moyenne | 9 | 206 | 286 | |||||||
variance | 5 | 107 | 144 |
cdc blocs
- Lien tableur: cdc blocs
- Lien psor blocs: le tabeau de cdc blocs est à comparer à celui de psor pour les types manquants, ici en gris.
- Légende: voir psor blocs.
- Notes:
- - cdc a perdu 3 blocs de type I, 16s23s5s sans tRNAs; les 2 blocs de type V, 16s-gca-23sgga5s et les 2 blocs 16s-gca-23s5s-2aas de type VI et VII. Soit la moitié des blocs courts, 7 sur 14, et plus de la moitié des blocs 16s-gca, 4 sur 7. Les 3 blocs longs sont maintenus mais modifiés.
groupes | types | absents | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
cds | 281 | I | II | III | IV | IV1 | IV2 | |||||||
IV2 | 16s | 279 | ||||||||||||
23s | 131 | CDS | 583 | 454 | 119 | cds | 239 | |||||||
5s | 6 | 16s | 311 | 126 | 126 | 16s | 320 | cds | 159 | cds | 505 | 281 | ||
aac | 4 | 23s | 126 | 281 | 217 | 23s | 91 | aca | 94 | 16s | 279 | 279 | ||
**16aas | 3 | 5s | 177 | 191 | 282 | gga | 8 | 23s | 184 | 23s | 180 | 131 | ||
ttc | 7 | CDS | 5s | 273 | 16s | 340 | 5s | 6 | 6 | |||||
atgj | 114 | cds | cds | aac | 6 | 4 | ||||||||
VIII1 | 16s | 68 | ||||||||||||
gca | 271 | V | V2 | VI | VI1 | VII | VII1 | |||||||
23s | 126 | |||||||||||||
5s | 213 | |||||||||||||
cds | 372 | |||||||||||||
cds | 21 | VIII | VIII1 | IX | X | X1 | ||||||||
cds | 776 | cds | 21 | |||||||||||
X1 | 16s | 52 | atgj | 114 | cds | 179 | cds | 776 | ||||||
gca | 373 | 16s | 68 | 16s | 52 | 16s | 52 | |||||||
23s | 126 | gca | 271 | gca | 249 | gca | 373 | |||||||
5s | 7 | 23s | 126 | 23s | 111 | 23s | 126 | |||||||
aac | 5 | 5s | 213 | 5s | 126 | 5s | 7 | |||||||
**7aas | 9 | cds | 372 | cds | aac | 5 | ||||||||
aga | 975 | |||||||||||||
cds |
cdc psor
- Lien tableur: cdc psor
- Comparaison bsu-lmo: Les séquences, les cumuls.
- Légende:
- - La couleur cyan pour les différents entre cdc et psor; bois pour les identiques entre les clusters 43aas et 18aas de cdc d'une part et les clusters 44aas et 23aas de psor. Le gène aaa du cluster 18aas de cdc a son identique dans la 2ème partie du cluster 43aas et non dans la 1ère partie, car la duplication n'est pas exacte.
- - Le bleu pour des intercalaires exceptionnels.
- - Les blocs 16s indiquent des rRNAs de bordure, l'équivalent d'un cds.
- - Le jaune pour la conservation des cds: je ne l'ai appliqué ici qu'aux petits clusters sans rRNAs; Comparer les cumuls des intercalaires et protéines des cds de cdc et psor montre clairement que les clusters soit, sont très mobiles ou bien qu'il y a de nombreuses recombinansons entre le cluster et ses cds. Le jaune indique ici des intercalaires et des protéines presque identiques.
- - Les bordures très épaisses noires encadrent les 7 gènes du cluster 9aas identiques dans les duplicata du 43aas, comparaison cdc-cdc. Les bordures très épaisses bleues encadrent les 4 gènes du cluster 9aas de cdc et ceux du 23aas de psor, comparaison cdc-psor.
- Notes:
- - Les 3 blocs longs de cdc commencent tous par aac. Chez psor 2 blocs longs et 2 courts commencent par tta et 1 bloc long gca commence par gaa.
- - Le jaune encadré montre que le cluster cta conservé dans cdc est celui ayant une protéine identique, 58 contre 62 aas dans psor. Or dans psor ce cluster présente des répétitions caractéristiques des contraintes imposées aux réparations.
- - Les fréquences des différences entre intercalaires (diff) sont reportées dans le dernier tableau C24 et sont établies sur la plage des différences entre intercalaires cdc et psor du tableau C21 pour des couples identiques. 16% des différences sont nulles (8 sur 49) et 50% ne dépassent pas 2 paires de bases. Ces résultats sont à mettre en parallèle avec ceux de la omparaison bsu-lmo, avec les séquences et les cumuls. La faible variabilité des intercalaires cdc-psor par rapport à bsu-lmo est due à leur plus grande filiation, niveau genre contre le niveau famille pour bsu-lmo.
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
cdc remarques
- Nombre de gènes protéines: cdc 3615, psor 3327 (NCBI)
- Comparaison bsu-lmo: Les séquences, les cumuls. bsu-lmo nouveau
- Rmarques @: On retrouve une partie des remarques de psor
- - Les RNAs non codants: seul le bloc cds-tcc-ncRNA-cds est maintenu.
- - Une configuration rare 23s-gga-5s complète au lieu de 3.
- - La configuration 16s23s-aca-5s-riboswitch perd 5s-riboswitch et devient 16s23s-aca.
- Comparaison cdc-psor
- Les blocs à rRNAs: Les blocs disparaissent au moment des divisions et ce sont les non protégés par des séquences de tRNAs qui disparaissent en 1er. 7 clusters simples disparaissent et les groupes se défont.
- Les séquences longues:
- Comparaison entre les 2 génomes, cdc-psor: Très peu de modifications, plutôt des mutations que des recombinaisons et encore moins des créations. Le cas de la disparition de aaa qui apparaît dans un intercalaire est emblématique.
- Comparaisons intra génome, cdc-cdc et psor-psor. Là les remaniements sont légions et puissants: duplication de 20 tRNAs d'un seul coup, recombinaisons par lots ou tRNA par tRNA.
- Comparaison clostridia-bacilli entre cdc-psor et bsu-lmo: la comparaison est saisissante et on arrive à repérer une recombinaison après division, celle de 16s23s5s en 16s-atcgca-23s5s entre bsu et lmo. La mutation de cta en ctg, entre génome, qui conserve la longueur du tRNA, ainsi que la agc en tcc dans le petit bloc aac-**-gaa en intra.
- - Seul les clostridia présentent des cds dans les groupes, les bacilli non. Les autres génomes de clostridia (voir fiche) présentent beaucoup de cds dans les clusters alors que les bacilli (fiche) jamais.
- Conclusion: Tout se passe comme si le processus se déroulait d'un seul coup dans un génome, en dehors de la division. Puis pendant la 1ère division et les divisions suivantes certains clusters disparaissent facilement alors que se produisent quelques rares mutations et recombinaisons. C'est avant tout un processus de création ordonné donnant des séquences qui peuvent se dupliquer et se recombiner. Les séquences de tRNA stabilisent et maintiennent les blocs de rRNAs, un seul cluster à 6 tRNAs disparaît entre bsu et lmo, et aucun entre cdc et psor.
cdc distribution
- Lien tableur: cdc distribution
- Notes: Tableau Cl22
- - -5s: gga aca
|
|
Peptoclostridium difficile M68
cdc8 opérons
- Liens data bases: gtRNAdb , NCBI , génome
- Lien tableur: cdc8 opérons
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales;Peptostreptococcaceae; Clostridioides.
- Liens internes: noms abrégés cdc8 remarques cdc8 cumuls
- Légende: voir cdc8 cumuls pour cdsa: cds en pbs, cdsd: cds dirigé; voir cdc8 remarques pour @ et +
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 23s°: 23S ribosomal RNA rRNA prediction is too short
- - cca: tRNA dupliqué dans le cluster 43aas (4306341).
- - cca: tRNA non dupliqué dans le cluster 43aas (4306341), ou remarques @2 et @3.
- - 554: voir cdc8 cumuls, veut dire sans jaune, exclu de la moyenne.
28.6%GC | 11.9.19 Paris | 110 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
dir | 4299490..4300134 | cds | 214 | 214 | 645 | tyrosine-type recombinase/integrase | ||||
dir | 4300349..4300807 | cds | @1 | 554 | 554 | 459 | helix-turn-helix domain-containing protein | |||
dir | 4301362..4303101 | cds | 0 | 0 | 1740 | hypothetical protein | ||||
dir | 4303102..4303305 | cds | 167 | 167 | 204 | hp | ||||
dir | 4303473..4304299 | 23s° | 132 | 827 | ||||||
dir | 4304432..4304548 | 5s | + | 6 | 117 | |||||
dir | 4304555..4304629 | aac | 4 | 4 | 75 | |||||
dir | 4304634..4304708 | gaa | 2 cca | 5 | 5 | 75 | ||||
dir | 4304714..4304789 | gta | 5 | 5 | 76 | |||||
dir | 4304795..4304871 | gac | 11 | 11 | 77 | |||||
dir | 4304883..4304957 | aca | 14 | 14 | 75 | |||||
dir | 4304972..4305056 | tac | 9 | 9 | 85 | |||||
dir | 4305066..4305139 | gga | 10 | 10 | 74 | |||||
dir | 4305150..4305226 | aga | 9 | 9 | 77 | |||||
dir | 4305236..4305311 | caa | 11 | 11 | 76 | |||||
dir | 4305323..4305398 | aaa | 2 | 2 | 76 | |||||
dir | 4305401..4305489 | tca | 18 | 18 | 89 | |||||
dir | 4305508..4305598 | agc | 8 | 8 | 91 | |||||
dir | 4305607..4305683 | cca | 85 | 85 | 77 | |||||
dir | 4305769..4305844 | tgg | 60 | 60 | 76 | |||||
dir | 4305905..4305981 | cca | 5 | 5 | 77 | |||||
dir | 4305987..4306063 | atc | 3 | 3 | 77 | |||||
dir | 4306067..4306142 | ttc | 7 | 7 | 76 | |||||
dir | 4306150..4306226 | atgj | 114 | 77 | ||||||
dir | 4306341..4307538 | 16s | 0 | 0 | 1198 | 0 | ||||
dir | 4307539..4308225 | cds | 100 | 100 | 687 | xylose isomerase | ||||
dir | 1..796 | 23s° | 181 | 796 | ||||||
dir | 978..1094 | 5s | 6 | 117 | ||||||
dir | 1101..1175 | aac | + | 6 | 6 | 75 | ||||
dir | 1182..1267 | tta | 3 aaa | 15 | 15 | 86 | ||||
dir | 1283..1358 | atgf | 3 gta | 7 | 7 | 76 | ||||
dir | 1366..1440 | gaa | 9 | 9 | 75 | |||||
dir | 1450..1523 | gga | 5 | 5 | 74 | |||||
dir | 1529..1604 | gta | 5 | 5 | 76 | |||||
dir | 1610..1686 | gac | 9 | 9 | 77 | |||||
dir | 1696..1770 | aca | 14 | 14 | 75 | |||||
dir | 1785..1869 | tac | 10 | 10 | 85 | |||||
dir | 1880..1963 | cta | 28 | 28 | 84 | |||||
dir | 1992..2068 | aga | 7 | 7 | 77 | |||||
dir | 2076..2151 | caa | 89 | 89 | 76 | |||||
dir | 2241..2329 | tca | 3 | 3 | 89 | |||||
dir | 2333..2408 | ttc | 6 | 6 | 76 | |||||
dir | 2415..2491 | atgj | 11 | 11 | 77 | |||||
dir | 2503..2579 | atgi | 29 | 29 | 77 | |||||
dir | 2609..2685 | cca | 7 | 7 | 77 | |||||
dir | 2693..2769 | cac | 8 | 8 | 77 | |||||
dir | 2778..2853 | aaa | 7 | 7 | 76 | |||||
dir | 2861..2934 | tgc | 6 | 6 | 74 | |||||
dir | 2941..3015 | aac | 6 | 6 | 75 | |||||
dir | 3022..3107 | tta | 15 | 15 | 86 | |||||
dir | 3123..3198 | atgf | 7 | 7 | 76 | |||||
dir | 3206..3280 | gaa | 9 | 9 | 75 | |||||
dir | 3290..3363 | gga | 5 | 5 | 74 | |||||
dir | 3369..3444 | gta | 5 | 5 | 76 | |||||
dir | 3450..3526 | gac | 9 | 9 | 77 | |||||
dir | 3536..3610 | aca | 14 | 14 | 75 | |||||
dir | 3625..3709 | tac | 9 | 9 | 85 | |||||
dir | 3719..3802 | cta | 24 | 24 | 84 | |||||
dir | 3827..3901 | ggc | 24 | 24 | 75 | |||||
dir | 3926..4002 | aga | 9 | 9 | 77 | |||||
dir | 4012..4087 | caa | 8 | 8 | 76 | |||||
dir | 4096..4171 | aaa | 2 | 2 | 76 | |||||
dir | 4174..4262 | tca | 3 | 3 | 89 | |||||
dir | 4266..4341 | ttc | 6 | 6 | 76 | |||||
dir | 4348..4424 | atgj | 11 | 11 | 77 | |||||
dir | 4436..4512 | atgi | 17 | 17 | 77 | |||||
dir | 4530..4606 | cac | 8 | 8 | 77 | |||||
dir | 4615..4690 | aaa | 7 | 7 | 76 | |||||
dir | 4698..4771 | tgc | 7 | 7 | 74 | |||||
dir | 4779..4855 | cgt | 12 | 12 | 77 | |||||
dir | 4868..4943 | gta | 75 | 75 | 76 | 75 | ||||
dir | 5019..5432 | cds | 308 | 308 | 414 | hp | ||||
dir | 5741..9172 | cds | 3432 | pyruvate carboxylase | ||||||
dir | 94032..94736 | cds | 281 | 281 | 705 | 281 | N-acetylmuramoyl-L-alanine amidase CwlD | |||
dir | 95018..95994 | 16s° | 100 | 977 | ||||||
dir | 96095..97613 | 23s° | 126 | 1519 | ||||||
dir | 97740..97856 | 5s | 7 | 117 | ||||||
dir | 97864..97938 | aac | 6 | 6 | 75 | |||||
dir | 97945..98030 | tta | 15 | 15 | 86 | |||||
dir | 98046..98121 | atgf | 7 | 7 | 76 | |||||
dir | 98129..98203 | gaa | 8 | 8 | 75 | |||||
dir | 98212..98285 | gga | 4 | 4 | 74 | |||||
dir | 98290..98365 | gta | 5 | 5 | 76 | |||||
dir | 98371..98447 | gac | 10 | 10 | 77 | |||||
dir | 98458..98532 | ggc | 9 | 9 | 75 | |||||
dir | 98542..98615 | aga | 954 | 954 | 74 | |||||
dir | 99570..100409 | cds | 840 | TIGR00159 family protein | ||||||
dir | 306829..309216 | cds | 733 | 733 | 2388 | cadmium-translocating P-type ATPase | ||||
<> comp | 309950..310076 | cds | 1 | 1 | 127 | 1 | glycine/sarcosine/betaine reductase complex selenoprotein A | |||
dir | 310078..311313 | 23s° | 126 | 1236 | ||||||
dir | 311440..311556 | 5s | 177 | 177 | 117 | |||||
dir | 311734..312342 | cds | 609 | DedA family protein | ||||||
comp | 861856..862620 | cds | 258 | 258 | 765 | DeoR/GlpR transcriptional regulator | ||||
dir | 862879..862969 | agc | 87 | 87 | 91 | 87 | ||||
dir | 863057..863845 | cds | 789 | flagellar motor protein | ||||||
dir | 1106477..1107451 | cds | 238 | 238 | 975 | 238 | Mannosyl-glycoprotein endo-beta-N-acetylglucosamidase | |||
dir | 1107690..1109197 | 16s | @2 | 320 | 1508 | |||||
dir | 1109518..1112416 | 23s | 91 | 2899 | ||||||
dir | 1112508..1112581 | gga | 8 | 74 | ||||||
dir | 1112590..1112706 | 5s | 273 | 273 | 117 | |||||
dir | 1112980..1114998 | cds | 2019 | N-acetylmuramoyl-L-alanine amidase | ||||||
comp | 1196804..1198213 | cds | 1378 | 1378 | 1410 | MBOAT family protein | ||||
comp | 1199592..1199674 | ttg | 318 | 318 | 83 | 318 | ||||
dir | 1199993..1202641 | cds | 2649 | DNA polymerase I | ||||||
dir | 1850896..1852626 | cds | 109 | 109 | 1731 | 109 | Na+/H+ antiporter NhaC family protein | |||
dir | 1852736..1852816 | cta | 334 | 334 | 81 | |||||
dir | 1853151..1853666 | cds | 516 | HXXEE domain-containing protein | ||||||
dir | 3024038..3024715 | cds | 150 | 150 | 678 | 150 | sortase SrtB | |||
comp | 3024866..3024940 | aca | @3 | 93 | 75 | |||||
comp | 3025034..3027933 | 23s | 184 | 2900 | ||||||
comp | 3028118..3029625 | 16s | 374 | 374 | 1508 | |||||
dir | 3030000..3030938 | cds | 939 | delta-lactam-biosynthetic de-N-acetylase | ||||||
dir | 3805298..3806743 | cds | 208 | 208 | 1446 | tyrosine-type recombinase/integrase | ||||
comp | 3806952..3807028 | agg | 61 | 61 | 77 | 61 | ||||
<comp | 3807090..3808790 | cds | 1701 | formate dehydrogenase subunit alpha | ||||||
comp | 3875816..3876886 | cds | 452 | 452 | 1071 | ABC transporter ATP-binding protein | ||||
comp | 3877339..3877455 | 5s | 125 | 117 | ||||||
comp | 3877581..3880480 | 23s | 261 | 2900 | ||||||
comp | 3880742..3882249 | 16s | 190 | 190 | 1508 | 190 | ||||
comp | 3882440..3883018 | cds | 579 | bifunctional precorrin-2 dehydrogenase/sirohydrochlorin ferrochelatase | ||||||
comp | 4017523..4017714 | cds | 118 | 118 | 192 | 118 | DUF378 domain-containing protein | |||
comp | 4017833..4017949 | 5s | 126 | 117 | ||||||
comp | 4018076..4020975 | 23s | 321 | 2900 | ||||||
comp | 4021297..4022804 | 16s | 292 | 292 | 1508 | |||||
comp | 4023097..4023378 | cds | 221 | 221 | 282 | hp | ||||
comp | 4023600..4025129 | cds | 1530 | lysine--tRNA ligase | ||||||
dir | 4135881..4136873 | cds | 383 | 383 | 993 | DNA replication protein DnaC | ||||
comp | 4137257..4137331 | aca | 33 | 33 | 75 | |||||
comp | 4137365..4137440 | gta | 4 | 4 | 76 | |||||
comp | 4137445..4137519 | gaa | 6 | 6 | 75 | |||||
comp | 4137526..4137601 | aaa | 331 | 331 | 76 | 331 | ||||
comp | 4137933..4139222 | cds | 1290 | adenylosuccinate synthase | ||||||
dir | 4178197..4178970 | cds | 179 | 179 | 774 | SigB/SigF/SigG family RNA polymerase sigma factor | ||||
dir | 4179150..4180587 | 16s | 161 | 1438 | ||||||
comp | 4180749..4180865 | 5s | 201 | 117 | ||||||
comp | 4181067..4183959 | 23s | 217 | 2893 | ||||||
comp | 4184177..4185684 | 16s | 108 | 1508 | ||||||
comp | 4185793..4185869 | atgi | 11 | 11 | 77 | |||||
comp | 4185881..4185969 | tta | 5 | 89 | ||||||
comp | 4185975..4186091 | 5s | 201 | 117 | ||||||
comp | 4186293..4189192 | 23s | 375 | 2900 | ||||||
comp | 4189568..4189643 | gca | 52 | 76 | ||||||
comp | 4189696..4190959 | 16s’ | @4 | 100 | 1264 | |||||
dir | 4191060..4192225 | 16s’ | 52 | 1166 | ||||||
dir | 4192278..4192353 | gca | 248 | 76 | ||||||
dir | 4192602..4193197 | 23s° | 100 | 596 | ||||||
dir | 4193298..4193874 | 16s° | 321 | 577 | ||||||
dir | 4194196..4196423 | 23s’ | 100 | 2228 | ||||||
dir | 4196524..4197091 | 16s° | 320 | 568 | ||||||
dir | 4197412..4199044 | 23s° | 100 | 1633 | ||||||
dir | 4199145..4201593 | 23s’ | 126 | 2449 | ||||||
dir | 4201720..4201836 | 5s | 127 | 127 | 117 | 127 | ||||
dir | 4201964..4202473 | cds | 510 | transcription repressor NadR | ||||||
dir | 4205417..4205872 | cds | 0 | 0 | 456 | 0 | nucleoside deaminase | |||
dir | 4205873..4205964 | tcc | @5 | 37 | 92 | |||||
dir | 4206002..4206266 | ncRNA | 76 | 76 | 265 | |||||
dir | 4206343..4207980 | cds | 1638 | DNA polymerase III subunit gamma/tau | ||||||
comp | 4209435..4210639 | cds | 496 | 496 | 1205 | glycosyl transferase | ||||
4211136..4212643 | 16s | 321 | 1508 | |||||||
4212965..4213127 | 23s° | 100 | 100 | 163 | 100 | |||||
<>comp | 4213228..4213849 | cds | 111 | 622 | CHAP domain-containing protein | |||||
comp | 4213961..4214620 | cds | 228 | 228 | 660 | 228 | type A-1 chloramphenicol O-acetyltransferase | |||
dir | 4214849..4216199 | 16s | 321 | 1351 | ||||||
dir | 4216521..4217008 | 23s° | 101 | 488 | ||||||
comp | 4217110..4218529 | 23s° | 250 | 1420 | ||||||
comp | 4218780..4218855 | gca | 52 | 76 | ||||||
comp | 4218908..4219471 | 16s° | 100 | 564 | ||||||
comp | 4219572..4219856 | 23s° | 217 | 285 | ||||||
comp | 4220074..4221581 | 16s | 179 | 179 | 1508 | 179 | ||||
>comp | 4221761..4222206 | cds | 386 | 386 | 446 | 386 | B/F/G family RNA polymerase sigma-70 factor | |||
dir | 4222593..4224100 | 16s | 321 | 1508 | ||||||
dir | 4224422..4227321 | 23s | 181 | 2900 | ||||||
dir | 4227503..4227619 | 5s | 6 | 117 | ||||||
dir | 4227626..4227700 | aac | 6 | 6 | 75 | |||||
dir | 4227707..4227792 | tta | 15 | 15 | 86 | |||||
dir | 4227808..4227883 | atgf | 7 | 7 | 76 | |||||
dir | 4227891..4227965 | gaa | 9 | 9 | 75 | |||||
dir | 4227975..4228048 | gga | 5 | 5 | 74 | |||||
dir | 4228054..4228129 | gta | 5 | 5 | 76 | |||||
dir | 4228135..4228211 | gac | 9 | 9 | 77 | |||||
dir | 4228221..4228295 | aca | 14 | 14 | 75 | |||||
dir | 4228310..4228394 | tac | 10 | 10 | 85 | |||||
dir | 4228405..4228488 | cta | 28 | 28 | 84 | |||||
dir | 4228517..4228593 | aga | 7 | 7 | 77 | |||||
dir | 4228601..4228676 | caa | 89 | 89 | 76 | |||||
dir | 4228766..4228854 | tca | 3 | 3 | 89 | |||||
dir | 4228858..4228933 | ttc | 6 | 6 | 76 | |||||
dir | 4228940..4229016 | atgj | 11 | 11 | 77 | |||||
dir | 4229028..4229104 | atgi | 29 | 29 | 77 | |||||
dir | 4229134..4229210 | cca | 7 | 7 | 77 | |||||
dir | 4229218..4229294 | cac | 8 | 8 | 77 | |||||
dir | 4229303..4229378 | aaa | 353 | 76 | ||||||
comp | 4229732..4229848 | 5s | 126 | 117 | ||||||
comp | 4229975..4232010 | 23s' | 582 | 2036 | ||||||
dir | 4232593..4234098 | 16s | @6 | 217 | 1506 | |||||
dir | 4234316..4237215 | 23s | 126 | 2900 | ||||||
dir | 4237342..4237458 | 5s | 216 | 216 | 117 | 216 | ||||
comp | 4237675..4238859 | cds | 372 | 372 | 1185 | pyridoxal phosphate-dependent aminotransferase | ||||
dir | 4239232..4241583 | cds | 21 | 21 | 2352 | anaerobic ribonucleoside triphosphate reductase | ||||
dir | 4241605..4242144 | cds | 778 | 778 | 540 | anaerobic ribonucleoside-triphosphate reductase activating protein | ||||
dir | 4242923..4244459 | 16s | @7 | 261 | 1537 | |||||
dir | 4244721..4247619 | 23s | 201 | 2899 | ||||||
dir | 4247821..4247937 | 5s | 5 | 117 | ||||||
dir | 4247943..4248031 | tta | 11 | 11 | 89 | |||||
dir | 4248043..4248119 | atgi | 108 | 77 | ||||||
dir | 4248228..4249735 | 16s | 184 | 1508 | ||||||
dir | 4249920..4250564 | 23s° | 100 | 100 | 645 | 100 | ||||
<dir | 4250665..4250923 | cds | 112 | 112 | 259 | 112 | hp | |||
comp | 4251036..4253145 | 23s’ | 375 | 2110 | ||||||
comp | 4253521..4253596 | gca | 52 | 76 | ||||||
comp | 4253649..4254226 | 16s° | 282 | 282 | 578 | |||||
dir | 4254509..4254712 | cds | 12 | 12 | 204 | hp | ||||
dir | 4254725..4256002 | cds | 1278 | phage portal protein |
cdc8 cumuls
- Lien tableur: cdc8 cumuls
- Liens internes: cdc8 opérons
- Légende:
- - avec et sans rRNA, fréquences des intercalaires dans les clusters avec rRNA ou sans rRNA.
- - cdsd, je ne choisis que le cds avec l'intercalaire le plus faible d'un cluster donné, en supposant que ce cds a été créé par le cluster lors des conversions.
- - cdsa, longueur du cds en aas ici. C'est le cdsa de cdc8 opérons divisé par 3.
- - 1 : occurences exclues de la moyenne. Sont exclus de la moyenne les jaunes 554 de cdc8 opérons.
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | ||
avec rRNA | opérons | 21 | 1 | 0 | 1 | 4 | 1 | 3 | 100 | 6 | |
16 23 5s 0 | 4 | 20 | 2 | 77 | 50 | 2 | 20 | 0 | 200 | 8 | |
16 gca 235 | 2 | 40 | 1 | 6 | 100 | 7 | 40 | 0 | 300 | 11 | |
16 23 5s a | 5 | 60 | 0 | 150 | 5 | 60 | 0 | 400 | 5 | ||
max a | 43 | 80 | 1 | 200 | 5 | 80 | 2 | 500 | 5 | ||
a doubles | 2 | 100 | 3 | 250 | 6 | 100 | 3 | 600 | 5 | ||
autres | 10 | 120 | 0 | 300 | 5 | 120 | 3 | 700 | 1 | ||
total aas | 98 | 140 | 0 | 350 | 4 | 140 | 1 | 800 | 1 | ||
sans | opérons | 6 | 160 | 0 | 400 | 4 | 160 | 1 | 900 | 1 | |
1 aa | 5 | 180 | 0 | 450 | 0 | 180 | 1 | 1000 | 0 | ||
max a | 4 | 200 | 0 | 500 | 2 | 200 | 1 | 1100 | 0 | ||
a doubles | 0 | 0 | 4 | 7 | 1 | ||||||
total aas | 9 | 3 | 87 | 48 | 22 | 44 | |||||
total aas | 108 | ||||||||||
remarques | 7 | ||||||||||
avec jaune | moyenne | 14 | 13 | 256 | 155 | 330 | |||||
variance | 16 | 252 | 109 | 234 | |||||||
sans jaune | moyenne | 10 | 182 | 208 | |||||||
variance | 6 | 117 | 97 |
cdc8 blocs
- Lien tableur: cdc8 blocs
- Lien cdc blocs: La colonne "Bloc type" de cdc8 blocs correspond aux types définis dans cdc blocs.
- Légende
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 23s°: 23S ribosomal RNA rRNA prediction is too short
- - cca: remarques @2 et @3.
- Notes:
- - Je définis le type de bloc en comparant avec un bloc de cdc_bloc ayant approximativement les mêmes intercalaires et quand c'est possible les tRNAs identiques qui l'accompagnent. L'identification des tRNAs est faite dans la comparaison entre cdc et cdc 8 dans 43aas, 18aas et 9aas.
- - Les groupes de clusters. Un groupe de cluster à rRNA, et ici avec les débris de rRNA aussi, est un ensemble de rRNAs espacés de tRNAs et de cds par des intercalaires faibles, inférieurs à 778 pbs ici. Les 2 intercalaires des cds terminaux peuvent être très élevés, indiquant que le cds n'est pas sous l'influence de la conversion appliquée au cluster. Au total cdc8 a 9 groupes dont 6 avec un seul bloc, et 3 avec plus de 2 comprenant la quasi totalité des rRNAs, 40/46.
- Les solitaires, 6 dont 5 bien typés, I2 I3 II III et X1.
- Le groupe à 2 blocs, IV1 et IV2 bien typés.
- Le groupe à 15 rRNAs dans lequel je n'ai pu typé que 2 blocs, I1 et VII1.
- Le groupe à 23 rRNAs dans lequel je n'ai pu typé que 3 blocs, I4 IV3 IV4.
- Le type IV4, 16s23s5s-tta-atgi, n'existe pas dans psor mais est ajouté ici parce qu'il est semblable aux types IV, 16s23s5s suivi de tRNAs. Mais en plus avec tta-atgi il est comparable aussi aux types VII1 et VIII1. Ce point est important quand on considère l'origine de cdc8 comme croisement de cdc et psor. Ce type IV4 va en faveur d'une évolution de cdc vers psor en passant par cdc8.
Bloc type | groupes | intercal | Bloc type | groupes | intercal | Bloc type | groupe | intercal |
---|---|---|---|---|---|---|---|---|
cds | 554 | cds | 150 | cds | 496 | |||
cds | 0 | aca | 93 | 16s | 321 | |||
cds | 167 | 23s | 184 | 23s° | 100 | |||
23s° | 132 | III | 16s | 374 | cds | 111 | ||
IV2 | 5s | 6 | cds | cds | 228 | |||
aac | 4 | 16s | 321 | |||||
**16aas | 7 | cds | 452 | 23s° | 101 | |||
atgj | 114 | 5s | 125 | 23s° | 250 | |||
IV1 | 16s | 0 | 23s | 261 | gca | 52 | ||
cds | 100 | I2 | 16s | 190 | 16s° | 100 | ||
23s° | 181 | cds | 23s° | 217 | ||||
5s | 6 | 16s | 179 | |||||
aac | 6 | cds | 118 | cds | 386 | |||
**41aas | 12 | 5s | 126 | IV3 | 16s | 321 | ||
gta | 75 | 23s | 321 | 23s | 181 | |||
cds | 308 | I3 | 16s | 292 | 5s | 6 | ||
cds | cds | aac | 6 | |||||
**17aas | 8 | |||||||
cds | 281 | cds | 179 | aaa | 353 | |||
16s° | 100 | 16s | 161 | 5s | 126 | |||
23s° | 126 | 5s | 201 | 23s' | 582 | |||
X1 | 5s | 7 | I1 | 23s | 217 | I4 | 16s | 217 |
aac | 6 | 16s | 108 | 23s | 126 | |||
**7aas | 9 | atgi | 11 | 5s | 216 | |||
aga | 954 | tta | 5 | cds | 372 | |||
cds | 5s | 201 | cds | 21 | ||||
23s | 375 | cds | 778 | |||||
cds | 733 | VII1 | gca | 52 | IV4 | 16s | 261 | |
cds | 1 | 16s’ | 100 | 23s | 201 | |||
23s° | 126 | 16s’ | 52 | 5s | 5 | |||
5s | 177 | gca | 248 | tta | 11 | |||
cds | 23s° | 100 | atgi | 108 | ||||
16s° | 321 | 16s | 184 | |||||
cds | 238 | 23s' | 100 | 23s° | 100 | |||
II | 16s | 320 | 16s° | 320 | cds | 112 | ||
23s | 91 | 23s° | 100 | 23s’ | 375 | |||
gga | 8 | 23s’ | 126 | gca | 52 | |||
5s | 273 | 5s | 127 | 16s° | 282 | |||
cds | cds | cds |
cdc8 cdc psor 43
- Lien tableur: cdc8 cdc psor 43
- Lien cdc psor: le tableau de comparaison cdc-psor
- Légende
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 23s°: 23S ribosomal RNA rRNA prediction is too short
- - cca: marque les tRNAs différents entre les 2 génomes.
- - diff pour différence entre les intercalaires (intercal) cdc moins cdc8.
- - séquences identiques (bordure épaisse): Une séquence identique entre les 2 génomes est encadrée par 2 tRNAs différents (cyan) dans l'un et par 2 bordures épaisses dans l'autre.
- Notes:
- - identité entre cdc et cdc8 avec de rares différences faibles entre les intercalaires.
- - Aussi on retrouve les différences entre cdc et psor dans le tableau de droite.
|
|
cdc8 cdc psor 18
- Lien tableur: cdc8 cdc psor 18
- Lien cdc psor: le tableau de comparaison cdc-psor
- Légende
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 23s°: 23S ribosomal RNA rRNA prediction is too short
- - cca: marque les tRNAs différents entre les 2 génomes.
- - diff pour différence entre les intercalaires (intercal) colonne de droite moins colonne de gauche.
- - séquences identiques (bordure épaisse): Une séquence identique entre les 2 génomes est encadrée par 2 tRNAs différents (cyan) dans l'un et par 2 bordures épaisses dans l'autre.
- Notes:
- - Sont comparés ici des suite de longueurs équivalentes entre les 3 génomes, 18aas 19aas 23aas,
- - avec 4 comparaisons cdc8 18aas/cdc 18aas, cdc8 19aas/psor 23aas, cdc8 18aas/psor 23aas, cdc8 19aas/cdc8 18aas,
- - cdc8 18aas et cdc 18aas sont identiques alors que, en intra, cdc8 19aas est très différent de cdc8 18aas.
- - cdc8 18aas est quasiment inclus dans psor 23aas: les 14 tRNAs de la fin de cdc8 se trouvent en fin de psor avec une seule insertion dans psor, mais les différences entre intercalaires sont élevées comme entre cdc et psor.
|
|
cdc8 cdc psor 9
- Lien tableur: cdc8 cdc psor 9
- Lien cdc psor: le tableau de comparaison cdc-psor
- Légende
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 23s°: 23S ribosomal RNA rRNA prediction is too short
- - cca: marque les tRNAs différents entre les 2 génomes.
- - diff pour différence entre les intercalaires (intercal) colonne de droite moins colonne de gauche.
- - séquences identiques (bordure épaisse): Une séquence identique entre les 2 génomes est encadrée par 2 tRNAs différents (cyan) dans l'un et par 2 bordures épaisses dans l'autre.
- Notes:
- - Sont comparés ici des suites courtes, en intra cdc8 18aas/9aas et 19aas/9aas, cdc8 9aas/cdc 9aas et cdc8 VII1/psor VII1.
- - cdc8 9aas et cdc 9aas sont identiques
- - cdc8 9aas se retrouve entièrement (sauf 1 tRNA) dans cdc8 19aas avec cependant des diff élevés, mais il est très différent de cdc8 18aas (4 tRNAs différents).
- - La comparaison cdc8 VII1/psor VII1: le groupe de psor à 3 blocs 16s-gca-23s5s est caractérisé en plus par la séquence courte tta-atg (atg supposé atgi). On retrouve le bloc du milieu, VII1 dans cdc8, à l'envers (compléments) et on retrouve partiellement le bloc de fin VIII1 à l'endroit. Dans cdc8 ces blocs sont partiellement abîmés et se trouvent dans le groupe à 15 rRNAs (voir cdc8_blocs). Attention aux diff qui suivent le changement de sens.
- - 3 intercalaires sont préservés entre cdc8 VII1 et celui de psor, 16s-gca 5s-tta tta-atgi. De même pour 16s-gca du bloc VIII1.
|
|
cdc8 cdc protéines
- Notes:
- - L'altération poussée des rRNAs dans cdc8 qui saute aux yeux quand on comapre les blocs en tRNAs et intercalaires, m'a poussé à comparer les tailles en pbs ici des rRNAs et des cds qui les entourent avec l'idée que ces cds sont issus de la conversion de ces rRNAs. D'où l'idée de création de gène par conversion à l'instar du processus CRISPR.
Alignement sur cdc
- Lien tableur: Alignement sur cdc
- Lien noms abrégés
- Légende: abrégé pour noms abrégés des protéines.
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 23s°: 23S ribosomal RNA rRNA prediction is too short
- - SigB: Protéine existant dans cdc et cdc8 mais est décalée dans cdc8 par les grands remaniements. Voir alignement sur cdc8, tableau qui suit.
- Notes:
- - cdc présente 15 clusters avec ou sans rRNAs. 5 clusters sans rRNAs sont reproduits tels quels dans cdc8. Les clusters avec rRNAs se répartissent en 3 16sgca23s et 7 16s23s. Dans cdc8 les 3 16sgca23s sont modifiés ou altérés, 3 16s23s sont altérés et les 4 autres sont reproduits tels quels.
- - Les 3 16sgca23s5s perdent leur gca mais gardent le 5s. Deux sont durement altérés dont un porte une séquence de 9 tRNAs et l'autre rien. La modification du 3ème consiste en la suppression du gca seulement sans tocher le reste. Cependant l'intercalaire 16s-23s de 415 pbs dans cdc est divisé par 2 dans cdc8, 217 pbs.
- - Les 3 16s23s5s altérés le sont fortement, 2 portent des séquences longues de tRNAs, 43 et 18, le 3ème est sans tRNAs.
- - La colonne "ordre dans cdc" servira à repérer les grands remaniement quand je ferai l'alignement sur cdc8. De même pour les protéines en bleu foncé.
- - cdc présente 15 clusters avec ou sans rRNAs. 5 clusters sans rRNAs sont reproduits tels quels dans cdc8. Les clusters avec rRNAs se répartissent en 3 16sgca23s et 7 16s23s. Dans cdc8 les 3 16sgca23s sont modifiés ou altérés, 3 16s23s sont altérés et les 4 autres sont reproduits tels quels.
|
|
Alignement sur cdc8
- Lien tableur: Alignement sur cdc8
- Lien noms abrégés
- Légende:
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 23s°: 23S ribosomal RNA rRNA prediction is too short
- - SigB: Protéine existant dans cdc et cdc8 mais est décalée dans cdc8 par les grands remaniements. Voir alignement sur cdc, tableau précédent.
- Notes:
- - Ici je n'ai pas fait de parallélisme cdc8/cdc. Il suffit de voir la colonne ordre de cdc décrit dans le tableau précédent (alignement sur cdc) pour se rendre compte des grands remaniements du chromosome. Dans cette colonne j'ai ajouté "insert" pour insertion par rapport à cdc.
- - Pour comparer cdc8 à psor pour certains clusters j'ai du intervertir l'ordre des tableaux, le tableau de gauche doit être la suite de celui de droite.
- - Les insertions accumulent les 2 grands groupes qu'on a vu dans cdc8-blocs, à 15 et 23 rRNAs. Par contre en dehors des insertions on trouve 3 groupes altérés à 1 ou 2 clusters, et tous les groupes non altérés sauf l'ordre 5 de cdc.
- - comparaison avec psor: on devine les types VI VII VIII, mais il y a de nouveau type le IV4 par exemple qu'on a signalé dans cdc8-blocs.
|
|
cdc8 cdc création de cds
- Lien tableur: cdc8 cdc création de cds
- Lien abrégé
- Notes:
- - Dans la colonne abrégé sont marqués les cds spécifiques à cdc8, cyan dans Alignement sur cdc8.
- - Certains de ces cds, étant donné leur position dans un bloc de rRNAs dégradés, seraient des candidats de gènes créés de novo lors des conversions qui ont altéré ce bloc. Il est évident qu'on peut toujours rétorquer que ce gène a été copié ou intégré à ce niveau par la conversion. Mais si ce gène ou plusieurs n'existaient pas dans cdc mais seulement dans cdc8, alors l'hypothèse de création de novo serait renforcée.
- - 7 gènes de cdc8, Y-r1 Helix xylose seleno CHAP A-1chlor sigB2, répondent aux critères de la conversion mais n'existent pas dans cdc. Ces cds sont colorés en jaunes et repérés par leur taille en pbs.
- - 4 gènes parmi les 7, seleno CHAP A-1chlor sigB2, n'existent qu'en un seul exemplaire, et ne peuvent donc être extraits à la limite que d'un cds hypothétique, hypothetical protein.
- - Les 3 gènes restants, Y-r1 Helix xylose, ont des cds analogues, c.a.d portant le même nom dans mes recherches et pourraient être extraits de ces analogues d'autant plus qu'ils ont des noms portant la mention type ou domaine.
- - Le gène PhagePP est à la limite du critère de conversion puisqu'il est en fin de bloc mais séparé de 12 pbs du cds hp-204 qui est plus proche de la création de novo puisqu'il est hypothétique. Il appartiendrait au 2ème groupe de gènes ayant des analogues. Cependant j'ai trouvé un gène dans cdc et un gène dans psor qui ont des tailles quasi identiques. Aussi j'ai recherché les cdcs encadrant ces gènes, ils sont tous différents dans les 3 génomes. PhagePP serait analogue donc à Y-r1 Helix xylose.
- Le nom complet du cds Clp est "Clp protéase" et celui de PhageHM est "phage head morphogenesis, SPP1 gp7 family domain protein".
- - J'ai inclue aussi 2 cds appartenant à un cluster sans rRNA, Y-r2 et fdhA. Y-r2 avec sa taille de 1446 se comporte comme Y-r1, il n'existe pas dans cdc. fdhA est le contre exemple de cds qui n'est pas créé de novo, il n'est pas dans une zone altérée par la conversion des rRNA, et il existe dans cdc, mais pas dans psor qui est plus loin phylogénétiquement.
abrégé | cdc8 | pbs | cdc | pbs | psor | pbs |
---|---|---|---|---|---|---|
seleno A | 309950..310076 | 127 | 0 | - | ||
Y-r | 457663..457878 | 216 | 457207..457422 | 216 | - | |
1237414..1237986 | 573 | 1223841..1224413 | 573 | |||
1291413..1292327 | 915 | 1277836..1278750 | 915 | |||
1418672..1419580 | 909 | 1405262..1406170 | 909 | |||
2120221..2121348 | 1128 | |||||
2785863..2786042 | 180 | |||||
3564835..3565434 | 600 | |||||
Y-r2 | 3805298..3806743 | 1446 | ||||
Y-r1 | 4299490..4300134 | 645 | ||||
Helix | 351106..351336 | 231 | 391813..392001 | 189 | - | |
379952..380503 | 552 | 429510..430061 | 552 | |||
456588..456776 | 189 | 461727..462398 | 672 | |||
1187185..1187736 | 552 | 1169984..1170535 | 552 | |||
1466364..1466783 | 420 | 1292255..1292926 | 672 | |||
1467749..1468147 | 399 | 1454375..1454773 | 399 | |||
1605760..1606344 | 585 | 1517855..1518619 | 765 | |||
1694358..1694750 | 393 | 1592306..1592890 | 585 | |||
1936722..1937267 | 546 | 1682266..1682658 | 393 | |||
2105662..2106711 | 1050 | 1695592..1696284 | 693 | |||
2196549..2198204 | 1656 | 1916424..1916630 | 207 | |||
2342487..2342690 | 204 | 1922813..1923358 | 546 | |||
2353934..2354578 | 645 | 2164151..2165806 | 1656 | |||
2378761..2379891 | 1131 | 2308386..2308589 | 204 | |||
2721795..2722316 | 522 | 2319833..2320477 | 645 | |||
3485137..3486024 | 888 | 2344477..2345607 | 1131 | |||
3570953..3571183 | 231 | 2501260..2501931 | 672 | |||
3571660..3571878 | 219 | 2688255..2688776 | 522 | |||
3804379..3804627 | 249 | 3459701..3460588 | 888 | |||
3804878..3805279 | 402 | 3475449..3475589 | 141 | |||
4286854..4287222 | 369 | |||||
4288799..4289518 | 720 | |||||
4300349..4300807 | 459 | |||||
xylose | 3383443..3384780 | 1338 | 3349843..3351180 | 1338 | 0 | |
<4307539..4308225 | 687 | |||||
CHAP | <4213228..>4213849 | 622 | 0 | - | ||
A-1chlor | 4213961..4214620 | 660 | 0 | 0 | ||
SigB2 | 4221761..4222206 | 446 | 0 | 0 | ||
fdHa | 4221761..4222206 | 1701 | 3711229..3713373 | 2145 | - | |
R-deca | 0 | 0 | 127845..129260 | 1416 | ||
876023..877522 | 1500 | |||||
phagePP | 1448919..1449983 | 1065 | 1435547..1436611 | 1065 | 1489507..1490769 | 1263 |
1450539..1450985 | 447 | 1437167..1437613 | 447 | |||
1709611..1711050 | 1440 | 1697521..1698963 | 1443 | |||
1718404..1718844 | 441 | 1708192..1708632 | 441 | |||
3560756..3561910 | 1155 | 3841162..3842367 | 1206 | |||
4254725..4256002 | 1278 | |||||
4260531..4261586 | 1056 | |||||
4262058..4262474 | 417 | |||||
hp-204 | 4254509..4254712 | 204 | ||||
phagePP | 4254725..4256002 | 1278 | ||||
phageHM | 4255980..4256741 | 762 | ||||
hp-543 | 3840525..3841067 | 543 | ||||
phagePP | 3841162..3842367 | 1206 | ||||
hydrolase | 3842345..3842512 | 168 | ||||
terminase | 1487770..1489491 | 1722 | ||||
phagePP | 1489507..1490769 | 1263 | ||||
Clp | 1490762..1491607 | 846 |
cdc8 cdc abrégé protéines
- Lien tableur: cdc8 cdc abrégé protéines
- Légende:
- - Helix: spécifique cdc8
- - R-deca: spécifique psor
- - SigB: délocalisé dans cdc8
abrégé | nom protéine |
---|---|
A-1chlor | type A-1 chloramphenicol O-acetyltransferase |
ABC | ABC transporter ATP-binding protein |
Ala amid | N-acetylmuramoyl-L-alanine amidase |
Art-red | anaerobic ribonucleoside triphosphate reductase |
Art-reda | anaerobic ribonucleoside-triphosphate reductase activating protein |
B6 | pyridoxal phosphate-dependent aminotransferase |
cad | cadmium-translocating P-type ATPase |
CHAP | CHAP domain-containing protein |
CwlD | N-acetylmuramoyl-L-alanine amidase CwlD |
DedA | DedA family protein |
DeoR | DeoR/GlpR transcriptional regulator |
DnaC | DNA replication protein DnaC |
DUF378 | DUF378 domain-containing protein |
fdHa | formate dehydrogenase subunit alpha |
flagellar | flagellar motor protein |
Glyco-tr | glycosyl transferase |
Helix | helix-turn-helix domain-containing protein |
hp-1740 | hp-1740 |
hp-204 | hp-204 |
hp-282 | hp-282 |
hp-414 | hp-414 |
HXXEE | HXXEE domain-containing protein |
III-tau | DNA polymerase III subunit gamma/tau |
K-ligase | lysine--tRNA ligase |
lactam | delta-lactam-biosynthetic de-N-acetylase |
Mannosyl | Mannosyl-glycoprotein endo-beta-N-acetylglucosamidase |
MBOAT | MBOAT family protein |
mecano | mechanosensitive ion channel |
NadR | transcription repressor NadR |
NhaC | Na+/H+ antiporter NhaC family protein |
Nuc-de | nucleoside deaminase |
phagePP | phage portal protein |
PolyI | DNA polymerase I |
precorrin | bifunctional precorrin-2 dehydrogenase/sirohydrochlorin ferrochelatase |
pyruvate | pyruvate carboxylase |
R-deca | arginine decarboxylase |
seleno | glycine/sarcosine/betaine reductase complex selenoprotein A |
SigB | SigB/SigF/SigG family RNA polymerase sigma factor |
SigB2 | B/F/G family RNA polymerase sigma-70 factor |
S-ligase | serine--tRNA ligase |
SrtB | sortase SrtB |
succinate | adenylosuccinate synthase |
TIGR | TIGR00159 family protein |
xylose | xylose isomerase |
Y-r1 | tyrosine-type recombinase/integrase – 1 |
Y-r2 | tyrosine-type recombinase/integrase – 2 |
cdc8 cdc psor stats
- Lien tableur: cdc8 cdc psor stats
- légende
NCBI du 13.11.19 | cdc8 | cdc | psor |
---|---|---|---|
date | 15-MAR-2017 | 18-MAY-2017 | 08-JAN-2018 |
DNA circulaire | 4 308 325 | 4 110 554 | 3 550 458 |
Genes (total) | 4 025 | 3 807 | 3 528 |
CDS (total) | 3 870 | 3 691 | 3 368 |
Genes (coding) | 3 763 | 3 615 | 3 327 |
CDS (coding) | 3 763 | 3 615 | 3 327 |
Genes (RNA) | 155 | 116 | 160 |
RRNAs (5S, 16S, 23S) | 14, 16, 13 | 9, 10, 10 | 17, 17, 17 |
complete rRNAs | 14, 16, 13 | 9, 10, 10 | 17, 17, 17 |
tRNAs | 108 | 83 | 105 |
ncRNAs | 4 | 4 | 4 |
Pseudo Genes (total) | 107 | 76 | 41 |
Pseudo Genes (ambiguous residues) | 0 of 107 | 0 of 76 | 0 of 41 |
Pseudo Genes (frameshifted) | 60 of 107 | 42 of 76 | 4 of 41 |
Pseudo Genes (incomplete) | 35 of 107 | 30 of 76 | 18 of 41 |
Pseudo Genes (internal stop) | 31 of 107 | 18 of 76 | 22 of 41 |
Pseudo Genes (multiple problems) | 18 of 107 | 12 of 76 | 3 of 41 |
CRISPR Arrays | 4 | 9 | - |
Décompte du 19.11.19 | |||
hypothetical protein | 609 | 523 | 1 256 |
hp / cds (total) | 0,16 | 0,14 | 0,37 |
cdc8 remarques
- Lien noms abrégés
- Liens pour ce chapitre: noms abrégés opérons cumuls blocs cdc8 cdc psor 43 cdc8 cdc psor 18 cdc8 cdc psor 9 Alignement sur cdc Alignement sur cdc8.
- Remarques des 7 @ dans opérons :
- @ Dans la comparaison cdc8-cdc du bloc à 18aas, les rRNAs 23s et 16s disparaissent. Les 4 cds récupérés et le 23s° (voir opérons pour les noms et les longueurs des cds)
- - correspondraient à la somme des longueurs de 16s (1500 pbs) et 23s (2900 pbs), soit 4400 pbs
- - correspondraient à la longueur totale entre le 1er cds et le 5s, 4304299-4299490 = 4810 pbs
- - la somme des 4 cds récupérés et du 23s° est de 3875 pbs. Les longueurs des cds en aas sont dans l'ordre 215 153 580 68.
- - Le plus intéressant c'est que, si on suppose que les 2 protéines hypothétiques 580 et 68 sont dues aux remaniements,
- - les 2 protéines qui les précèdent sont qualifiées de type intégrase et de protéine contenant un domaine. C'est comme si les remaniements (certainement des conversions géniques) utilisaient une partie d'un gène protéique comme matrice de copie.
- @ configuration de bloc peu courante, avec gga: même bloc que cdc et psor.
- @ configuration de bloc peu courante, avec aca, et perte de 5s: même bloc que cdc et psor sans 5s.
- @ On retrouve le groupe1 de psor, avec 2 gca: VII1 en comp suivi de VIII1 en dir
- - L’intercalaire 23s-gca de VII1 est de 375, beaucoup plus élevé que celui de psor , 114.
- - De même pour VIII1, 248 contre 114.
- @ Conservation du bloc tcc-ncRNA dans cdc8 cdc et psor, avec les mêmes intercalaires.
- @ Conservation des 3 cds , avec leurs intercalaires, du seul groupe de cdc, mais les gca disparaissent.
- @ Nouveau bloc analogue au VI1 et VII1 de psor, sans gca, et qui n’existe pas chez cdc: 16s23s5s-tta-atgi. Avec ces 2 dernières remarques c'est comme si les remaniements des blocs à RNA consistaient à supprimer les gca des blocs 16sgca23s5s, et en le faisant ils laissaient des morceaux de 16s et 23s.
- @ Dans la comparaison cdc8-cdc du bloc à 18aas, les rRNAs 23s et 16s disparaissent. Les 4 cds récupérés et le 23s° (voir opérons pour les noms et les longueurs des cds)
- Décompte des rRNAs de cdc8 d'après Alignement sur cdc8.
Les RNAs 16s 14 16s’ 2 16s° 5 23s 9 23s’ 4 23s° 11 5s 14 taille d’un bloc normal 16s 16 1508 soit 10/14 23s 13 2900 soit 9/9 5s 14 117 soit 14/14
- Notes:
- - Les autres cds créés création de cds
- - Alignement sur cdc8: cdc8 résulte d'une recombinaison d'une clostridia de type cdc et d'une autre de type psor Alignement sur cdc8
- - Orientation des créations stats: soit création en masse par la mobilité et l'insertion des blocs 16s23s5s (cas de psor) puis dégradation de ces blocs dans une étape intermédiaire (cas de cdc8) qui aboutit à un état stable (cas de cdc), soit création par une évolution progressive de cdc vers psor en passant par cdc8. Le 1er cas serait soutenu la proportion très élevée des hp par rapport au total de 37% (voir stats) alors que le 2ème cas serait soutenu par par le type IV4 de cluster dans cdc8 et n'existe ni dans cdc ni dans psor, 16s23s5s-tta-atgi (voir alignement sur cdc8).
- - Les 3 types de création: avec altération des rRNAs (cdc8), dans les blocs 16s23s5s ou 16s-aaas-23s5s (décompte des cds dans un échantillon de clostridia) et après les blocs à la suite des tRNAs ou non (psor opérons).
- - Hypothèse de la création des gènes
cdc8 distribution
- Lien tableur: cdc8 distribution
- Notes: Tableau Cl32
- - -5s: gga et aca
- - 1-3: 2 tta et 2 atgi
|
|
Clostridium botulinum CDC_297
- Notes: Il n'y a pas de code KEGG pour ce génome, je lui ai donné le code cbc*, mais pour les têtes de chapitre je mets cbc.
cbc opérons
- Lien tableur: cbc* opérons
- Liens: gtRNAdb , NCBI , génome
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae;Clostridium.
- Légende:
- - cyan pour les doubles signalés par le signe + dans la colonne doubles.
- - cds, ce cds a la particularité d'être très court et collé au cluster à rRNA. Il fait 108 pbs et sa séquence est,
MNEGCDRILIVVARWQVSKNKKMLTKIKKRATIIKH. - - @ voir le chapitre remarques de ce génome.
28%GC | 30.6.19 Paris | 52 | doubles | intercal | aa | avec aa |
---|---|---|---|---|---|---|
comp | 1309334..1309408 | gag | ||||
comp | 1385938..1386012 | aac | 8 | |||
comp | 1386021..1386134 | 5s | 108 | |||
comp | 1386243..1389140 | 23s | 228 | |||
comp | 1389369..1390866 | 16s | @1 | |||
comp | 1392997..1393072 | ttc | 7 | |||
comp | 1393080..1393193 | 5s | 108 | |||
comp | 1393302..1396199 | 23s | 228 | |||
comp | 1396428..1397925 | 16s | ||||
comp | 1408673..1408762 | tcc | ||||
comp | 1412183..1412259 | agg | ||||
comp | 1415464..1415540 | cgt | 84 | 84 | ||
comp | 1415625..1415715 | agc | + | 20 | 20 | |
comp | 1415736..1415826 | tca | 2 agc | 306 | 306 | |
comp | 1416133..1416223 | agc | 2 tca | 20 | 20 | |
comp | 1416244..1416334 | tca | @4 | |||
comp | 1425969..1426044 | gca | 3 | 3 | ||
comp | 1426048..1426124 | atgi | 8 | |||
comp | 1426133..1426246 | 5s | 79 | |||
comp | 1426326..1427823 | 16s | @2 | 117 | ||
comp | 1427941..1428051 | cds | ||||
1694943..1695017 | cag | |||||
comp | 1722580..1722664 | tac | 5 | 5 | ||
comp | 1722670..1722745 | aca | ||||
comp | 1841437..1841510 | tgc | ||||
comp | 1842698..1842811 | 5s | 108 | |||
comp | 1842920..1845817 | 23s | 228 | |||
comp | 1846046..1847543 | 16s | ||||
1890534..1890608 | gaa | + | 17 | 17 | ||
1890626..1890701 | gta | 3 gaa | 9 | 9 | ||
1890711..1890787 | gac | 3 gta | 4 | 4 | ||
1890792..1890867 | aca | 3 gac | 5 | 5 | ||
1890873..1890947 | gaa | 2 aca | 18 | 18 | ||
1890966..1891041 | gta | 7 | 7 | |||
1891049..1891125 | gac | 57 | 57 | |||
1891183..1891257 | gaa | 17 | 17 | |||
1891275..1891350 | gta | 9 | 9 | |||
1891360..1891436 | gac | 4 | 4 | |||
1891441..1891516 | aca | |||||
comp | 1948153..1948228 | cca | ||||
1969157..1969245 | tta | 4 | 4 | |||
1969250..1969325 | atgf | + | 53 | 53 | ||
1969379..1969454 | atgf | 2 atgf | 10 | 10 | ||
1969465..1969541 | atg | |||||
1987541..1989040 | 16s | @3 | 226 | |||
1989267..1992166 | 23s | 93 | ||||
1992260..1992375 | 5s | 7 | ||||
1992383..1992457 | aac | + | 27 | 27 | ||
1992485..1992559 | aac | |||||
2013239..2013313 | ggg | 18 | 18 | |||
2013332..2013407 | acc | |||||
2222515..2222590 | tgg | |||||
2294767..2294842 | cca | + | 7 | 7 | ||
2294850..2294923 | gga | 2 cca | 6 | 6 | ||
2294930..2295006 | aga | 2 gga | 5 | 5 | ||
2295012..2295087 | aag | 26 | 26 | |||
2295114..2295189 | cca | 29 | 29 | |||
2295219..2295292 | gga | 24 | 24 | |||
2295317..2295393 | cga | |||||
2402556..2402631 | gta | 5 | 5 | |||
2402637..2402713 | gac | 3 | 3 | |||
2402717..2402792 | ttc | 4 | 4 | |||
2402797..2402871 | ggc | 9 | 9 | |||
2402881..2402954 | tgc | |||||
2517305..2517391 | ttg | |||||
2548708..2548792 | ctc | |||||
2583298..2583388 | tga |
cbc cumuls
- Lien tableur: cbc* cumuls
- Légende
opérons | Fréquences intercalaires tRNAs | ||||
---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | ||
avec rRNA | opérons | 5 | 1 | 0 | 0 |
16 23 5s 0 | 1 | 20 | 22 | 1 | |
16 atc gca | 0 | 40 | 3 | 1 | |
16 23 5s a | 3 | 60 | 2 | 0 | |
max a | 2 | 80 | 0 | 0 | |
a doubles | 1 | 100 | 1 | 0 | |
spéciaux | 1 | 120 | 0 | 0 | |
total aas | 6 | 140 | 0 | 0 | |
sans | opérons | 17 | 160 | 0 | 0 |
1 aa | 10 | 180 | 0 | 0 | |
max a | 11 | 200 | 0 | 0 | |
a doubles | 4 | 0 | 0 | ||
total aas | 46 | 28 | 2 | ||
total aas | 52 | ||||
remarques | 4 | ||||
avec jaune | moyenne | 17 | 15 | ||
variance | 19 | ||||
sans jaune | moyenne | 15 | |||
variance | 14 |
cbc blocs
- Lien tableur: cbc* blocs
- Légende:
aac | 8 | 7 | - | |
5s | 108 | 108 | 108 | 226 |
23s | 228 | 228 | 228 | 93 |
16s | - | 7 | ||
gca | 3 | |||
atgi | 8 | |||
5s | 79 | |||
16s |
cbc remarques
@1 Les 4 blocs 16.23.5.aa ont des intercalaires identiques à 1 base près. - 1 a 0aa, 2 ont 1aa et 1 a 2aas (@3. @2 C’est 1 bloc 16.23.5.aa qui a perdu 23s. - L'intercalaire 5s-aa est le même que pour les 4 blocs de @1. - Il a 2aas dont le 1er est atgi, rare avec les rRNAs. - Il est précédé d'une protéine de 36aas avec un intercalaire de 117. - Est-ce qu'elle appartient à l'opéron? @3 C’est 1 bloc 16.23.5.aa de @1 avec 1 aa double. - L'intercalaire 23-5 est très faible, 14% de moins par rapport à @1, 15/108. @4 Dépassement de la règle des intercalaires, 210 bases, 306. - Il se trouve entre 2 séquences de 2 aas. - Est-ce 2 opérons? Séquences des doubles : - 1 opéron à 1 doublet. - 2 opérons à 2 séquences de 2 aas chacun. - 1 opéron de 11 aas avec 4 séquences de 3 aas, moins 1 aa.
cbc distribution
- Lien tableur: cbc distribution
- Notes:
- - 1-3aas: gca atgi aac ttc aac2
- - >1aa: atgf2
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 2 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 2 | tcc | 1 | tac | 1 | tgc | 2 |
atc | acc | 1 | aac | 3 | agc | 2 | |
ctc | 1 | ccc | cac | cgt | 1 | ||
gtc | gcc | gac | 4 | ggc | 1 | ||
tta | 1 | tca | 2 | taa | tga | 1 | |
ata | aca | 3 | aaa | aga | 1 | ||
cta | cca | 3 | caa | cga | 1 | ||
gta | 4 | gca | 1 | gaa | 3 | gga | 2 |
ttg | 1 | tcg | tag | tgg | 1 | ||
atgj | 1 | acg | aag | 1 | agg | 1 | |
ctg | ccg | cag | 1 | cgg | |||
gtg | gcg | gag | 1 | ggg | 1 | ||
clos | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
cbc* | 36 | 10 | 6* | 52 |
Clostridium botulinum BKT015925
cbn opérons
- Lien tableur: cbn opérons
- Liens: gtRNAdb , NCBI , génome
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae;Clostridium.
- Légende:
- - cyan pour les doubles signalés par le signe + dans la colonne doubles.
- - @ voir le chapitre remarques de ce génome.
28%GC | 30.6.19 Paris | 86 | doubles | intercal | aa | avec aa |
---|---|---|---|---|---|---|
20666..20741 | acg | |||||
36413..36487 | gaa | + | 12 | 12 | ||
36500..36575 | gta | 2 gaa | 13 | 13 | ||
36589..36665 | gac | 2 gta | 5 | 5 | ||
36671..36746 | aca | 2 gac | 18 | 18 | ||
36765..36839 | gaa | 2 aca | 12 | 12 | ||
36852..36927 | gta | 13 | 13 | |||
36941..37017 | gac | 5 | 5 | |||
37023..37098 | aca | |||||
137366..137441 | cca | |||||
161964..162052 | tta | + | 5 | 5 | ||
162058..162133 | atgf | 3 tta | 5 | 5 | ||
162139..162215 | atgj | 3 atgf | 46 | 46 | ||
162262..162350 | tta | 2 atgj | 5 | 5 | ||
162356..162431 | atgf | 30 | 30 | |||
162462..162538 | atgj | 46 | 46 | |||
162585..162673 | tta | 5 | 5 | |||
162679..162754 | atgf | |||||
76258..176332 | aac | |||||
180177..181695 | 16s | @5 | 233 | |||
181929..184836 | 23s | 45 | ||||
184882..184956 | aac | + | 14 | |||
184971..185087 | 5s | 7 | ||||
185095..185169 | aac | 2 aac | ||||
222409..222484 | acc | |||||
comp | 578417..578492 | cag | ||||
comp | 944747..944833 | ttg | ||||
955546..955630 | ctt | |||||
1026946..1027021 | gta | 17 | 17 | 17 | ||
1027039..1027115 | gac | 14 | 14 | 14 | ||
1027130..1027205 | ttc | 4 | 4 | 4 | ||
1027210..1027284 | ggc | 8 | 8 | 8 | ||
1027293..1027367 | tgc | + | 57 | 57 | 57 | |
1027425..1027499 | tgc | 2 tgc | ||||
comp | 2030816..2030890 | aac | 45 | |||
comp | 2030936..2033842 | 23s | 96 | |||
comp | 2033939..2034015 | atc | 7 | 7 | ||
comp | 2034023..2034098 | gca | 121 | |||
comp | 2034220..2035734 | 16s | ||||
comp | 2283768..2283884 | 5s | 95 | |||
comp | 2283980..2286886 | 23s | 233 | |||
comp | 2287120..2288638 | 16s | @3 | 464 | ||
comp | 2289103..2289176 | gga | 15 | 15 | ||
comp | 2289192..2289268 | atc | 7 | 7 | ||
comp | 2289276..2289351 | gca | ||||
comp | 2350598..2350674 | cga | + | 21 | 21 | |
comp | 2350696..2350769 | gga | 4 gga | 28 | 28 | |
comp | 2350798..2350873 | aaa | 2 aaa | 4 | 4 | |
comp | 2350878..2350952 | caa | 2 caa | 4 | 4 | |
comp | 2350957..2351032 | cac | 2 cac | 5 | 5 | |
comp | 2351038..2351112 | aag | 3 aag | 3 | 3 | |
comp | 2351116..2351192 | aga | 3 aga | 6 | 6 | |
comp | 2351199..2351272 | gga | 2 cca | 4 | 4 | |
comp | 2351277..2351352 | cca | 2 ggc | 21 | 21 | |
comp | 2351374..2351449 | aag | 5 | 5 | ||
comp | 2351455..2351531 | aga | 5 | 5 | ||
comp | 2351537..2351610 | gga | 5 | 5 | ||
comp | 2351616..2351690 | ggc | 3 | 3 | ||
comp | 2351694..2351777 | cta | 22 | 22 | ||
comp | 2351800..2351875 | aaa | 4 | 4 | ||
comp | 2351880..2351954 | caa | 4 | 4 | ||
comp | 2351959..2352034 | cac | 5 | 5 | ||
comp | 2352040..2352115 | aag | 5 | 5 | ||
comp | 2352121..2352197 | aga | 5 | 5 | ||
comp | 2352203..2352276 | gga | 5 | 5 | ||
comp | 2352282..2352356 | ggc | 6 | 6 | ||
comp | 2352363..2352438 | cca | ||||
comp | 2432784..2432859 | tgg | ||||
comp | 2454880..2454964 | tac | + | 39 | 39 | |
comp | 2455004..2455079 | gta | 2 tac | 8 | 8 | |
comp | 2455088..2455172 | tac | 4 | 4 | ||
comp | 2455177..2455252 | aca | ||||
comp | 2697795..2697911 | 5s | @1 | 31 | ||
comp | 2697943..2700847 | 23s | 233 | |||
comp | 2701081..2702599 | 16s | ||||
comp | 2703946..2704021 | aaa | 311 | 311 | ||
comp | 2704333..2704408 | ttc | 5 | |||
comp | 2704414..2704530 | 5s | 336 | |||
comp | 2704867..2704942 | ttc | 5 | |||
comp | 2704948..2705064 | 5s | 97 | |||
comp | 2705162..2708066 | 23s | 233 | |||
comp | 2708300..2709814 | 16s | ||||
comp | 2721253..2721328 | aaa | @2 | 5 | ||
comp | 2721334..2721450 | 5s | 95 | |||
comp | 2721546..2724452 | 23s | 233 | |||
comp | 2724686..2726203 | 16s | ||||
comp | 2731902..2731976 | gag | 61 | 61 | ||
comp | 2732038..2732112 | caa | 6 | 6 | ||
comp | 2732119..2732195 | aga | 4 | 4 | ||
comp | 2732200..2732273 | gga | 19 | 19 | ||
comp | 2732293..2732376 | cta | 16 | 16 | ||
comp | 2732393..2732467 | gaa | 4 | |||
comp | 2732472..2732588 | 5s | 97 | |||
comp | 2732686..2735592 | 23s | @4 | 94 | ||
comp | 2735687..2735763 | atc | 3 | |||
comp | 2735767..2735842 | gca | 74 | |||
comp | 2735917..2737435 | 16s | ||||
comp | 2742262..2742351 | tcc | ||||
comp | 2743220..2743312 | tcg | ||||
comp | 2743891..2743967 | agg | ||||
comp | 2748534..2748610 | cgt | 144 | 144 | ||
comp | 2748755..2748845 | agc | 23 | 23 | ||
comp | 2748869..2748959 | tca | + | 69 | 69 | |
comp | 2749029..2749119 | tca | 2 tca | |||
comp | 2758688..2758763 | gca | 4 | 4 | ||
comp | 2758768..2758844 | atgi | 3 | |||
comp | 2758848..2758964 | 5s | 73 | |||
comp | 2759038..2761942 | 23s | 233 | |||
comp | 2762176..2763694 | 16s | ||||
comp | 2150504..2150620 | 5s | 31 | |||
comp | 2150652..2153560 | 23s | 233 | |||
comp | 2153794..2155308 | 16s | ||||
comp | 2169525..2169641 | 5s | 32 | |||
comp | 2169674..2172579 | 23s | 233 | |||
comp | 2172813..2174331 | 16s | ||||
sur plasmide | tgg |
cbn cumuls
- Lien tableur: cbn cumuls
- Légende
opérons | Fréquences intercalaires tRNAs | ||||
---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | ||
avec rRNA | opérons | 10 | 1 | 0 | 0 |
16 23 5s 0 | 3 | 20 | 34 | 9 | |
16 gca atc | 2 | 40 | 7 | 0 | |
16 23 5s a | 4 | 60 | 3 | 0 | |
max a | 8 | 80 | 1 | 1 | |
a doubles | 1 | 100 | 0 | 0 | |
spéciaux | 1 | 120 | 0 | 0 | |
total aas | 22 | 140 | 0 | 0 | |
sans | opérons | 18 | 160 | 1 | 0 |
1 aa | 12 | 180 | 0 | 0 | |
max a | 22 | 200 | 0 | 0 | |
a doubles | 6 | 0 | 0 | ||
total aas | 64 | 46 | 10 | ||
total aas | 86 | ||||
remarques | 5 | ||||
avec jaune | moyenne | 17 | |||
variance | 25 | ||||
sans jaune | moyenne | 14 | 14 | ||
variance | 15 | 17 |
cbn blocs
- Lien tableur: cbn blocs
- Légende:
5s | 31 | 31 | 32 | |||
23s | 233 | 233 | 233 | |||
16s | ||||||
ttc | 5 | |||||
5s | 336 | |||||
aaa | 5 | 3 | ttc | 5 | ||
5s | 95 | 73 | 5s | 95 | 5s | 97 |
23s | 233 | 233 | 23s | 233 | 23s | 233 |
16s | aaa | atgi | 16s | 464 | 16s | |
gga | 15 | |||||
16s | 233 | |||||
23s | 45 | |||||
aac | 14 | |||||
5s | 7 | |||||
aac | ||||||
gaa | 4 | |||||
5s | 97 | aac | 45 | |||
23s | 94 | 23s | 96 | |||
atc | 3 | atc | 7 | |||
gca | 74 | gca | 121 | |||
16s | 16s |
cbn remarques
*Remarques @1 Les 3 opérons 16-23-5s ont les mêmes intercalaires, 233-31 bases. @2 Les 4 opérons 16-23-5s -aa ont tous à peu près les mêmes intercalaires 233-95-5. - Mais ils sont tous différents: + 1 seul opéron répond au critère des intercalaires, il a 1aa. + 1 seul opéron ne répond pas strictement au critère des intercalaires. Ses 3aas sont du côté du 16s et l’intercalaire avec le 1er aa est très Élevé, 464. + L'opéron à 2aas a l'intercalaire 23-5s très faible de 23% inférieur à 95, 22/95. + L'opéron à 3aas répondant aux critères a un 5s en plus. @3 Le critère d’un intercalaire entre 2aas, supérieur à 210 bases, se trouve dans le 4ème opéron à rRNA, mais il est accompagné d’un intercalaire très élevé entre 5s et le 1er aa, comme pour le 2ème opéron à rRNA. @4 C’est un opéron à rRNA atypique : 2aas double entourant le 5s. - Mais coserve l’intercalaire 16-23s de 233 bases comme les 7 opérons de ce type. @5 Les 2 opérons à 16-atc gca présentent, ici, la particularité d’inverser ses 2 aas, gca-atc. - Ils ont aussi, à peu près, les mêmes intercalaires 16-gca-atc-23s, 74 4 94. - L'opéron à rRNA présentant le max d'aas, au nombre de 8, est de ce type. Il a le même intercalaire 23-5s que tous les autres opérons à rRNA, 97 bases. *Séquences des doubles : tous les opérons à plus de 3aas ont des doubles, 6/6. - Les répétitions vont de 5 à 2. - 3 opérons sur 6 ont des séquences qui se répètent, avec 22aas et 2 avec 8aas. - L'opéron contenant le max d'aas, 22, a 2 séquences de 6 aas qui se répètent. - On peut repérer dans cet opéron d'autres séquences de 3 aas. - Ces séquences sont séparées par 1 ou 2 aas différents.
cbn distribution
- Lien tableur: cbn distribution
- Notes:
- - Tableau Cl51: gca, 1-3aas et -16s. aac, 1aa et 1-3aas.
- - Tableau Cl52: 4-8aas, gag caa aga gga cta gaa. >1aa, tgc2 et tca2 en gras.
|
|
Clostridium lentocellum DSM 5427
cle opérons
- Lien tableur: cle opérons
- Liens: gtRNAdb, NCBI , génome
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Lachnospiraceae;Cellulosilyticum.
- Légende:
- - cyan pour les doubles signalés par le signe + dans la colonne doubles.
- - @ voir le chapitre remarques de ce génome.
- Note: il n'y apas de gtRNAdb. Aussi j'ai comparé (EXACT NB.CAR STXT) les 1ers atgf atgi atgj du génome cdc, avec les atg de cle.
34.3%GC | 30.6.19 Paris | 104 | doubles | intercal | aa | avec aa |
---|---|---|---|---|---|---|
10157..10246 | agc | @1 | 202 | |||
10449..11981 | 16s | 72 | ||||
12054..12171 | 5s | 4 | ||||
12176..12248 | gca | 262 | ||||
12511..15414 | 23s | 55 | ||||
15470..15543 | gac | 61 | 61 | |||
15605..15677 | gta | 7 | 7 | |||
15685..15757 | aca | 34 | 34 | |||
15792..15872 | tac | 12 | 12 | |||
15885..15961 | atgj | 3 | 3 | |||
15965..16040 | ttc | 3 | 3 | |||
16044..16116 | aaa | |||||
30118 | ||||||
46235..47767 | 16s | @3 | 21284 | |||
69052..71964 | 23s | |||||
4873 | ||||||
76838..78371 | 16s | 72 | ||||
78444..78561 | 5s | 5 | ||||
78567..78639 | gca | 282 | ||||
78922..81829 | 23s | |||||
904 | ||||||
82734..82851 | 5s | 4 | ||||
82856..82928 | ggc | |||||
1463 | ||||||
84392..85929 | 16s | 72 | ||||
86002..86119 | 5s | 4 | ||||
86124..86196 | gca | 280 | ||||
86477..89386 | 23s | |||||
7380 | ||||||
96767..96884 | 5s | 89 | ||||
96974..97047 | ggc | |||||
5082 | ||||||
102130..102204 | cag | |||||
104716..104799 | tta | 13 | 13 | |||
104813..104898 | tca | |||||
141499..143034 | 16s | 138 | ||||
143173..143290 | 5s | 7 | ||||
143298..143374 | atc | 258 | ||||
143633..146538 | 23s | |||||
150968..151085 | 5s | @4 | 4 | |||
151090..151161 | gaa | 457 | ||||
151619..153160 | 16s | 605 | ||||
153766..156671 | 23s | 475 | ||||
157147..157219 | aaa | 9 | 9 | |||
157229..157299 | gga | 6 | 6 | |||
157306..157379 | aga | |||||
4223 | ||||||
161603..161720 | 5s | 4 | ||||
161725..161797 | ggc | |||||
11104 | ||||||
172902..172973 | gaa | 23 | 23 | |||
172997..173071 | cca | 45 | 45 | |||
173117..173189 | aaa | 11 | 11 | |||
173201..173274 | gac | 56 | 56 | |||
173331..173403 | gta | 7 | 7 | |||
173411..173494 | tta | 187 | 187 | |||
173682..173754 | aca | 26 | 26 | |||
173781..173861 | tac | 10 | 10 | |||
173872..173948 | atgj | 31 | 31 | |||
173980..174052 | ttc | |||||
248498 | ||||||
422551..424086 | 16s | |||||
113898 | ||||||
537985..540890 | 23s | |||||
25153 | ||||||
566044..566117 | cac | 23 | 23 | |||
566141..566212 | caa | 32 | 32 | |||
566245..566330 | tca | |||||
571984..573519 | 16s | 72 | ||||
573592..573709 | 5s | 4 | ||||
573714..573786 | gca | 282 | ||||
574069..576975 | 23s | |||||
25302 | ||||||
602278..603812 | 16s | 137 | ||||
603950..604067 | 5s | |||||
11014 | ||||||
615082..617987 | 23s | |||||
21159 | ||||||
639147..639362 | 16s° | @5 | ||||
98139 | ||||||
737502..737619 | 5s | 4 | ||||
737624..737696 | ggc | |||||
3291 | ||||||
740988..741058 | gga | |||||
759839..759920 | cta | |||||
911999..912083 | ctt | + | 148 | 148 | ||
912232..912316 | ctt | 2 ctt | ||||
1035192..1035265 | cga | |||||
1061152..1061225 | agg | |||||
comp | 1136376..1136448 | ccc | ||||
1229184..1230718 | 16s | @2 | 72 | |||
1230791..1230908 | 5s | 7 | ||||
1230916..1230989 | atc | 53 | 53 | |||
1231043..1231115 | gca | 261 | ||||
1231377..1234282 | 23s | 110 | ||||
1234393..1234464 | aac | + | 9 | 9 | ||
1234474..1234545 | gaa | 2 tgc | 6 | 6 | ||
1234552..1234622 | tgc | 2 aac | 23 | 23 | ||
1234646..1234717 | aac | 58 | 58 | |||
1234776..1234846 | tgc | |||||
1280211..1280283 | atgf | |||||
1283250..1283320 | gga | + | 5 | 5 | ||
1283326..1283399 | aga | 2 gga | 5 | 5 | ||
1283405..1283478 | cac | 2 aga | 31 | 31 | ||
1283510..1283581 | caa | 2 caa | 23 | 23 | ||
1283605..1283677 | aaa | 30 | 30 | |||
1283708..1283792 | cta | 23 | 23 | |||
1283816..1283886 | gga | 5 | 5 | |||
1283892..1283965 | aga | 6 | 6 | |||
1283972..1284043 | caa | |||||
1299560..1299632 | ggc | 4 | 4 | |||
1299637..1299711 | cca | |||||
1346208..1346290 | ctg | |||||
1363346..1363428 | ctg | |||||
1515234..1515305 | gaa | 62 | 62 | |||
1515368..1515442 | cca | 22 | 22 | |||
1515465..1515537 | aaa | |||||
1597292..1597364 | acg | |||||
1611976..1612042 | acg | |||||
2065352..2065425 | ata | |||||
comp | 2090478..2090550 | acc | ||||
2394421..2394501 | tac | 3 | 3 | |||
2394505..2394577 | ttc | |||||
2592342..2592422 | ttg | |||||
2606024..2606104 | ttg | |||||
comp | 2737232..2737304 | gcc | ||||
comp | 2798802..2798874 | aag | ||||
comp | 2881571..2881642 | gag | ||||
comp | 3215471..3215545 | cca | ||||
comp | 3252582..3252655 | atgj | 7 | 7 | ||
comp | 3252663..3252735 | gta | 4 | 4 | ||
comp | 3252740..3252813 | gac | 10 | 10 | ||
comp | 3252824..3252896 | tgg | 20 | 20 | ||
comp | 3252917..3252988 | aac | ||||
683 | ||||||
comp | 3253672..3253748 | atgj | 7 | 7 | ||
comp | 3253756..3253828 | gta | 9 | 9 | ||
comp | 3253838..3253910 | tgg | 18 | 18 | ||
comp | 3253929..3254000 | aac | 60 | |||
comp | 3254061..3256967 | 23s | ||||
362637 | ||||||
comp | 3619605..3619677 | aca | + | 4 | 4 | |
comp | 3619682..3619755 | cgt | 2 cgt | 50 | 50 | |
comp | 3619806..3619879 | cgt | 2 aca | 27 | 27 | |
comp | 3619907..3619990 | tta | 3 | 3 | ||
comp | 3619994..3620069 | gta | 47 | 47 | ||
comp | 3620117..3620190 | gac | 22 | 22 | ||
comp | 3620213..3620289 | atgi | 23 | 23 | ||
comp | 3620313..3620385 | aca | 14 | 14 | ||
comp | 3620400..3620471 | gaa | 9 | 9 | ||
comp | 3620481..3620552 | aac | 110 | |||
comp | 3620663..3623568 | 23s | 261 | |||
comp | 3623830..3623902 | gca | 53 | 53 | ||
comp | 3623956..3624029 | atc | 7 | |||
comp | 3624037..3624154 | 5s | 72 | |||
comp | 3624227..3625761 | 16s | 149 | |||
comp | 3625911..3625999 | tcc | 33 | 33 | ||
comp | 3626033..3626118 | tca | ||||
comp | 3714637..3714709 | gta | 1 | 1 | ||
comp | 3714711..3714787 | atgj |
cle cumuls
- Lien tableur: cle cumuls
opérons | Fréquences intercalaires | ||||
---|---|---|---|---|---|
effectifs | gammes | sans rRNAs | avec rRNAs | ||
avec rRNA | opérons | 19 | 1 | 1 | 0 |
16 5 aa 23 | 5 | 20 | 14 | 15 | |
16 5 atc gca | 2 | 40 | 10 | 6 | |
solo | 11 | 60 | 2 | 5 | |
max a | 14 | 80 | 1 | 1 | |
a doubles | 2 | 100 | 0 | 0 | |
indéterminé | 1 | 120 | 0 | 0 | |
total aas | 46 | 140 | 0 | 0 | |
sans | opérons | 29 | 160 | 1 | 0 |
1 aa | 19 | 180 | 0 | 0 | |
max a | 10 | 200 | 1 | 0 | |
a doubles | 2 | 0 | 0 | ||
total aas | 59 | 30 | 27 | ||
total aas | 105 | ||||
remarques | 5 | ||||
avec jaune | moyenne | 29 | |||
variance | 41 | ||||
sans jaune | moyenne | 19 | 22 | ||
variance | 16 | 19 |
cle blocs
- Lien tableur: cle blocs
- Légende:
Solitaires | |||
16s | *2 | 16s° | @5 |
23s | *3 | ||
5s | 3*4 | 89 | |
ggc | |||
aac | 60 | ||
23s | |||
16s | 137 | ||
5s | |||
16s | 72 | 72 | 72 |
5s | 5 | 4 | 4 |
gca | 282 | 280 | 282 |
23s | |||
agc | 202 | ||
16s | 138 | 16s | 72 |
5s | 7 | 5s | 4 |
atc | 258 | gca | 262 |
23s | 23s | 55 | |
gac | 61 | ||
aac | 110 | ||
16s | 72 | 23s | 261 |
5s | 7 | gca | 53 |
atc | 53 | atc | 7 |
gca | 261 | 5s | 72 |
23s | 110 | 16s | 149 |
aac | 9 | tcc | 33 |
5s | 4 | @4 | |
gaa | 457 | ||
16s | 605 | ||
23s | 475 | ||
aaa | 9 |
cle remarques
Remarques : Pas de blocs 16-23-5s ni de séquence 16-atc-gca-23. @1 5 blocs 16-5-aa-23s avec les mêmes intercalaires, à peu près, 72 4 280. - 4 blocs avec gca dont 3 à 1aa et 1 avec 9aas. - Le bloc à 9aas a un aa avant le 16s, compatible. - 1 bloc avec atc seul et les intercalaires modifiées, 138 7 258. @2 2 blocs 16-5-atc-gca-23s, avec les mêmes intercalaires, 72 7 53 261. - Les 2 blocs contiennent des doubles, 2 paires chacun avec 7 et 14aas. - Le bloc contenant le max de 14aas a 2aas avant le 16s compatibles. @3 Les solos ne contiennent qu’un seul rRNA avec ou sans aas. - 5s-1aa, il y en a 4 et l'intercalaire est équivalente de celle des blocs. - 23s, il y en a 4 dont 1 seul avec 4aas - 16s, 2 sans aas et 1 du 16s5s avec une intercalaire comme le bloc atc, 137. @4 Apparemment un trio de solos. Les 3 intercalaires supérieures à 450 permettent de diviser le groupe en 3 opérons, 5saa avec une intercalaire semblable aux autres 5saa, 23s avec 3aas aux petites intercalaires et 1 16s sasns aas. @5 16s°: 16S ribosomal RNA rRNA prediction is too short Séquences des doubles : très peu de doublons. - 2 opérons avec rRNAs ont des doublons sur 5 possédant au moins 2 aas. - 2 opérons sans rRNAs sur 10 possédant au moins 2 aas. - 4 doublons pour chaque type d'opérons. - 1 seule paire répétée chez les opérons sans rRNAs.
cle distribution
- Lien tableur: cle distribution
- Notes:
- - Tableau Cl61: ctt2 en gras, très rare
- - Tableau Cl62
- 1-3aas: aaa aga gga
- -5s: Ces 5s sont seuls sans 16s ni 23s. Ce sont 4 5s ggc et 1 5s gaa
- Blocs à rRNA: ils ont la forme 16s5saa23s
- cgt2 double en gras
|
|
Heliobacterium modesticaldum Ice1 ATCC 51547
hmo opérons
- Lien tableur: hmo opérons
- Liens: gtRNAdb , NCBI , génome
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Heliobacteriaceae;Heliobacterium.
- Légende: cdsa: cds aas, cdsd: cds dirigé
- - cds : cds inséré dans un cluster avec ou sans rRNA.
57%GC | 24.7.19 Paris | 109 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd |
---|---|---|---|---|---|---|---|---|---|
103699..104088 | CDS | 380 | 130 | ||||||
104469..105695 | CDS | 186 | 186 | 409 | 186 | ||||
comp | 105882..105956 | ggc | 1 | 1 | |||||
comp | 105958..106044 | ctg | 321 | 321 | |||||
comp | 106366..106929 | CDS | @1 | 241 | 241 | 188 | 241 | ||
comp | 107171..107246 | aca | 202 | 202 | 202 | ||||
comp | 107449..108183 | CDS | 111772 | 245 | |||||
comp | 219956..220483 | CDS | 260 | 260 | 176 | 260 | |||
comp | 220744..220820 | gac | 5 | 5 | |||||
comp | 220826..220901 | gta | 10 | 10 | |||||
comp | 220912..220987 | gaa | 4 | 4 | |||||
comp | 220992..221067 | aaa | 18 | 18 | |||||
comp | 221086..221160 | caa | 103 | ||||||
comp | 221264..224182 | 23s | 237 | ||||||
comp | 224420..224495 | gcc | 64 | ||||||
comp | 224560..224676 | 5s | @2 | 328 | |||||
comp | 225005..226536 | 16s | 651 | 651 | |||||
comp | 227188..228162 | CDS | 98792 | 325 | |||||
comp | 326955..328340 | CDS | 178 | 178 | 462 | 178 | |||
comp | 328519..328601 | cta | 65 | 65 | |||||
comp | 328667..328743 | aga | 60 | 60 | |||||
comp | 328804..328880 | cca | 568 | 568 | |||||
comp | 329449..330090 | CDS | 57730 | 214 | |||||
comp | 387821..388105 | CDS | 135 | 135 | 95 | ||||
388241..388317 | ccc | 7 | 7 | ||||||
388325..388410 | tac | 47 | 47 | 47 | |||||
comp | 388458..388742 | CDS | 588493 | 95 | |||||
comp | 977236..978504 | CDS | 439 | 439 | 423 | ||||
comp | 978944..981860 | 23s | 237 | ||||||
comp | 982098..982173 | gcc | 64 | ||||||
comp | 982238..982354 | 5s | 328 | ||||||
comp | 982683..984208 | 16s | 460 | ||||||
comp | 984669..984744 | tgg | @3 | 5 | 5 | ||||
comp | 984750..984824 | cgg | 207 | 207 | 207 | ||||
comp | 985032..987656 | CDS | 26258 | 875 | |||||
comp | 1013915..1014760 | CDS | 105 | 105 | 282 | 105 | |||
comp | 1014866..1014942 | gac | 75 | 75 | |||||
comp | 1015018..1015093 | gaa | 265 | 265 | |||||
comp | 1015359..1016642 | CDS | 40115 | 428 | |||||
1056758..1058014 | CDS | 121 | 121 | 419 | 121 | ||||
comp | 1058136..1058233 | tga | 173 | 173 | |||||
1058407..1058733 | CDS | 62951 | 109 | ||||||
1121685..1122878 | CDS | 588 | 588 | 398 | |||||
1123467..1124998 | 16s | 328 | |||||||
1125327..1125443 | 5s | 64 | |||||||
1125508..1125583 | gcc | 233 | |||||||
1125817..1128734 | 23s | 337 | 337 | 337 | |||||
> | 1129072..1129785 | CDS | 24938 | 238 | |||||
1154724..1155224 | CDS | 99 | 99 | 167 | |||||
1155324..1155413 | tca | 56 | 56 | 56 | |||||
comp | 1155470..1156627 | CDS | 13350 | 386 | |||||
1169978..1171828 | CDS | 129 | 129 | 617 | 129 | ||||
1171958..1172034 | cgt | 85 | 85 | ||||||
1172120..1172196 | agg | 181 | 181 | ||||||
1172378..1172812 | CDS | 62 | 62 | 145 | 62 | ||||
1172875..1172966 | tcg | 548 | 548 | ||||||
1173515..1174330 | CDS | 6655 | 272 | ||||||
comp | 1180986..1182974 | CDS | 444 | 444 | 663 | ||||
1183419..1183512 | tcc | 39 | 39 | 39 | |||||
1183552..1183817 | ncRNA | 11908 | 89 | ||||||
1195726..1195998 | CDS | 181 | 181 | 91 | |||||
1196180..1196255 | gcg | 151 | 151 | 151 | |||||
1196407..1197051 | CDS | 86894 | 215 | ||||||
comp | 1283946..1285331 | CDS | 177 | 177 | 462 | 177 | |||
1285509..1285584 | atgf | 5 | 5 | ||||||
1285590..1285667 | atgj | 7 | 7 | ||||||
1285675..1285750 | gaa | 542 | 542 | ||||||
1286293..1287630 | CDS | 63447 | 446 | ||||||
1351078..1352549 | CDS | 704 | 704 | 491 | |||||
1353254..1354786 | 16s | 252 | |||||||
1355039..1355155 | 5s | 64 | |||||||
1355220..1355296 | atc | 194 | |||||||
1355491..1358408 | 23s | 112 | |||||||
1358521..1358595 | aac | 109 | 109 | 109 | |||||
comp | 1358705..1358926 | CDS | 139555 | 74 | |||||
1498482..1498898 | CDS | 535 | 535 | 139 | |||||
comp | 1499434..1499509 | acg | 238 | 238 | 238 | ||||
1499748..1500836 | CDS | 262182 | 363 | ||||||
1763019..1763858 | CDS | 68 | 68 | 280 | 68 | ||||
1763927..1764003 | gac | 4 | 4 | ||||||
1764008..1764083 | ttc | 3 | 3 | ||||||
1764087..1764161 | ggc | 92 | 92 | ||||||
comp | 1764254..1764493 | CDS | 72 | 72 | 80 | 72 | |||
1764566..1764641 | tgc | 18 | 18 | ||||||
1764660..1764746 | tta | 253 | 253 | ||||||
comp | 1765000..1765467 | CDS | 52131 | 156 | |||||
1817599..1818318 | CDS | 487 | 487 | 240 | |||||
1818806..1820337 | 16s | 252 | |||||||
1820590..1820706 | 5s | 64 | |||||||
1820771..1820847 | atc | 6 | 6 | ||||||
1820854..1820929 | gca | 229 | |||||||
1821159..1824076 | 23s | 112 | |||||||
1824189..1824263 | aac | 6 | 6 | ||||||
1824270..1824345 | atgf | 243 | 243 | 243 | |||||
1824589..1825014 | CDS | 168198 | 142 | ||||||
1993213..1994328 | CDS | 99 | 99 | 372 | |||||
1994428..1994502 | atgi | 41 | 41 | 41 | |||||
1994544..1995368 | CDS | 284281 | 275 | ||||||
2279650..2279997 | CDS | 541 | 541 | 116 | |||||
2280539..2282070 | 16s | 253 | |||||||
2282324..2282440 | 5s | 64 | |||||||
2282505..2282580 | gcc | 234 | |||||||
2282815..2285735 | 23s | 119 | |||||||
2285855..2285948 | tcc | 6 | 6 | ||||||
2285955..2286031 | ccg | 10 | 10 | ||||||
2286042..2286115 | gga | 14 | 14 | ||||||
2286130..2286205 | cac | 1 | 1 | ||||||
2286207..2286281 | tgc | 9 | 9 | ||||||
2286291..2286367 | gtc | 3 | 3 | ||||||
2286371..2286446 | ttc | 6 | 6 | ||||||
2286453..2286537 | tac | 4 | 4 | ||||||
2286542..2286616 | caa | 17 | 17 | ||||||
2286634..2286709 | aaa | 4 | 4 | ||||||
2286714..2286789 | gaa | 5 | 5 | ||||||
2286795..2286870 | gta | 5 | 5 | ||||||
2286876..2286952 | gac | 7 | 7 | ||||||
2286960..2287050 | agc | 43 | 43 | ||||||
2287094..2287170 | ccc | 30 | 30 | ||||||
2287201..2287287 | ctg | 3 | 3 | ||||||
2287291..2287365 | ggc | 4 | 4 | ||||||
2287370..2287446 | cgt | 4 | 4 | ||||||
2287451..2287526 | acc | 352 | 352 | 352 | |||||
2287879..2288343 | CDS | 33184 | 155 | ||||||
comp | 2321528..2322544 | CDS | 268 | 268 | 339 | ||||
comp | 2322813..2322889 | gtc | 9 | 9 | |||||
comp | 2322899..2322973 | cgg | 81 | 81 | 81 | ||||
comp | 2323055..2323243 | CDS | 3375 | 63 | |||||
2326619..2327947 | CDS | 464 | 464 | 443 | 464 | ||||
2328412..2329943 | 16s | 327 | |||||||
2330271..2330387 | 5s | 226 | |||||||
2330614..2333532 | 23s | 98 | |||||||
2333631..2333706 | aaa | 4 | 4 | ||||||
2333711..2333786 | acc | 8 | 8 | ||||||
2333795..2333877 | ctc | 89 | 89 | 89 | |||||
comp | 2333967..2334704 | CDS | 7389 | 246 | |||||
2342094..2342804 | CDS | 155 | 155 | 237 | 155 | ||||
comp | 2342960..2343030 | ttc | 213 | 213 | |||||
2343244..2343936 | CDS | 563 | 563 | 231 | |||||
2344500..2346025 | 16s | 252 | |||||||
2346278..2346394 | 5s | 64 | |||||||
2346459..2346535 | atc | 141 | |||||||
2346677..2349594 | 23s | 100 | |||||||
2349695..2349769 | aac | 6 | 6 | ||||||
2349776..2349851 | atgf | 102 | 102 | 102 | |||||
2349954..2350976 | CDS | 113601 | 341 | ||||||
2464578..2465114 | CDS | 271 | 271 | 179 | 271 | ||||
comp | 2465386..2465461 | aca | 432 | 432 | |||||
2465894..2466226 | CDS | 4722 | 111 | ||||||
2470949..2471977 | CDS | 69 | 69 | 343 | 69 | ||||
2472047..2472133 | ctg | 678 | 678 | ||||||
2472812..2473192 | CDS | 22232 | 127 | ||||||
2495425..2496048 | CDS | 402 | 402 | 208 | |||||
comp | 2496451..2496527 | gtc | 4 | 4 | |||||
comp | 2496532..2496609 | atgj | 175 | 175 | 175 | ||||
2496785..2497120 | CDS | 217 | 217 | 112 | |||||
comp | 2497338..2497420 | ctc | 7 | 7 | |||||
comp | 2497428..2497503 | acc | 18 | 18 | |||||
comp | 2497522..2497596 | tgg | 14 | 14 | |||||
comp | 2497611..2497684 | ggg | 19 | 19 | |||||
comp | 2497704..2497778 | ggc | 7 | 7 | |||||
comp | 2497786..2497873 | ttg | 8 | 8 | |||||
comp | 2497882..2497958 | gtg | -10 | -10 | -10 | ||||
comp | 2497949..2498185 | CDS | 66 | 66 | 79 | 66 | |||
2498252..2498328 | ccg | 314 | 314 | ||||||
comp | 2498643..2499506 | CDS | 55292 | 288 | |||||
2554799..2554984 | CDS | 109 | 109 | 62 | 109 | ||||
2555094..2555169 | gaa | 2 | 2 | ||||||
2555172..2555247 | ttc | 6 | 6 | ||||||
2555254..2555338 | tac | 4 | 4 | ||||||
2555343..2555417 | caa | 18 | 18 | ||||||
2555436..2555511 | aaa | 4 | 4 | ||||||
2555516..2555590 | ggc | 9 | 9 | ||||||
2555600..2555675 | cac | 117 | 117 | ||||||
comp | 2555793..2557049 | CDS | 235940 | 419 | |||||
comp | 2792990..2793442 | CDS | 219 | 219 | 151 | 219 | |||
comp | 2793662..2796583 | 23s | 236 | ||||||
comp | 2796820..2796895 | gca | 6 | 6 | |||||
comp | 2796902..2796978 | atc | 64 | ||||||
comp | 2797043..2797159 | 5s | 328 | ||||||
comp | 2797488..2799019 | 16s | 505 | ||||||
comp | 2799525..2799599 | ggc | + | 1 | 1 | ||||
comp | 2799601..2799687 | ctg | 2 ggc | 32 | 32 | ||||
comp | 2799720..2799796 | ccc | 42 | 42 | |||||
comp | 2799839..2799915 | cgt | 4 | 4 | |||||
comp | 2799920..2799994 | ggc | 120 | 120 | |||||
comp | 2800115..2800192 | atgj | 42 | 42 | |||||
comp | 2800235..2800325 | agc | 16 | 16 | |||||
comp | 2800342..2800417 | atgf | 6 | 6 | |||||
comp | 2800424..2800498 | aac | 7 | 7 | |||||
comp | 2800506..2800581 | gaa | 4 | 4 | |||||
comp | 2800586..2800661 | aaa | 18 | 18 | |||||
comp | 2800680..2800754 | caa | 4 | 4 | |||||
comp | 2800759..2800843 | tac | 91 | 91 | |||||
comp | 2800935..2801011 | gtc | 7 | 7 | |||||
comp | 2801019..2801093 | tgc | 325 | 325 | |||||
2801419..2801724 | CDS | 230813 | 102 | ||||||
3032538..3032729 | CDS | 109 | 109 | 64 | 109 | ||||
comp | 3032839..3035757 | 23s | 233 | ||||||
comp | 3035991..3036066 | gcc | 64 | ||||||
comp | 3036131..3036247 | 5s | 253 | ||||||
comp | 3036501..3038026 | 16s | 779 | 779 | |||||
comp | 3038806..3040017 | CDS | 232 | 404 | |||||
comp | 3040250..3042013 | CDS | 588 |
hmo cumuls
- Lien tableur: hmo cumuls
- Légende:
- - avec et sans rRNA, fréquences des intercalaires dans les clusters avec rRNA ou sans rRNA.
- - cdsd, je ne choisis que le cds avec l'intercalaire le plus faible d'un cluster donné, en supposant que ce cds a été créé par le cluster lors des conversions.
- - cdsa, longueur du cds en aas ici.
- - 1 : occurences exclues de la moyenne. Sont exclus de la moyenne les jaunes 554 de hmo opérons.
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | ||
avec rRNA | opérons | 10 | 1 | 1 | 2 | 1 | 1 | 40 | 1 | 100 | 10 |
16 5s gcc 23 | 5 | 20 | 20 | 34 | 50 | 3 | 80 | 8 | 200 | 16 | |
16 5s atc 23 | 2 | 40 | 0 | 2 | 100 | 11 | 120 | 7 | 300 | 14 | |
16 5 23s a | 1 | 60 | 1 | 3 | 150 | 9 | 160 | 4 | 400 | 8 | |
max a | 20 | 80 | 2 | 0 | 200 | 9 | 200 | 4 | 500 | 11 | |
a doubles | 1 | 100 | 1 | 1 | 250 | 8 | 240 | 4 | 600 | 0 | |
16 5s atc gca | 2 | 120 | 0 | 1 | 300 | 5 | 280 | 4 | 700 | 2 | |
total aas | 60 | 140 | 0 | 0 | 350 | 4 | 320 | 0 | 800 | 0 | |
sans | opérons | 24 | 160 | 0 | 0 | 400 | 1 | 360 | 2 | 900 | 1 |
1 aa | 12 | 180 | 0 | 0 | 450 | 4 | 400 | 0 | 1000 | 0 | |
max a | 7 | 200 | 0 | 0 | 500 | 2 | 440 | 0 | 1100 | 0 | |
a doubles | 0 | 0 | 0 | 11 | 1 | 0 | |||||
total aas | 49 | 21 | 38 | 56 | 32 | 59 | |||||
total aas | 109 | ||||||||||
remarques | 3 | ||||||||||
avec jaune | moyenne | ||||||||||
variance | |||||||||||
sans jaune | moyenne | 8 | 8 | 196 | 137 | 230 | |||||
variance | 6 | 7 | 120 | 71 | 128 |
hmo blocs
- Lien tableur: hmo blocs
- Légende:
- - tgg: L'intercalaire, en jaune aussi, est entre tgg et 16s.
- Notes:
- - Les spécificités gcc atc atc-gca et tRNA avant 16s
- - Homogénéité des intercalaires intra bloc
tgg | |||||
CDS | 541 | 651 | 588 | 779 | 460 |
16s | 253 | 328 | 328 | 253 | 328 |
5s | 64 | 64 | 64 | 64 | 64 |
gcc | 234 | 237 | 233 | 233 | 237 |
23s | 119 | 103 | 337 | 109 | 439 |
tcc | tcc | caa | cds | cds | cds |
CDS | 704 | 563 | CDS | 464 | |
16s | 252 | 252 | 16s | 327 | |
5s | 64 | 64 | 5s | 226 | |
atc | 194 | 141 | 23s | 98 | |
23s | 112 | 100 | aaa | ||
aac | aac | aac | |||
ggc | |||||
CDS | 487 | 505 | |||
16s | 252 | 328 | |||
5s | 64 | 64 | |||
atc | 6 | 6 | |||
gca | 229 | 236 | |||
23s | 112 | 219 | |||
aac | aac | cds |
hmo remarques
- Remarques des 3 @ dans opérons :
- @ Les cds en vert.
- - Ces cds sont insérés dans un cluster avec ou sans rRNA. Ce sont des candidats pour la création. Plus les 2 intercalaires avec les voisins sont petits plus ils sont intéressants. Il y en a 6 dont un seul, *, est accolé à un 16s. Un intercalaire est même négatif, c’est-à-dire que le cds démarre dans le tRNA, adresse 2497949. Dansl’ordre des adresses croissantes les intercalaires sont les suivants : 321-241 181-62 92-72 213-563* 175-217 -10-66.
- - Voir hmo cumuls : 9 intercalaires entre tRNAs dans un cluster ont plus de 40 pbs et 1 fait 120 pbs (adresse 2799920).
- - Dans hmo_opérons j'ai ajouté l'intercalaire entre 2 clusters, qui contient plusieurs autres gènes, pour faire ressortir la proximité des cds intra cluster avec les rRNAs et les tRNAs.
- @ Voir hmo blocs.
- - Il y a 10 blocs avec rRNA et tous sont complets. Cependant le 5s est anormalement positionné entre 16s et 23s au lieu d’être en 3ème position. Ce type de génome est rare, voir les statistiques des blocs à rRNAs.
- - Il n'y a qu'un seul bloc sans aas, adresse 2328412, mais ce génome a 5 blocs sur 10 qui est rare dans cette position, gcc, au lieu de gca, plus courant. Les 4 autres blocs arborent des aas courants dans cette position, 2 atc-gca et 2 atc.
- @ tRNAs avant 16s
- - Des tRNAs se trouvent avant le 16s, adresses 982683 et 2797488, le 1er avec 2 et le 2ème avec 15 tRNAs.
- - Les 2 intercalaires aa-16s sont du même de grandeur général qu'un cds-16s, 460 et 505 pbs ici.
- @ Les cds en vert.
- Séquences des doubles: Voir hmo cumuls :beaucoup de séquences longues et à peine un double dans la séquence 15aas-16s5s-gcc-23s.
- Notes:
- - Les 5 cds, candidats à la création, sont insérés dans des clusters sans rRNAs et 1 seul est collé à 16s.
- - Le 5s est positionné anormalement en 16s5s23s, dans les 10 blocs que possède le génome.
- - Un tRNA intra bloc très rare, gcc au lieu de gca, dans 5 cas sur 10. 4 autres sont courants, 2 atc et 2 atc-gca.
hmo distribution
- Lien tableur: hmo distribution
- Notes: Tableau Cl72,
- - les 1-3aas sont au nombre de 10 et sont soulignés, aac est composé de 1 >3aas et 3 1-3aas alors que aaa est composé respectivement de 3 et 1, et atgf de 2 et 1 respectivement.
- - Les blocs à rRNA sont de la forme 16s5saa23s
|
|
Clostridium beijerinckii strain NCIMB 14988
cbei opérons
- Lien tableur: cbei opérons
- Liens: gtRNAdb [], NCBI , génome []
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae;Clostridium.
- Légende: cdsa: cds aas, cdsd: cds dirigé
- - cyan pour les doubles signalés par le signe + dans la colonne doubles.
- - @ voir le chapitre remarques de ce génome.
- Notes:
- - Les atg ont été résolus en comparant avec ceux de cdc avec stxt. A faire pour psor aussi.
29.65%GC | 29.7.19 Paris | 93 | doubles | intercal | cds | aa | avec aa | cdsa | cdsd |
---|---|---|---|---|---|---|---|---|---|
6477551..6480031 | CDS | 496 | 496 | 827 | |||||
6480528..6482044 | 16s | 213 | |||||||
6482258..6485171 | 23s | 108 | |||||||
6485280..6485394 | 5s | 14 | |||||||
15..91 | atgi | 1 | 1 | ||||||
93..168 | gca | 85 | 85 | 85 | |||||
254..769 | CDS | 1940 | 172 | ||||||
2710..2937 | CDS | 119 | 119 | 76 | 119 | ||||
3057..3147 | tca | + | 30 | 30 | |||||
3178..3268 | agc | 2 tca | 241 | 241 | |||||
3510..3600 | tca | 2 agc | 18 | 18 | |||||
3619..3709 | agc | 125 | 125 | ||||||
3835..4350 | CDS | 9470 | 172 | ||||||
13821..14726 | CDS | 187 | 187 | 302 | |||||
14914..14988 | cgt | 34 | 34 | 34 | |||||
comp | 15023..15913 | CDS | 109014 | 297 | |||||
124928..125338 | CDS | 275 | 275 | 137 | 275 | ||||
125614..125702 | tta | + | 20 | 20 | |||||
125723..125798 | atgf | 4 tta | 7 | 7 | |||||
125806..125882 | atgj | 4 atgf | 6 | 6 | |||||
125889..125977 | tta | 2 atgj | 22 | 22 | |||||
126000..126075 | atgf | 7 | 7 | ||||||
126083..126159 | atgj | 6 | 6 | ||||||
126166..126254 | tta | 21 | 21 | ||||||
126276..126351 | atgf | 70 | 70 | ||||||
126422..126510 | tta | 21 | 21 | ||||||
126532..126607 | atgf | 664 | 664 | ||||||
127272..129683 | CDS | 8954 | 804 | ||||||
138638..140143 | CDS | 307 | 307 | 502 | |||||
140451..140525 | aac | + | 234 | 234 | |||||
140760..140834 | aac | 3 aac | 439 | 439 | |||||
141274..141348 | aac | @6 | 299 | 299 | 299 | ||||
141648..143039 | CDS | 1587 | 464 | ||||||
comp | 144627..145649 | CDS | 543 | 543 | 341 | ||||
146193..147709 | 16s | 140 | |||||||
147850..147925 | gca | 3 | 3 | ||||||
147929..148005 | atc | 111 | |||||||
148117..151030 | 23s | 70 | |||||||
151101..151217 | 5s | 5 | 5 | ||||||
151223..151298 | ttc | 4 | |||||||
151303..151377 | tgc | 167 | 167 | 167 | |||||
151545..151841 | CDS | 25608 | 99 | ||||||
177450..178097 | CDS | 76 | 76 | 216 | |||||
178174..178249 | acc | 65 | 65 | 65 | |||||
178315..179508 | CDS | 134221 | 398 | ||||||
313730..316207 | CDS | 90 | 90 | 826 | 90 | ||||
316298..316382 | cta | 4 | 4 | ||||||
316387..316461 | ggg | 120 | 120 | ||||||
comp | 316582..316986 | CDS | 85487 | 135 | |||||
402474..402953 | CDS | 125 | 125 | 160 | 125 | ||||
403079..403154 | cca | + | 17 | 17 | |||||
403172..403245 | gga | 2* | 149 | 149 | |||||
403395..403471 | aga | cca gga aga | 6 | 6 | |||||
403478..403553 | cca | 16 | 16 | ||||||
403570..403643 | gga | 35 | 35 | ||||||
403679..403755 | aga | 5 | 5 | ||||||
403761..403836 | cac | 3 | 3 | ||||||
403840..403914 | caa | 2* | 7 | 7 | |||||
403922..403997 | aaa | caa aaa cta | 18 | 18 | |||||
404016..404100 | cta | ggc gga | 5 | 5 | |||||
404106..404180 | ggc | 25 | 25 | ||||||
404206..404279 | gga | 5 | 5 | ||||||
404285..404360 | aag | 57 | 57 | ||||||
404418..404492 | caa | 7 | 7 | ||||||
404500..404575 | aaa | 18 | 18 | ||||||
404594..404678 | cta | 5 | 5 | ||||||
404684..404758 | ggc | 25 | 25 | ||||||
404784..404857 | gga | 46 | 46 | ||||||
404904..404980 | cga | 325 | 325 | ||||||
< | 405306..405467 | CDS | 8393 | 54 | |||||
413861..415921 | CDS | 385 | 385 | 687 | |||||
416307..417823 | 16s | @5 | 132 | ||||||
417956..418032 | atc | 84 | |||||||
418117..421031 | 23s | 71 | |||||||
421103..421177 | aac | 345 | 345 | 345 | |||||
421523..422449 | CDS | 63814 | 309 | ||||||
486264..486668 | CDS | 159 | 159 | 135 | 159 | ||||
486828..486912 | tac | + | 9 | 9 | |||||
486922..486997 | gta | 3 tac | 27 | 27 | |||||
487025..487099 | aca | 2 gta | 12 | 12 | |||||
487112..487196 | tac | 2 aca | 9 | 9 | |||||
487206..487281 | gta | 30 | 30 | ||||||
487312..487386 | aca | 12 | 12 | ||||||
487399..487483 | tac | 451 | 451 | ||||||
487935..489110 | CDS | 50956 | 392 | ||||||
540067..540969 | CDS | 187 | 187 | 301 | 187 | ||||
541157..541231 | tgg | 208 | 208 | ||||||
541440..541820 | CDS | 97 | 127 | ||||||
comp | 541918..542985 | CDS | 252 | 252 | 356 | 252 | |||
543238..543312 | tgg | 354 | 354 | ||||||
543667..544683 | CDS | 347735 | 339 | ||||||
892419..893339 | CDS | 560 | 560 | 307 | |||||
893900..895416 | 16s | 137 | |||||||
895554..895629 | gca | 118 | |||||||
895748..898661 | 23s | 204 | |||||||
898866..898982 | 5s | 552 | 552 | 552 | |||||
899535..900446 | CDS | 351 | 304 | ||||||
900798..902048 | CDS | 704 | 704 | 417 | |||||
902753..904269 | 16s | 339 | |||||||
904609..907522 | 23s | 273 | |||||||
907796..907912 | 5s | 69 | 69 | 69 | |||||
comp | 907982..908449 | CDS | 43545 | 156 | |||||
951995..952630 | CDS | 97 | 97 | 212 | 97 | ||||
952728..952813 | ctc | 396 | 396 | ||||||
953210..954919 | CDS | 784414 | 570 | ||||||
1739334..1739933 | CDS | 380 | 380 | 200 | 380 | ||||
1740314..1740389 | cac | 3 | 3 | ||||||
1740393..1740467 | cag | 5 | 5 | ||||||
1740473..1740548 | aaa | 443 | 443 | ||||||
comp | 1740992..1742350 | CDS | 151829 | 453 | |||||
1894180..1895406 | CDS | 34 | 34 | 409 | 34 | ||||
comp | 1895441..1895527 | ttg | 574 | 574 | |||||
1896102..1896794 | CDS | 200701 | 231 | ||||||
2097496..2097915 | CDS | 722 | 722 | 140 | |||||
2098638..2100154 | 16s | 502 | |||||||
2100657..2103569 | 23s | 205 | |||||||
2103775..2103891 | 5s | 315 | 315 | 315 | |||||
2104207..2104905 | CDS | 234313 | 233 | ||||||
2339219..2340322 | CDS | 662 | 662 | 368 | |||||
2340985..2342501 | 16s | 338 | |||||||
2342840..2345755 | 23s | 140 | |||||||
2345896..2345970 | aac | 3 | |||||||
2345974..2346090 | 5s | 429 | 429 | 429 | |||||
2346520..2348088 | CDS | 3574 | 523 | ||||||
2351663..2352139 | CDS | 568 | 568 | 159 | |||||
2352708..2354224 | 16s | 338 | |||||||
2354563..2357477 | 23s | 140 | |||||||
2357618..2357692 | aac | 3 | |||||||
2357696..2357812 | 5s | 90 | 90 | 90 | |||||
2357903..2358316 | CDS | 406783 | 138 | ||||||
2765100..2765525 | CDS | 625 | 625 | 142 | |||||
2766151..2767667 | 16s | 503 | |||||||
2768171..2771082 | 23s | 202 | |||||||
2771285..2771401 | 5s | 5 | |||||||
2771407..2771482 | ttc | 6 | 6 | ||||||
2771489..2771565 | gac | 25 | 25 | ||||||
2771591..2771665 | gaa | 448 | 448 | 448 | |||||
2772114..2774864 | CDS | 781818 | 917 | ||||||
3556683..3557051 | CDS | 565 | 565 | 123 | 565 | ||||
3557617..3557691 | gag | 925 | 925 | ||||||
comp | 3558617..3559759 | CDS | 192275 | 381 | |||||
comp | 3752035..3752652 | CDS | 245 | 245 | 206 | 245 | |||
comp | 3752898..3752985 | agt | @1 | 711 | 711 | ||||
comp | 3753697..3755112 | CDS | 501326 | 472 | |||||
comp | 4256439..4258403 | CDS | 267 | 267 | 655 | 267 | |||
comp | 4258671..4258746 | aaa | 79 | 79 | |||||
comp | 4258826..4258901 | cac | 7 | 7 | |||||
comp | 4258909..4258985 | aga | 35 | 35 | |||||
comp | 4259021..4259094 | gga | 752 | 752 | |||||
4259847..4260392 | CDS | 619853 | 182 | ||||||
comp | 4880246..4880488 | CDS | 508 | 508 | 81 | 508 | |||
comp | 4880997..4881113 | 5s | 274 | ||||||
comp | 4881388..4884300 | 23s | 578 | ||||||
comp | 4884879..4886395 | 16s | 703 | 703 | |||||
comp | 4887099..4888034 | CDS | 1272704 | 312 | |||||
comp | 6160739..6161977 | CDS | 343 | 343 | 413 | ||||
6162321..6162396 | cca | 242 | 242 | 242 | |||||
6162639..6163283 | CDS | 2040 | 215 | ||||||
6165324..6165734 | CDS | 222 | 222 | 137 | |||||
comp | 6165957..6166032 | ttc | 5 | ||||||
comp | 6166038..6166154 | 5s | @2 | 188 | 188 | 188 | |||
6166343..6167074 | CDS | 8085 | 244 | ||||||
comp | 6175160..6175597 | CDS | 249 | 249 | 146 | 249 | |||
comp | 6175847..6175922 | gca | 1 | 1 | |||||
comp | 6175924..6176000 | atgi | 44 | ||||||
comp | 6176045..6176161 | 5s | 138 | ||||||
comp | 6176300..6179216 | 23s | 339 | ||||||
comp | 6179556..6181072 | 16s | 567 | 567 | |||||
comp | 6181640..6182446 | CDS | 223 | 269 | |||||
6182670..6183419 | CDS | 190 | 190 | 250 | 190 | ||||
comp | 6183610..6183685 | aaa | + | 5 | |||||
comp | 6183691..6183807 | 5s | 2 aaa | 159 | 159 | 159 | |||
comp | 6183967..6184914 | CDS | @3 | 294 | 294 | 316 | 294 | ||
comp | 6185209..6185284 | aaa | 7 | ||||||
comp | 6185292..6185408 | 5s | 138 | ||||||
comp | 6185547..6188463 | 23s | 339 | ||||||
comp | 6188803..6190319 | 16s | 771 | 771 | |||||
comp | 6191091..6192203 | CDS | 7306 | 371 | |||||
comp | 6199510..6202059 | CDS | 661 | 661 | 850 | ||||
comp | 6202721..6202837 | 5s | @4 | 139 | |||||
comp | 6202977..6205893 | 23s | 339 | ||||||
comp | 6206233..6207749 | 16s | 1102 | ||||||
comp | 6208852..6208968 | 5s | 138 | ||||||
comp | 6209107..6212023 | 23s | 339 | ||||||
comp | 6212363..6213879 | 16s | 502 | 502 | 502 | ||||
comp | 6214382..6215329 | CDS | 90019 | 316 | |||||
comp | 6305349..6306314 | CDS | 123 | 123 | 322 | 123 | |||
comp | 6306438..6306527 | tcc | 281 | 281 | |||||
comp | 6306809..6307984 | CDS | 66527 | 392 | |||||
6374512..6375684 | CDS | 125 | 125 | 391 | 125 | ||||
comp | 6375810..6375884 | agg | 303 | 303 | |||||
comp | 6376188..6378578 | CDS | 13398 | 797 | |||||
comp | 6391977..6392753 | CDS | 114 | 114 | 259 | 114 | |||
comp | 6392868..6392984 | 5s | 134 | ||||||
comp | 6393119..6396033 | 23s | 214 | ||||||
comp | 6396248..6397764 | 16s | 1120 | ||||||
comp | 6398885..6399001 | 5s | 139 | ||||||
comp | 6399141..6402055 | 23s | 214 | ||||||
comp | 6402270..6403786 | 16s | 748 | 748 | |||||
comp | 6404535..6405107 | CDS | 31702 | 191 | |||||
6436810..6437790 | CDS | 192 | 192 | 327 | |||||
comp | 6437983..6438059 | gac | + | 6 | 6 | ||||
comp | 6438066..6438141 | gta | 3* | 14 | 14 | ||||
comp | 6438156..6438230 | gaa | gac gta | 29 | 29 | ||||
comp | 6438260..6438334 | aca | gaa aca – 1 | 10 | 10 | ||||
comp | 6438345..6438421 | gac | 6 | 6 | |||||
comp | 6438428..6438503 | gta | 16 | 16 | |||||
comp | 6438520..6438594 | gaa | 29 | 29 | |||||
comp | 6438624..6438698 | aca | 10 | 10 | |||||
comp | 6438709..6438785 | gac | 6 | 6 | |||||
comp | 6438792..6438867 | gta | 14 | 14 | |||||
comp | 6438882..6438956 | gaa | 162 | 162 | 162 | ||||
comp | 6439119..6439685 | CDS | 37865 | 189 |
cbei cumuls
- Lien tableur: cbei cumuls
- Légende:
- - avec et sans rRNA, fréquences des intercalaires dans les clusters avec rRNA ou sans rRNA.
- - cdsd, je ne choisis que le cds avec l'intercalaire le plus faible d'un cluster donné, en supposant que ce cds a été créé par le cluster lors des conversions.
- - cdsa, longueur du cds en aas ici.
- - 1 : occurences exclues de la moyenne. Sont exclus de la moyenne les jaunes 554 de cbei opérons.
- Notes:
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | ||
avec rRNA | opérons | 17 | 1 | 0 | 2 | 1 | 0 | 1 | 0 | 100 | 4 |
16 23 5s 0 | 7 | 20 | 34 | 3 | 50 | 2 | 50 | 2 | 200 | 19 | |
16 atc gca | 1 | 40 | 12 | 1 | 100 | 7 | 100 | 6 | 300 | 11 | |
16 23 5s a | 4 | 60 | 2 | 0 | 150 | 7 | 150 | 5 | 400 | 20 | |
max a | 4 | 80 | 2 | 0 | 200 | 9 | 200 | 7 | 500 | 6 | |
a doubles | 1 | 100 | 0 | 0 | 250 | 5 | 250 | 3 | 600 | 3 | |
autres | 6 | 120 | 0 | 0 | 300 | 6 | 300 | 5 | 700 | 2 | |
total aas | 19 | 140 | 0 | 0 | 350 | 6 | 350 | 2 | 800 | 1 | |
sans | opérons | 20 | 160 | 1 | 0 | 400 | 4 | 400 | 1 | 900 | 4 |
1 aa | 11 | 180 | 0 | 0 | 450 | 3 | 450 | 2 | 1000 | 1 | |
max a | 19 | 200 | 0 | 0 | 500 | 2 | 500 | 0 | 1100 | 0 | |
a doubles | 5 | 3 | 0 | 21 | 4 | 0 | |||||
total aas | 74 | 54 | 6 | 72 | 37 | 71 | |||||
total aas | 93 | ||||||||||
remarques | 6 | ||||||||||
avec jaune | moyenne | ||||||||||
variance | |||||||||||
sans jaune | moyenne | 18 | 7 | 350 | 195 | 328 | |||||
variance | 17 | 9 | 225 | 111 | 206 |
cbei blocs
- Lien tableur: cbei blocs
- Légende:
- Notes:
16s | 213 | 503 | 339 | |
23s | 108 | 202 | 138 | |
5s | 14 | 5 | 44 | |
atgi | atgi | ttc | atgi | |
16s | 339 | 502 | 578 | |
23s | 273 | 205 | 274 | |
5s | ||||
aaa | 5 | |||
5s | 159 | 5s | 139 | 134 |
cds | 294 | 23s | 339 | 214 |
aaa | 7 | 16s | 1102 | 1120 |
5s | 138 | 5s | 138 | 139 |
23s | 339 | 23s | 339 | 214 |
16s | 16s | |||
16s | 338 | 338 | 16s | 140 |
23s | 140 | 140 | gca | 3 |
aac | 3 | 3 | atc | 111 |
5s | aac | aac | 23s | 70 |
5s | 5 | |||
ttc | ||||
16s | 137 | 16s | 132 | |
gca | 118 | atc | 84 | |
23s | 204 | 23s | 71 | |
5s | aac | |||
ttc | 5 | |||
5s |
cbei remarques
- Remarques des 6 @ de cbei opérons
- @ Un tRNA très rare même chez les eucaryotes, agt.
- @ Un 5s isolé avec un tRNA.
- @ Les cds candidats à la création
- - Un cds inséré dans un cluster, candidat pour la création. Ses 2 intercalaires sont faibles, 159 et 294, se trouvent dans les 36 1ers sur un total de 72 ( voir cbei cumuls ). C’est une protéine moyenne de 316 aas.
- - Les groupes de 2 clusters réunis par 2 cds. Ces cds sont colorés en vert comme candidats à la création:
- le groupe contenant @3, adresse 6181640, intercalaires des cds 567 223 190, taille en aas 269 250 ;
- le groupe d’ adresse 541440 contient 2 tgg, intercalaires des cds 208 97 252, taille en aas 127 356 ;
- le groupe d’ adresse 899535, intercalaires des cds 552 351 704, taille en aas 304 417 ;
- @ Un cluster à 2 blocs complets en rRNAs, séparés par un intercalaire de 1102 pbs pouvant contenir un protéine moyenne comme @3. Adresse 6202721. Et le même cluster se retrouve à l’adresse 6392868 avec le même intercalaire 1120. Les 2 clusters se différencient, en intra, uniquement par l’intercalaire 23s-5s qui est le même pour les 2 blocs du premier, 339, et pour le deuxième, 214. Ce qui prouve que ce n’est pas une simple copie.
- @ Les blocs 16s-atc-23s5s sont relativement nombreux quand les 16s-atcgca-23s5s existent. Voir la fiche des clostridia. Ici le 5s est remplacé par un tRNA aac ce qui renforce l’hypothèse de 5s comme modèle.
- @ Un rare triplet pour un firmicutes et en plus les 2 intercalaires sont de la même longueur que les 2 intercalaires avec les 2 cds du cluster, 307 234 439 299, alors que la moyenne des intercalaires entre aas, sans rRNA, et sans jaunes n’est que de 18 (écart 17), celle des cds 350 (écart 225), voir cbei cumuls.
- Séquence des doubles
- - Les doubles ne se trouvent que dans les clusters sans rRNAs puisqu’ils totalisent 74 tRNAs sur 93 et les tRNAs des clusters avec rRNA se trouvent à l’intérieur.
- - A part le triplet de @6 les clusters avec des doubles, signalés par le signe +, totalisent 5 sur 8 contenant plus d’un tRNA. Ce ne sont uniquement que des duplications de séquences colorées en cyan ou séparées par une bordure épaisse.
- - Les longueurs des séquences dupliquées sont: 2*2 4*3 1*4 1*5
- Notes
- - Les blocs à rRNAs, voir cbei blocs. Ils sont caractérisés par très peu de tRNAs internes ou externes et par 5 groupes de 2 clusters chacun (@3), totalisant 10 blocs sur 16 . La distribution est la suivante :
- 11 clusters complets sans tRNAs internes
- 2 clusters peu courants avec un tRNA entre 23s et 5s,
- 3 clusters avec tRNAs internes gcaatc gca atc voir la fiche des firmicutes.
- - 7 cds insérés dans les groupes à 2 clusters, candidats à la création .
- - Le 5s perçu comme un modèle dans @5, 16s-atc-23s-aac
- - Beaucoup de duplications dans les clusters sans rRNAs, caractéristique des firmicutes renforcée par la présence
- d’un cluster avec un triplet aux intercalaires de type cds plutôt que tRNAs.
- et des longueurs de séquences dupliquées variables: 2*2 4*3 1*4 1*5.
- Ces longs clusters sans rRNAs seraient alors issus des clusters longs à rRNAs , qui , quand ils existent dans les autres génomes étudiés des firmicutes, présentent des duplications analogues.
- - Les blocs à rRNAs, voir cbei blocs. Ils sont caractérisés par très peu de tRNAs internes ou externes et par 5 groupes de 2 clusters chacun (@3), totalisant 10 blocs sur 16 . La distribution est la suivante :
cbei distribution
- Lien tableur: cbei distribution
- Notes:
- - Tous les +5s sont des 1-3aas
- - aaa es composé de 2 +5s et 4 >1aa
- - gca de 2 +16s, 2 +5s
- - aac de 3 -5s et de 3 >1aa
g1 | t1 | ||||||
---|---|---|---|---|---|---|---|
atgi | 2 | tct | tat | atgf | 4 | ||
att | act | aat | agt | 1 | |||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 3 | tcc | 1 | tac | 3 | tgc | 1 |
atc | 2 | acc | 1 | aac | 6 | agc | 2 |
ctc | 1 | ccc | cac | 3 | cgt | 1 | |
gtc | gcc | gac | 4 | ggc | 2 | ||
tta | 4 | tca | 2 | taa | tga | ||
ata | aca | 4 | aaa | 6 | aga | 3 | |
cta | 3 | cca | 3 | caa | 2 | cga | 1 |
gta | 5 | gca | 4 | gaa | 4 | gga | 5 |
ttg | 1 | tcg | tag | tgg | 2 | ||
atgj | 2 | acg | aag | 1 | agg | 1 | |
ctg | ccg | cag | 1 | cgg | |||
gtg | gcg | gag | 1 | ggg | 1 | ||
clos | >1aa | =1aa | -5s | +5s | -16s | +16s | total |
cbei | 63 | 11 | 3 | 12* | 4 | 93 |
Negativicutes
Acidaminococcus fermentans DSM 20731
afn opérons
- Lien tableur: afn opérons
- Liens: gtRNAdb , NCBI , génome []
- Phylogénie: Bacteria; Firmicutes; Negativicutes; Acidaminococcales; Acidaminococcaceae; Acidaminococcus.
56%GC | 30.6.19 Paris | 60 | doubles | intercalaire |
---|---|---|---|---|
24678..26242 | 16s | @1 | 359 | |
26602..29507 | 23s | 228 | ||
29736..29852 | 5s | |||
36819..36894 | acg | |||
57713..59277 | 16s | 359 | ||
59637..62543 | 23s | 228 | ||
62772..62888 | 5s | |||
169459..169534 | gcc | |||
249791..249867 | agg | |||
comp | 274627..274703 | cgt | ||
311123..311198 | aca | 22 | ||
311221..311305 | tac | 5 | ||
311311..311386 | atg | 3 | ||
311390..311465 | acc | 6 | ||
311472..311548 | atgf | |||
380482..382046 | 16s | 251 | ||
382298..385204 | 23s | 229 | ||
385434..385550 | 5s | |||
461553..461627 | aac | 3 | ||
461631..461705 | gaa | 8 | ||
461714..461789 | gta | 50 | ||
461840..461916 | cca | 11 | ||
461928..462001 | gga | 8 | ||
462010..462086 | aga | |||
526984..527070 | ctg | + | 30 | |
527101..527186 | ctc | 2 ctg | 52 | |
527239..527325 | ctg | |||
578049..578123 | ggc | |||
636984..638548 | 16s | @2 | 94 | |
638643..638719 | atc | 66 | ||
638786..638861 | gca | 273 | ||
639135..642040 | 23s | 139 | ||
642180..642296 | 5s | |||
712229..712304 | cac | 18 | ||
712323..712398 | caa | 3 | ||
712402..712477 | aaa | 16 | ||
712494..712577 | cta | |||
comp | 724421..724497 | gtc | ||
774880..774956 | gac | 4 | ||
774961..775036 | ttc | 8 | ||
775045..775119 | ggc | 9 | ||
775129..775202 | tgc | 13 | ||
775216..775304 | tta | |||
796654..796728 | cgg | |||
842393..842469 | gac | 2 | ||
842472..842547 | ttc | 8 | ||
842556..842630 | ggc | 9 | ||
842640..842713 | tgc | |||
889670..889746 | ccc | |||
906136..906210 | aac | |||
1022783..1022859 | gac | 2 | ||
1022862..1022936 | ggc | 1 | ||
1022938..1023011 | tgg | |||
1555201..1555277 | ccg | |||
comp | 1567911..1567999 | tca | ||
comp | 1613773..1613863 | agc | ||
1702659..1702744 | ttg | |||
comp | 1711770..1711886 | 5s | 228 | |
comp | 1712115..1715021 | 23s | 359 | |
comp | 1715381..1716945 | 16s | ||
comp | 1823852..1823927 | gta | 6 | |
comp | 1823934..1824008 | gaa | 8 | |
comp | 1824017..1824092 | aag | ||
1909446..1909536 | tcc | |||
comp | 1911342..1911429 | tcg | ||
comp | 1974984..1975058 | atgi | ||
comp | 1984782..1984856 | gag | 12 | |
comp | 1984869..1984942 | cag | + | 111 |
comp | 1985054..1985127 | cag | 2 cag | |
comp | 2072279..2072395 | 5s | 228 | |
comp | 2072624..2075529 | 23s | 298 | |
comp | 2075828..2075903 | gca | 66 | |
comp | 2075970..2076046 | atc | 94 | |
comp | 2076141..2077705 | 16s | ||
2148343..2148418 | gcg | |||
comp | 2287117..2287192 | aaa | ||
comp | 2303018..2303094 | gtg | ||
comp | 2323563..2323636 | ggg |
afn cumuls
- Lien tableur: afn cumuls
opérons | Fréquences | ||||
---|---|---|---|---|---|
effectifs | gammes | sans rRNAs | avec rRNAs | ||
avec rRNA | opérons | 6 | 1 | 1 | - |
16 23 5s 0 | 4 | 20 | 21 | ||
16 atc gca | 2 | 40 | 2 | ||
16 23 5s a | 0 | 60 | 2 | ||
max a | 2 | 80 | 0 | ||
a doubles | 0 | 100 | 0 | ||
spéciaux | 0 | 120 | 1 | ||
total aas | 4 | 140 | 0 | ||
sans | opérons | 29 | 160 | 0 | |
1 aa | 20 | 180 | 0 | ||
max a | 6 | 200 | 0 | ||
a doubles | 2 | 0 | |||
total aas | 56 | 27 | 0 | ||
total aas | 60 | ||||
remarques | 2 | ||||
avec jaune | moyenne | 16 | |||
variance | 23 | ||||
sans jaune | moyenne | 12 | |||
variance | 13 |
afn blocs
- Lien tableur: afn blocs
16s | 359 | 1565 | 359 | 1565 | 251 | 1565 |
23s | 228 | 2906 | 228 | 2907 | 229 | 2907 |
5s | 117 | 117 | 117 | |||
16s | 94 | 1565 | 5s | 228 | 117 | |
atc | 66 | 23s | 298 | 2906 | ||
gca | 273 | gca | 66 | |||
23s | 139 | 2906 | atc | 94 | ||
5s | 117 | 16s | 1565 | |||
5s | 228 | 117 | ||||
23s | 359 | 2907 | ||||
16s | 1565 |
afn remarques
- Lien tableur: afn remarques
- Remarques : 4 blocs 16-23-5s sans aas et très peu de doubles. Très simple.
- @ 4 blocs 16-23-5s sans aas .
- - 3 opérons ont leurs intercalaires identiques, 359 228.
- - 1 opéron a son intercalaire 16s-23s diminué de 30%, 108/359, l’autre intercalaire est commune aux 4 opérons.
- @ 2 blocs 16-atc gca 23s-5s, classiques mais sans aas en plus.
- - 3 intercallaires sont identiques et celui entre 23s-5s varie du simple au double, 94 66 298 228 et 94 66 273 139.
- @ 4 blocs 16-23-5s sans aas .
- Séquences des doubles : Très peu de doubles, 2 opérons à 2aas et plus sur 11 ont des doubles.
- - 2 doublets au total: opéron ctc + 2ctg et opéron gag + 2cag.
negativicutes distribution
- Lien tableur: negativicutes distribution
- Légende: prélèvement de la base gtRNAdb le 22.1.21
- - totaux en en-tête, 60 total de gtRNAdb contenant des pseudo et inconnus; 60 total du cumul.
- - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
- - Voir la légende des tris et couleurs, g1 t1.
- Légende: prélèvement de la base gtRNAdb le 22.1.21
g1 | t1 | 60 | 60 | ||||
---|---|---|---|---|---|---|---|
atgi | 1 | tct | tat | atgf | 1 | ||
att | act | aat | agt | ||||
ctt | cct | cat | cgc | ||||
gtt | gct | gat | ggt | ||||
ttc | 2 | tcc | 1 | tac | 1 | tgc | 2 |
atc | 2 | acc | 1 | aac | 2 | agc | 1 |
ctc | 1 | ccc | 1 | cac | 1 | cgt | 1 |
gtc | 1 | gcc | 1 | gac | 3 | ggc | 4 |
tta | 1 | tca | 1 | taa | tga | ||
ata | aca | 1 | aaa | 2 | aga | 1 | |
cta | 1 | cca | 1 | caa | 1 | cga | |
gta | 2 | gca | 2 | gaa | 2 | gga | 1 |
ttg | 1 | tcg | 1 | tag | tgg | 1 | |
atg | 1 | acg | 1 | aag | 1 | agg | 1 |
ctg | 2 | ccg | 1 | cag | 2 | cgg | 1 |
gtg | 1 | gcg | 1 | gag | 1 | ggg | 1 |
afn distribution
- Lien tableur: afn distribution
- Notes:
- - cag2 est un double, en gras
- - ggc est composé de 1 1aa et 3 >1aa, les autres soulignés contiennent 1 et 1 respectivement.
|
|
|
afn par rapport au groupe de référence
- Lien tableur: afn par rapport au groupe de référence
- Le groupe de référence: voir la référence
- Légende:
- - carré ccc, c'est ctc gtc ccc gcc
- - g+cga, c'est gtg xcg xag ggg cga (dans l'hypothèse de la bascule des cgx, cgt/cgc cga/cgg)
tRNAs | blocs tRNAs | blocs rRNAs | |||||||
afn | 1aa | >1aa | dup | +5s | 1-3aas | autres | total | ||
---|---|---|---|---|---|---|---|---|---|
21 | faible | 11 | 3 | 2 | 16 | ||||
16 | moyen | 5 | 12 | 4 | 21 | ||||
14 | fort | 4 | 19 | 23 | |||||
20 | 34 | 2 | 4 | 60 | |||||
10 | g+cga | 6 | 2 | 2 | 10 | ||||
2 | agg+cgg | 2 | 2 | ||||||
4 | carre ccc | 3 | 1 | 4 | |||||
5 | autres | ||||||||
11 | 3 | 2 | 16 | ||||||
total tRNAs ‰ | |||||||||
afn | 1aa | >1aa | dup | +5s | 1-3aas | autres | afn ‰ | ref.‰ | |
21 | faible | 183 | 50 | 33 | 267 | 26 | |||
16 | moyen | 83 | 200 | 0 | 67 | 350 | 324 | ||
14 | fort | 67 | 317 | 0 | 383 | 650 | |||
333 | 567 | 33 | 67 | 60 | 729 | ||||
10 | g+cgg | 100 | 33 | 33 | 167 | 10 | |||
2 | agg+cga | 33 | 33 | ||||||
4 | carre ccc | 50 | 17 | 67 | 16 | ||||
5 | autres | ||||||||
183 | 50 | 33 | 267 | ||||||
blocs tRNAs ‰ | total colonne % | ||||||||
afn | 1aa | >1aa | dup | total | ref.‰ | 1aa | >1aa | dup | |
21 | faible | 196 | 54 | 36 | 286 | 26 | 55 | 9 | |
16 | moyen | 89 | 214 | 304 | 324 | 25 | 35 | ||
14 | fort | 71 | 339 | 411 | 650 | 20 | 56 | ||
357 | 607 | 36 | 56 | 729 | 20 | 34 | |||
10 | g+cgg | 107 | 36 | 36 | 179 | 10 | 55 | ||
2 | agg+cga | 36 | 36 | 18 | |||||
4 | carre ccc | 54 | 18 | 71 | 16 | 27 | |||
5 | autres | ||||||||
196 | 54 | 36 | 286 | 11 |
clostridia synthèse
- notes: 16 blocs longs +5s
- Liens aux indices des clades: alpha bacilli gamma actino clostridia bacteroide cyano tener spiro beta epsilon delta bactéries
- Liens aux fiches: spiro tener gama alpha beta delta epsilon bacilli clostridia autres firmicutes actino bactero cyano archeo
clostridia distribution par génome
- Lien tableur: clostridia distribution par génome
baci | >1aa | 1aa | -5s | +5s | -16s | +16s | duplica | 1-3aas | total |
psor | 12 | 5 | 4 | 72 | 7 | 4 | 104 | ||
cdc | 4 | 4 | 2 | 70 | 3 | 83 | |||
cdc8 | 4 | 5 | 2 | 89 | 4 | 4 | 108 | ||
cbc* | 34 | 10 | 0 | 0 | 2 | 6 | 54 | ||
cbn | 48 | 12 | 2 | 6 | 3 | 4 | 4 | 7 | 90 |
cle | 38 | 19 | 26 | 3 | 9 | 2 | 8 | 107 | |
hmo | 37 | 12 | 39 | 11 | 10 | 109 | |||
cbei | 63 | 11 | 3 | 0 | 4 | 12 | 93 | ||
total | 240 | 78 | 13 | 302 | 6 | 42 | 8 | 51 | 748 |
clostridia distribution du total
- Lien tableur: clostridia distribution du total
- Légende:
- - Couleurs du 1er tableau: voir la distribution des bacilli
- - Couleurs du 2ème tableau: d'après les couleurs du pieds du tableau
- - Couleurs du 3ème tableau: comme le tableau 2. Cependant les duplicata ne sont pas comptés dans le total de 55 mais dans le total des >1aa du 1er tableau.
- - Tableau des indices, en-tête: total des génomes, total des tRNAs, indice ttt, indice tgt.
|
|
|
|
clostridia distribution par type
- Lien tableur: clostridia distribution par type
- Légende: voir bacilli
|
|
|
clostridia par rapport au groupe de référence
- Lien tableur: clostridia par rapport au groupe de référence
- Le groupe de référence: voir la référence
- Légende:
- - carré ccc, c'est ctc gtc ccc gcc
- - g+cga, c'est gtg xcg xag ggg cga (dans l'hypothèse de la bascule des cgx, cgt/cgc cga/cgg)
tRNAs | blocs tRNAs | blocs rRNAs | |||||||
clos8 | 1aa | >1aa | dup | +5s | 1-3aas | autres | total | ||
---|---|---|---|---|---|---|---|---|---|
21 | faible | 31 | 19 | 2 | 6 | 2 | 5 | 65 | |
16 | moyen | 36 | 66 | 4 | 101 | 20 | 42 | 269 | |
14 | fort | 11 | 155 | 2 | 195 | 29 | 14 | 406 | |
78 | 240 | 8 | 302 | 51 | 61 | 740 | |||
10 | g+cga | 16 | 13 | 2 | 31 | ||||
2 | agg+cgg | 5 | 2 | 1 | 8 | ||||
4 | carre ccc | 4 | 4 | 4 | 1 | 5 | 13 | ||
5 | autres | 6 | 2 | 8 | |||||
31 | 19 | 2 | 6 | 2 | 5 | 65 | |||
total tRNAs ‰ | |||||||||
clos8 | 1aa | >1aa | dup | +5s | 1-3aas | autres | clos ‰ | ref.‰ | |
21 | faible | 42 | 26 | 3 | 8 | 3 | 7 | 88 | 26 |
16 | moyen | 49 | 89 | 5 | 136 | 27 | 57 | 364 | 324 |
14 | fort | 15 | 209 | 3 | 264 | 39 | 19 | 549 | 650 |
105 | 324 | 11 | 408 | 69 | 82 | 740 | 729 | ||
10 | g+cga | 22 | 18 | 3 | 42 | 10 | |||
2 | agg+cgg | 7 | 3 | 1 | 11 | ||||
4 | carre ccc | 5 | 5 | 5 | 1 | 7 | 18 | 16 | |
5 | autres | 8 | 0 | 3 | 0 | 11 | |||
42 | 26 | 3 | 8 | 3 | 7 | 88 | |||
blocs tRNAs ‰ | total colonne % | ||||||||
clos8 | 1aa | >1aa | dup | total | ref.‰ | 1aa | >1aa | dup | |
21 | faible | 95 | 58 | 6 | 160 | 26 | 40 | 8 | |
16 | moyen | 110 | 202 | 12 | 325 | 324 | 46 | 28 | |
14 | fort | 34 | 475 | 6 | 515 | 650 | 14 | 65 | |
239 | 736 | 25 | 326 | 729 | 78 | 240 | |||
10 | g+cga | 49 | 40 | 89 | 10 | 52 | |||
2 | agg+cgg | 15 | 6 | 21 | 16 | ||||
4 | carre ccc | 12 | 12 | 25 | 16 | 13 | |||
5 | autres | 18 | 6 | 25 | 19 | ||||
95 | 58 | 6 | 160 | 31 |
Cet article est issu de Wikiversity. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.