< Recherche:Les clusters de gènes tRNA et rRNA chez les procaryotes < Annexe


  • Annexe en préparation

Tanger le 21.10.19

Bacillus subtilis

bsu opérons

  • Liens: gtRNAdb , NCBI , génome
  • Lien tableur: bsu
B1. Bacillus subtilis subsp. subtilis str. 168
43.6%GC7.3.19 Paris 86doublesintercal
9810..1136416s@299
11464..11540atc11
11552..11627gca81
11709..1463623s55
14692..148105s
22292..22384tca
30279..3183216s99
31932..32008atc11
32020..32095gca81
32177..3510323s133
35237..353555s
70181..70257atg9
70267..70338gaa
90536..9208916s@1164
92254..9518123s55
95237..953545s20
95375..95450gta4
95455..95530aca36
95567..95642aaa6
95649..95731cta40
95772..95846ggc14
95861..95946tta9
95956..96032cgt27
96060..96136cca9
96146..96221gca170
96392..9794516s164
98110..10103723s55
101093..1012115s
160893..16244516s164
162610..16553523s55
165591..1657075s46
165754..165825aac4
165830..165902acc56
165959..166033ggc30
166064..166140cgt27
166168..166244cca8
166253..166328gca171
166500..16805316s164
168218..17114123s55
171197..1713145s183
171498..17304916s164
173214..17614123s55
176197..1763155s
194205..194279gaa3
194283..194358gta4
194363..194435aca22
194458..194542tac4
194547..194621caa
528704..528778aac4
528783..528873agc29
528903..528974gaa11
528986..529060caa26
529087..529162aaa11
529174..529255cta80
529336..529422ctc
635110..635186cgt13
635200..635273gga159
635433..63698716s167
637155..64008223s55
640138..6402545s13
640268..640344atgf60
640405..640481gac
946696..94825016s167
948418..95134523s111
951457..9515725s9
951582..951656aac5
951662..951753tcc34
951788..951859gaa9
951869..951944gta9
951954..952030atgf11
952042..952118gac12
952131..952206ttc5
952212..952284aca22
952307..952391tac5
952397..952470tgg24
952495..952570cac9
952580..952651caa49
952701..952775ggc5
952781..952851tgc7
952859..952947tta@3265
953213..953294ttg
967065..967138gga
1262789..1262861gtc
comp2003276..2003348agg
2563889..2563959caa
comp2899816..2899889aga
comp3171879..3171950gaa25
comp3171976..3172066agc3
comp3172070..3172144aac10
comp3172155..3172231atc15
comp3172247..3172320gga10
comp3172331..3172406cac17
comp3172424..3172499ttc12
comp3172512..3172588gac11
comp3172600..3172676atgf17
comp3172694..3172786tca6
comp3172793..3172869atgi2
comp3172872..3172948atgj19
comp3172968..3173040gca5
comp3173046..3173122cca15
comp3173138..3173214cgt9
comp3173224..3173309tta14
comp3173324..3173398ggc5
comp3173404..3173490ctg10
comp3173501..3173576aaa37
comp3173614..3173689aca32
comp3173722..3173797gta20
comp3173818..31739355s55
comp3173991..317691823s167
comp3177086..317864016s
comp3194455..3194527gcc
comp3545889..3545964cgg
comp4154787..4154859ttc35
comp4154895..4154971gac81
comp4155053..4155124gaa9
comp4155134..4155209aaa

bsu cumuls

cumuls. Bacillus subtilis subsp. subtilis str. 168
opéronsFréquencesMoyenne
effectifsgammessans rRNAsavec rRNAssans jaune
avec rRNAopérons10100
16 23 5s 0320837
16 atc gca240411
16 23 5s a56003
max a218010
a doubles010010
spéciaux012000
total aas6014000
sans rRNAsopérons1216000
1 aa818000
max a720000
a doubles022000
total aas26total1451
total aas86moyenne231714
remarques3variance261411

bsu remarques

  • Nombre de gènes protéines: 4174 (KEGG)
*Remarques : lmo-bsu (ref. sont les 1ers génomes de cette étude qui m’ont poussé à étendre	
	l’échantillon. Lma* lmo et bsu sont des bacilli et donc ont des points communs
	en terme d’opréons à RNAs avec des taux %GC très proches 38-44 %.
	
@1	Blocs 16-23-5s : il y en a 8 avec 2 dans l’opéron 9aas et 3 dans 6aas.
	Soit le double de lmo.
	- Dans la 1ère étude ces blocs paraissaient arborer les séquences les plus longues 
	d’aas et j’attribuait la longueur de 16 aas de l’opéron 16-act-gca à un remaniement 
	entre opérons.  Ce n’est plus le cas puisqu’il s’est avéré que ces derniers sont plus 
	courants et peuvent être aussi long que les premiers avec 18 aas chez lam (ref..
	- Les intercalaires sont les mêmes pour les 4 blocs 16-23-5s,  164 55 20.
	- L'opéron 16aas a un intercalaire 23s-5s double des autres blocs, 111 contre 55.
	- L'opéron 4aas contient 2 aas avant le 16s et 2 après le 5s. L'intercalaire aa-16s 
	est à peu près égale à celui de 16s-23s, 159 contre 167.
	- Les intercalaires qui séparent les blocs surnuméraires sont aussi du même ordre
	que celui de 16s-23s, 170 171 183 contre 164 pour le 16s-23s.
	- Les 5 opérons avec ces blocs ont 4 6 9 16 21 aas.
	
@2	Blocs 16-atc-gca : il y en a 2 et n’ont pas d’autres aas comme l’opéron 
	16aas de lmo.
	- Les intercalaires sont les mêmes pour les 2 opérons, 99 11 81, sauf pour  celui de 
	23s-5s, 55 bases pour l’un, comme 7 blocs 16-23-5s, et le double pour l’autre, 
	113 comme pour l’opéron 16aas.
	
@3	intercalaire élevé pour 2 aas. Est-ce que le dernier aa est solitaire ?
	
Séquences des doubles : aucun double sur 7 opérons à 2 aas et plus. Comme lmo.	

bsu distribution

  • Lien tableur: bsu distribution
  • Notes:
    - Les 1-3aas après 5s, +5s, sont soulignés:atgf gac.
Bc1 bsu, Bacillus subtilis subsp. subtilis str. 168. bacilli.
bc11 bsu, distribution des blocs sans rRNA
g1t1 
atgitcttatatgf
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc1tcctac1tgc
atc2accaac1agc1
ctc1ccccaccgt
gtc1gcc1gac1ggc
ttatca1taatga
ataaca1aaa2aga1
cta1ccacaa3cga
gta1gca2gaa4gga1
ttgtcgtagtgg
atgj1acgaagagg1
ctgccgcagcgg1
gtggcggagggg
baci>1aa=1aa-5s+5s-16s+16stotal
bsu188430
bc12 bsu. Distribution des blocs avec rRNA.
g1t1 
atgi1tcttatatgf3
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc2tcc1tac1tgc1
atc1acc1aac3agc1
ctcccccac2cgt4
gtcgccgac3ggc4
tta3tca1taatga
ataaca3aaa2aga
cta1cca3caa1cga
gta3gca3gaa2gga2
ttg1tcgtagtgg1
atgj1acgaagagg
ctg1ccgcagcgg
gtggcggagggg
baci>1aa=1aa-5s+5s-16s+16stotal
bsu54256

bsu lmo

  • Lien tableur: bsu lmo
  • Légende:
    - La couleur cyan pour les différents entre bsu et lmo; bois pour les identiques entre les clusters 21 16 9 aas de bsu d'une part et ceux de lmo. Le gène cac est conservé dans les 3 clusters.
    - Le bleu pour des intercalaires exceptionnels.
    - Les bordures très épaisses noires encadrent 3 gènes pour les distingués entre eux.
  • Notes:
    - Les fréquences des différences entre intercalaires (diff) sont reportées dans le dernier tableau B14 et sont établies sur la plage des différences entre intercalaires bsu et lmo du tableau B11 pour des couples identiques (entre génomes), et entre intercalaires bsu-bsu et lmo-lmo (intra génome). Ces résultats sont à mettre en parallèle avec ceux de la comparaison cdc-psor. La faible variabilité des intercalaires cdc-psor par rapport à bsu-lmo est due à leur plus grande filiation, niveau genre contre le niveau famille pour bsu-lmo.
B1. Comparaison bsu-lmo
B11. Comparaison bsu-lmo
bsuintercallmointercaldiff
gaa25gaa5-20
agc3agc3431
aac10aac6-4
atc15atc2510
gga10gga2313
cac17cac2811
ttc12ttc4-8
gac11gac4-7
atgf17atgf4225
tca6tca2216
atgi2atgi119
atgj19atgj4223
gca5gca2217
cca15cca10-5
cgt9cgt90
tta14tta140
ggc5ggc1510
ctg10cta5-5
aaa37aaa414
aca32aca8-24
gta20gta13
5s555s81
23s16723s244
16s16s
16s16716s127
23s111atc46
5s9gca172
aac523s80
tcc345s14
gaa9aac61
gta9tcc33-1
atgf11gaa5647
gac12gta2112
ttc5atgf6-5
aca22gac4-8
tac5ttc20
tgg24tac72
cac9tgg15-9
caa49cac2920
ggc5caa5-44
tgc7ggc1914
tta265tgc45
ttgttg
16s16416s244
23s5523s80
5s205s13
gta4gta84
aca36aca415
aaa6aaa5-1
cta40cta14-26
ggc14ggc217
tta9tta123
cgt27cgt10-17
cca9cca1910
gca170gca341
B12. Comparaisons internes
bsuintercalbsuintercaldiff
16s16716s167
23s5523s111
5s205s9
gta32aac5
aca37tcc34
aaa10gaa9
ctg5gta9
ggc14atgf110
tta9gac120
cgt15ttc5
cca5aca22
gca19tac5
atgj2tgg24
atgi6cac9
tca17caa49
atgf11ggc5
gac12tgc7
ttc17tta265
cac10ttg
gga15
atc1016s164
aac323s55
agc255s20
gaagta4-28
aca36-1
aaa6-4
cta4035
ggc140
tta90
cgt2712
cca94
gca170
lmointercallmointercaldiff
16s24416s127
23s81atc46
5s13gca172
gta823s80
aca415s14
aaa5aac6
cta15tcc33
ggc14gaa56
tta9gta21
cgt10atgf62
cca22gac40
gca42ttc20
atgj11tac7
atgi22tgg15
tca42cac29
atgf4caa5
gac4ggc19
ttc28tgc45
cac23ttg
gga25
atc616s244
aac3423s80
agc55s13
gaagta80
aca410
aaa50
cta14-1
ggc217
tta123
cgt100
cca19-3
gca341
B13. Petits clusters
bsuintercallmointercal
gaa3gaa157
gta4acg9
aca22tac11
tac4caa6
caaaaa
agaaga
cggcgg
ggagga
gtcgtc
aggcgt
caactc
gcctcg
tca
atg9aac3
gaaagc
gaa27
gac
cgt1316s127
gga159atc46
16s167gca172
23s5523s80
5s135s14
atgf60aac24
gacacc
B14. Fréquence des différences des intercalaires
Entre génomesintra génome
gammefréquencegammefréquence
-155-71
-14-6
-13-5
-12-41
-11-31
-10-2
-91-12
-8209
-711
-621
-5331
-4141
-35
-26
-1271
022
11total20
21-2+211
31
42
51
6
71
8
91
103
111
121
131
141
15
7
total39
-2+26

bsu blocs

B1. Bacillus subtilis subsp. subtilis str. 168, blocs à rRNA.
Types
II1I2I3I4IIII1II2II3
16s16716716416416s164164164
23s11155555523s555555
5s92046205s
53244
aacgtaaacgta
**15aas**20aas**5aas** 8aas
IIIIV
16s9999cgt13
atc1111gga159
gca818116s167
23s5513323s55
5s5s13
atgf60
gac
groupe1groupe2
16s16416s164
I323s55I423s55
5s465s20
aac4gta4
**4aas8** 7aas9
gca171gca170
II116s164II316s164
23s5523s55
II25s1835s
16s164
23s55
5s

bsu intercalaires entre cds

  • Lien NCBI
  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

Fréquences: gammes, moyennes et variances

intercalaires	total	%	intercalaires	moyenne	ecartype	plage
négatif		609	14	négatif 	-12	19		-1 à -164
zéro		27	0.4				
1 à 200		3043	70	0 à 200		72	56	
201 à 370	463	11	201 à 370	262	46	
371 à 600	150	3.5	371 à 600	457	65	
601 à max	36	0.8	601 à 1306	774	170	
Total 4328			Total 4316	99	124		-164 à 1306

bsu les fréquences

  • Lien tableur: bsu intercalaires entre cds
  • Légende: long, longueur en pbs.
    - 16s, 23s5s, blocs à rRNAs seuls.Voir bsu opérons pour leurs intercalaires
    - agc, aaa-atc, blocs à tRNAs seuls. Voir bsu opérons pour leurs intercalaires
bsu Les fréquences des intercalaires entre cds
adresseintercalinter-gènelongintercalfréquencecumul/%intercalfréquence
159779165392x16s15423-7019027
88727112222x16s10676-602-172
3169763765916s 21aas6762-505-24
3908807511néant-4019-30
945520696816s 16aas6599-3011min à -1-4243
634651588516s 4aas5372-2038609-50
297725495néant-1010514%-62
69945387néant0437-712
36714161306néant10260-876
12614261085gtc20445-91
415369610294aas42330255-106
2221061952néant40279-1144
222617695050165-120
52812992360114-136
188605782470140-1420
19357082380154-150
289524881590134-166
2733772809100116-1718
785543783110131-180
3699446783120126-195
2060817777130127-2012
121811374314094-210
875428731150112-222
3449732721160100-238
559264686170921 à 200-240
1446317682180843043-252
20513296691906070%-268
148224864520055-270
354464262921061-280
205459962722032-296
87340262523049-300
187281262324043-311
127856561925037-322
40042886152603174
385425660927036reste53
190008060228030636
29020
300176004292
310186509
320147003
330217503
34021201 à 3708003
350154638504
3601011%9000
37089502
3801310001
3901410501
400811001
387744-7616shift 2 gènes31354101411500
3717238-500shift 2 gènes884201012000
2909520-492tronq 2 gènes04301012500
2601528-361comp440513000
1252815-164shift 2 gènes434501013501
2466721-154shift 2 gènes107946018
1916663-143shift 2 gènes2924705total36
3666841-127comp4807
2693597-119shift 2 gènes8234908
538322-113shift 2 gènes4125004
1322014-101shift 2 gènes7365106
238164-955204
1526859-945304
2652993-935403371 à 600
2758043-925505150
3755967-9156053.5%
2154781-865703
2705398-825804601 à max
2154705-71590536
989712-6960020.8%

Listeria monocytogenes

lmo opérons

  • Liens: gtRNAdb , NCBI
  • Lien tableur: lmo
B2. Listeria monocytogenes EGD-e
37.9%GC7.3.19 Paris67doublesintercal
82705..82777aag
237466..23902016s@1244
239265..24219523s80
242276..2423855s13
242399..242471gta8
242480..242555aca41
242597..242669aaa5
242675..242756cta14
242771..242842ggc21
242864..242949tta12
242962..243035cgt10
243046..243119cca19
243139..243214gca341
243556..24504116s244
245286..24821623s80
248297..2484065s
677464..677553tcg
936656..936728aac3
936732..936819agc
940017..940088gaa27
940116..940188gac
970867..970937gga
1266675..1266748aga
comp1740916..1740987gaa5
comp1740993..1741083agc34
comp1741118..1741190aac6
comp1741197..1741270atc25
comp1741296..1741366gga23
comp1741390..1741462cac28
comp1741491..1741563ttc4
comp1741568..1741643gac4
comp1741648..1741721atgf42
comp1741764..1741853tca22
comp1741876..1741949atgi11
comp1741961..1742034atgj42
comp1742077..1742149gca22
comp1742172..1742245cca10
comp1742256..1742329cgt9
comp1742339..1742424tta14
comp1742439..1742513ggc15
comp1742529..1742610cta5
comp1742616..1742688aaa41
comp1742730..1742805aca8
comp1742814..1742886gta13
comp1742900..17430095s81
comp1743091..174602123s244
comp1746266..174781116s
1776112..1776183cgt
comp1848821..18489305s81
comp1849012..185194223s244
comp1852187..185373216s
2162187..2162273ctc
2215375..2215446gaa157
2215604..2215677acg9
2215687..2215770tac11
2215782..2215856caa6
2215863..2215935aaa
comp2436493..2436576ttg45
comp2436622..2436695tgc19
comp2436715..2436786ggc5
comp2436792..2436863caa29
comp2436893..2436965cac15
comp2436981..2437054tgg7
comp2437062..2437145tac20
comp2437166..2437238ttc4
comp2437243..2437318gac6
comp2437325..2437398atgf21
comp2437420..2437495gta56
comp2437552..2437623gaa33
comp2437657..2437745tcc6
comp2437752..2437827aac14
comp2437842..24379515s80
comp2438032..244096223s172
comp2441135..2441210gca46
comp2441257..2441330atc127
comp2441458..244300316s@2
comp2540230..2540301cgg
comp2672664..2672736acc24
comp2672761..2672836aac14
comp2672851..26729605s80
comp2673041..267597123s172
comp2676144..2676219gca46
comp2676266..2676339atc127
comp2676467..267801216s
2930362..2930434gtc

lmo cumuls

cumuls. Listeria monocytogenes EGD-e
opéronsFréquencesMoyenne
effectifsgammessans rRNAsavec rRNAssans jaune
avec rRNAopérons6100
16 23 5s 0220425
16 atc gca240111
16 23 5s a26008
max a218000
a doubles010000
spéciaux012000
total aas5014000
sansopérons1116010
1 aa818000
max a520000
a doubles022000
total aas17644
total aas67moyenne362011
remarques2variance36129

lmo blocs

B2. Listeria monocytogenes EGD-e, blocs à rRNA.
Types
II1I2I3I4IIII1II2
16s24424416s244244
23s818023s8081
5s13135s
88
gtagta
**20aas**8aas
IIIIV
16s127127
atc4646
gca172172
23s8080
5s1414
624
aacaac
**13aasacc
Groupes
16s244
I423s80
5s13
gta8
**7aas19
gca341
16s244
II123s80
5s

lmo remarques

  • Nombre de gènes protéines: 2867 (KEGG)
*Remarques : lmo-bsu (ref. sont les 1ers génomes de cette étude qui m’ont poussé à étendre	
	l’échantillon. Lma* lmo et bsu sont des bacilli et donc ont des points communs
	en terme d’opréons à RNAs avec des taux %GC très proches 38-44 %.
	
@1	Blocs 16-23-5s : il y en a 4 dont 1 sans aas et 2 réunis dans un seul opéron.
	- Dans la 1ère étude ces blocs paraissaient arborer les séquences les plus longues 
	d’aas et j’attribuait la longueur de 16 aas de l’opéron 16-act-gca à un remaniement 
	entre opérons.  Ce n’est plus le cas puisqu’il s’est avéré que ces derniers sont plus 
	courants et peuvent être aussi long que les premiers avec 18 aas chez lam (ref..
	- Les intercalaires sont les mêmes pour les 4 blocs 16-23-5s,  244 80 13.
	- L'opéron à 2 blocs: le 2ème n'ayant pas d'aa à la suite de 5s et ayant une
	intercalaire du côté de 16s, très élevée, 341 bases, pourrait être un solitaire.
	
@2	Blocs 16-atc-gca : il y en a 2 dont un  le fameux 16aas et l’autre avec 4 aas.
	- Les intercalaires sont les mêmes pour les 2 opérons, 127 46 172 80 14.
	- Ils partagent les mêmes intercalaires 5s-aa avec les blocs 16-23-5s-aa, 80 13.
	
Séquences des doubles : aucun double sur 7 opérons à 2 aas et plus. Comme bsu.	

lmo distribution

  • Lien tableur: lmo distribution
  • Notes:
    - Les 1-3aas après 5s, +5s, sont soulignés:aac acc.
Bc2 lmo, Listeria monocytogenes EGD-e. bacilli.
bc21 lmo, distribution des blocs sans rRNA
g1t1 
atgitcttatatgf
attactaatagt
cttcctcatcgc
gttgctgatggt
ttctcctac1tgc
atc2accaac1agc1
ctc1ccccaccgt1
gtc1gccgac1ggc
ttatcataatga
ataacaaaa1aga1
ctaccacaa1cga
gtagca2gaa2gga1
ttgtcg1tagtgg
atgjacg1aag1agg
ctgccgcagcgg1
gtggcggagggg
baci>1aa=1aa-5s+5s-16s+16stotal
lmo98421
bc22 lmo. Distribution des blocs avec rRNA.
g1t1 
atgi1tcttatatgf2
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc2tcc1tac1tgc1
atc1acc1aac3agc1
ctcccccac2cgt2
gtcgccgac2ggc3
tta2tca1taatga
ataaca2aaa2aga
cta2cca2caa1cga
gta3gca2gaa2gga1
ttg1tcgtagtgg1
atgj1acgaagagg
ctgccgcagcgg
gtggcggagggg
baci>1aa=1aa-5s+5s-16s+16stotal
lmo4646

Lactobacillus amylovorus strain 30SC

lam opérons

  • Liens: gtRNAdb , NCBI
  • Lien tableur: lam
  • Légende:
    -cds1, hp 186: hypothetical protein, 186 pb, MESRNTKRSIQSKRKHTEKLCLVLRVVPQGVSTLKTEYNPSKKPRQSKRTDCRATEKRILE
    -cds2, hp 186: hypothetical protein, 186 pb, MESRNTKRSIQSKRKHTEKLCLVLRVVPQRVSTLKTEYNPSKKPRQSKRTDCRATEKRILE
B3. Lactobacillus amylovorus strain 30SC
38%GC30.6.19 Paris63doublesintercal
447399..44897216s@1125
449098..449172atc52
449225..449297gca115
449413..45232423s68
452393..4525095s4
452514..452586gta2
452589..452661aaa13
452675..452756cta23
452780..452852aca10
452863..452934ggc11
452946..453031tta8
453040..453113cgt5
453119..453192cca29
453222..453295atg12
453308..453381atgi27
453409..453482atgf3
453486..453559gac6
453566..453638ttc19
453658..453728gga5
453734..453808atc2
453811..453900agc
57091..5866416s125
58790..58864atc52
58917..58989gca115
59105..6201623s68
62085..622015s13
62215..62287aac
469566..47113916s@29
471149..471334cds1hp 186-3
471332..47424323s68
474312..4744285s13
474442..474514aac
comp1709284..1709374tcc10
comp1709385..1709457aac13
comp1709471..17095875s68
comp1709656..171256723s-3
comp1712565..1712750cds2hp 1869
comp1712760..171433316s
comp79386..79458aag
comp79913..79985aag
193922..193994acc
comp210866..210939ggg
287678..287752ggc+111
287864..287938ggc3 ggc109
288048..288122ggc35
288158..288231ccg
457611..457682gaa35
457718..457804tca9
457814..457887atgf3
457891..457964gac6
457971..458046ttc4
458051..458132tac4
458137..458207tgg12
458220..458295cac4
458300..458371caa23
458395..458465tgc40
458506..458590ttg
474442..474514aac
507688..507760acg
526886..526957caa
551550..551631tac34
551666..551737caa
567329..567416ctt
583327..583413tca6
583420..583493gac7
583501..583576cac4
583581..583653gta
642034..642106agg
comp729370..729441cgg
784793..784864gag
917887..917975tcg
1456724..1456800aga
1681218..1681301ctg
comp1707998..1708070gta5
comp1708076..1708147gaa
1987190..1987263cgt8
1987272..1987345cca

lam cumuls

cumuls. Lactobacillus amylovorus strain 30SC
opéronsFréquencesMoyenne
effectifsgammessans rRNAsavec rRNAssans jaune
avec rRNAtotal4100
16 23 5s 00201212
16 atc gca24053
16 23 5s a06000
max a188000
a doubles010000
spéciaux212020
total aas2414000
sanstotal2016000
1 aa1418000
max a1120000
a doubles122000
total aas391915
total aas63moyenne241214
remarques2variance33913

lam blocs

B3. lam, blocs à rRNA.
16s125157416s91574
atc52cds1-362
gca11523s682912
23s6829125s13117
5s4117aac
gta
16s125157416s91574
atc52cds2-362
gca11523s682912
23s6829125s13117
5s13117aac
aac

lam remarques

*Remarques : pratiquement pas de doublons, 1 seul triplet dans 1 opéron sur 11.	
	- Que des blocs de type 16-atcgca, il y en a 4.
	
@1	Les 2 blocs 16-atcgca sont standard comme dans bsu et lmo (ref..
	- Ils ont les mêmes intercalaires du début, 125 52 115 68 13.
	- un opéron avec 1 aa en plus, aac comme dans bsu-lmo.
	- un opéron à 18 aas plus grand que celui de lmo avec 16.
	
@2	Les 2 blocs 16s-protéine-23s-5s.  Ressemblance avec  EFTU.
	- très petite protéine, 62 aas.
	- Dans les 2 cas les intercalaires sont les mêmes, 9 -3 68 13
	- Notez le -3 pour le stop.
	- les intercalaires 25s-5s-aac sont à peu près les mêmes que les 
	Blocs 16 atc gca 23-5s-aa, 68 13.
	contrôle du 3.10.20: les 2 cds ont disparus dans NCBI du 31.7.2020.
Séquences des doubles :  pratiquement pas de doublons, 1 seul triplet dans 1 opéron sur 11	
	opérons à plus de 2 aas.

lam distribution

  • Lien tableur: lam distribution
  • Notes:
    - Les 1-3aas après 5s, +5s, sont soulignés: 3 aac et tcc.
    - duplicata: ggc3
Bc3 lam, Lactobacillus amylovorus strain 30SC. bacilli.
bc31 lam, distribution des blocs sans rRNA
g1t1 
atgitcttatatgf1
attactaatagt
ctt1cctcatcgc
gttgctgatggt
ttc1tcctac2tgc1
atc2acc1aac1agc
ctcccccac2cgt1
gtcgccgac2ggc3
ttatca2taatga
ataacaaaaaga1
ctacca1caa3cga
gta2gca2gaa2gga
ttg1tcg1tagtgg1
atgjacg1aag2agg1
ctg1ccg1cagcgg1
gtggcggag1ggg1
baci>1aa=1aa-5s+5s-16s+16stotal
lam2514443
bc32 lam. Distribution des blocs avec rRNA.
g1t1 
atgi1tcttatatgf1
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc1tcc1tactgc
atc1accaac3agc1
ctcccccaccgt1
gtcgccgac1ggc1
tta1tcataatga
ataaca1aaa1aga
cta1cca1caacga
gta1gcagaagga1
ttgtcgtagtgg
atgj1acgaagagg
ctgccgcagcgg
gtggcggagggg
baci>1aa=1aa-5s+5s-16s+16stotal
lam2020

Paenibacillus polymyxa SC2

ppm opérons

ppm opérons chromosome

  • Liens: gtRNAdb , NCBI
  • Lien tableur: ppm
  • Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
B4 Paenibacillus polymyxa SC2 Chromosome
45.5%GC26.7.19 Paris110 doublesintercalcdsaaavec aacdsacdsd
10545..11633CDS327327363
11961..1351916s280
13800..1672823s143
16872..169885s232232232
17221..17640CDS93 855140
comp111496..112530CDS616345
113147..11470516s207
114913..11784323s76
117920..1180365s343343
118380..119837CDS3 348486
123186..124469CDS909042890
124560..124648tca145145
124794..125135CDS55 592114
180728..181003CDS41292
181416..18297416s108
183083..1831995s@139
183239..183315atc2020
183336..183411gca128
183540..18646823s130
186599..186690agc2828
186719..186795atgj1010
186806..186881gta44
186886..186961aca1919
186981..187057gac7777
187135..187210ttc66
187217..187302tac77
187310..187385aaa154154154
187540..188682CDS24 062381
comp212745..213341CDS211211199211
comp213553..213624cgg259259
213884..214921CDS238 832346
453754..455364CDS392537
455757..45731516s207
457523..46045323s76
460530..4606465s34
460681..460757atc2222
460780..460855gca44
460860..460935aac3434
460970..461043atgj33
461047..461138agc3131
461170..461241gaa66
461248..461323gta1010
461334..461407atgf2525
461433..461509gac5050
461560..461635ttc2222
461658..461733aca55
461739..461824tac1616
461841..461913cac1818
461932..462006caa44
462011..462086aaa1515
462102..462189ctg66
462196..462270ggc1010
462281..462351tgc2626
462378..462454cgt2222
462477..462550cca99
462560..462630gga204204204
comp462835..463938CDS1 537368
465476..466216CDS524247
466741..46829916s207
468507..47143423s76
471511..4716275s629
472257..473588CDS103 459444
577048..577794CDS1 116249
578911..58046916s207
580677..58360723s76
583684..5838005s82
583883..583958gca44
583963..584038aac33
584042..584133tcc1919
584153..584224gaa99
584234..584309gta2929
584339..584412atgf2525
584438..584514gac1313
584528..584603aca44
584608..584693tac102102
584796..584870caa44
584875..584950aaa1212
584963..585043cta1010
585054..585128ggc55
585134..585210cgt1212
585223..585302ttg77
585310..585386cca77
585394..585464gga1 133
586598..587560CDS22 016321
609577..609924CDS737311673
609998..610069acg1 613
comp611683..612030CDS140 810116
752841..754124CDS611428
754736..75629416s208
756503..75943123s75
759507..7596235s183183183
comp759807..760232CDS173 078142
933311..934681CDS449457
935131..93668916s221
936911..93983923s76
939916..9400325s216216216
940249..941241CDS521 183331
1462425..1462937CDS444417144
1462982..1463057aac11
1463059..1463147agc122122
comp1463270..1464145CDS74292
comp1464220..1464981CDS246246254
1465228..1465299gaa8686
1465386..1465461aaa1515
1465477..1465562ctc162162162
1465725..1466180CDS1 667152
comp1467848..1468585CDS262262246
1468848..1468930ctc148148148
comp1469079..1469564CDS112 990162
1582555..1583361CDS490269
1583852..1583925ccc244244
comp1584170..1585441CDS32 099424
1617541..1619682CDS107107714107
1619790..1619860gga265265
1620126..1621163CDS254 529346
1875693..1876160CDS129129156129
1876290..1876365gcc1111
1876377..1876449aag520
comp1876970..1877974CDS55 215335
comp1933190..1933630CDS381147
1934012..1934096ctg919191
comp1934188..1934718CDS74 847177
comp2009566..2010102CDS222222179
2010325..2010409ctg213213
2010623..2011135CDS432 608171
2443744..2448333CDS5401530
2448874..245043216s400
2450833..245376123s143
2453905..24540215s236236236
comp2454258..2455367CDS186 804370
2642172..2643329CDS426386
2643756..264531416s343
2645658..264858623s144
2648731..26488475s156156156
2649004..2649228CDS884 57775
comp3533806..3534249CDS139139148139
3534389..3534460gtc279279
comp3534740..3535069CDS103 837110
3638907..3639338CDS728144
comp3640067..3640152tta249249249
3640402..3640560CDS28 09253
3668653..3669450CDS247247266
comp3669698..3669766atg267267
comp3670034..3670234CDS54 45667
3724691..3725086CDS122122132122
comp3725209..3725282atgi435
comp3725718..3726359CDS612 148214
comp4338508..4339209CDS107107234107
comp4339317..4339390cca77
comp4339398..4339477ttg1212
comp4339490..4339566cgt55
comp4339572..4339646ggc3535
comp4339682..4339757aaa2828
comp4339786..4339862gac2626
comp4339889..4339965atgf3030
comp4339996..4340071gta99
comp4340081..4340152gaa1717
comp4340170..4340261tcc33
comp4340265..4340340aac18
comp4340359..43404755s76
comp4340552..434348223s400
comp4343883..434544116s493
comp4345935..4347563CDS46 596543
comp4394160..4395092CDS238238311
4395331..4395404aga214214
4395619..4396383CDS49 894255
4446278..4447621CDS207207448
comp4447829..4447902aga174174
4448077..4448370CDS256 55698
4704927..4705187CDS36187
comp4705549..4705627ttg1111
comp4705639..4705713tgc1111
comp4705725..4705796ggc66
comp4705803..4705877caa99
comp4705887..4705959cac1717
comp4705977..4706050tgg77
comp4706058..4706143tac44
comp4706148..4706223aca2222
comp4706246..4706318ttc3535
comp4706354..4706430gac1515
comp4706446..4706522atgf2525
comp4706548..4706623gta5858
comp4706682..4706753gaa1717
comp4706771..4706862tcc33
comp4706866..4706941aac326326
comp4707268..4707597CDS279 544110
comp4987142..4989934CDS726931
comp4990661..4990731gga99
comp4990741..4990814cca2222
comp4990837..4990913cgt55
comp4990919..4990993ggc1010
comp4991004..4991084cta1111
comp4991096..4991171aaa44
comp4991176..4991250caa5555
comp4991306..4991381gta1111
comp4991393..4991464gaa1111
comp4991476..4991548acc33
comp4991552..4991627aac18
comp4991646..49917625s76
comp4991839..499476823s129
comp4994898..4994973gca2020
comp4994994..4995070atc38
comp4995109..49952255s93
comp4995319..499687716s367
comp4997245..4997475CDS60 14077
comp5057616..5058803CDS163163396163
comp5058967..50590835s76
comp5059160..506208923s185
comp5062275..5062350gca89
comp5062440..506399816s380
comp5064379..5066394CDS647 899672
5714294..5714611CDS206206106
comp5714818..5714908tcg777777
comp5714986..5715210CDS75

ppm opérons plasmide

  • Liens: gtRNAdb , NCBI
  • Lien tableur: ppm
  • Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
B4 Paenibacillus polymyxa SC2 plasmide
B4 Paenibacillus polymyxa SC2 plasmide MAJ
comp23.10.19 Tanger49 aasdoublesintercal
3920..4174cds hp
4711..4803agc+
4809..4883tgc3 aac
4947..5021gaa2 atc
5029..5105ctt2 cca
5112..5186cca2 cga
5288..5361tgg2 gaa
5366..5441tat3 tgg7
5449..5522caa
5529..5605cac
5611..5686gac
5812..5887gga
5898..5973aac@1
5978..6066tacctt
6076..6153ataata82
****tat
6236..6311atgi
6317..6392aac
6397..6470tgg
6602..6678gaa
6684..6757ggc
6813..6885ttc
6908..6980cga7
6988..7065cca
7071..7155ttg
7161..7235atc4
7240..7317atgf
7323..7398gca
7508..7584cga
7588..7668cta
7682..7758atc
7767..7841aac
7846..7919tgg
7953..8324cds hp
8301..8378gac
8387..8473tac
8560..8632aaa
8647..8720gga
8725..8800ttc
8808..8882acg@2
comp8983..9600cds hpacg
9690..9771tta
9775..9849aca
comp9885..10169cds hp
comp10320..10622cds hp
10739..10813aca
comp10832..11146cds hp
comp11363..11599cds hp
11694..11765aga85
11851..12312cds rev-trans
comp12508..12756cds trans-rg442
********
13199..14083cds hp
14310..14385tcg+
14394..14481tcc2 tcg
14489..14560ctt@36
14567..14654tcgtcg
14660..14751tcactt
14871..15080cds hp
comp227125..227388cds hp
comp227833..227903gga
comp228152..228391cds hp
comp229793..229999cds hp
comp230024..230108tca783
********
comp230872..231393cds hp
comp231558..231640tta
232618..233067cds hp
510118..1
B4 Paenibacillus polymyxa SC2 plasmide
37.6%GC26.7.19 Paris51 doublesintercalCDSaaavec aacdsacdsd
3920..4174CDS53653685
4711..4803agc+55
4809..4883tgc3 aac6363
4947..5021gaa2 atc77
5029..5105ctt2 caa66
5112..5186cca2 cca101101
5288..5361tgg2 cga44
5366..5444tac2 gaa44
5449..5522caa2 tac66
5529..5605cac3 tgg55
5611..5686gac125125
5812..5887gga1010
5898..5973aac@144
5978..6066tacctt99
6076..6153ataata44
6158..6231caa44
6236..6311atgi55
6317..6392aac44
6397..6470tgg131131
6602..6678gaa55
6684..6757ggc5555
6813..6885ttc2222
6908..6983cga44
6988..7065cca55
7071..7155ttg55
7161..7235atc55
7241..7317atgf55
7323..7398gca109109
7508..7584cga33
7588..7668cta1313
7682..7758atc88
7767..7841aac44
7846..7919tgg333333
7953..8324CDS@4-24-24124
8301..8378gac88
8387..8473tac8686
8560..8632aaa1414
8647..8720gga44
8725..8800ttc77
8808..8882acg@2100100
comp8983..9600CDSacg8989206
9690..9771tta33
9775..9849aca353535
comp9885..10169CDS15095
comp10320..10622CDS116116101
10739..10813aca181818
comp10832..11146CDS216105
comp11363..11599CDS94947994
11694..11768aga103103
11872..12312CDS195147
comp12508..12756CDS29329383
13050..13126atc727272
13199..14083CDS226226295
14310..14385tcg+88
14394..14481tcc2 tcg77
14489..14563ctt@333
14567..14654tcgtcg55
14660..14751tcactt119119119
14871..15080CDS21204470
comp227125..227388CDS44444488
comp227833..227903gga248248248
comp228152..228391CDS140180
comp229793..229999CDS24246924
comp230024..230108tca289289
comp230398..230640CDS23181
comp230872..231393CDS161161174161
comp231555..231640tta977977
232618..233067CDS277050150
510118..1

ppm cumuls

Chromosome

  • Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
cumuls. Paenibacillus polymyxa SC2, chromosome.
OpéronsFréquences intercalairesFréquences aas cds
effectifsgammessans rRNAsavec rRNAsgammescdsgammescdsacdsjgammescdsd
avec rRNAopérons131101010085400
16 23 5s 072012465012002017601
16 5 atc gca2403151004300106802
16 23 5s a3601215084001391002
max a2180012006500741202
a doubles01001025015600201403
16 gca 23 5s1120013005700101603
total aas73140003503800111802
sansopérons19160004005900002001
1 aa151800045041000102203
max a152000050021100002402
a doubles00011101
total aas37186564644222
total aas110moyenne2017193292229150
remarques1variance21177323412358
jaunesanssans

Plasmide

  • Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
cumuls. Paenibacillus polymyxa SC2, plasmide.
OpéronsFréquences intercalairesFréquences aas cds
effectifsgammessans rRNAsavec rRNAsgammescdsgammescdsacdsjgammescdsd
avec rRNAopérons01011600404
16 23 5s 02033504804600
16 5 atc gca40110041005801
16 23 5s a601150312021001
max a801200114011201
a doubles1001250216021400
16 gca 23 5s1202300218011600
total aas1402350020001801
sansopérons101600400022012000
1 aa61800450124002200
max a322000500026002400
a doubles20211
total aas514120179
total aas51moyenne612610289
remarques3variance3923277
jaunesanssanssans

ppm blocs

B4. Paenibacillus polymyxa SC2, blocs à rRNA.
tRNAs211711
16s207207400
23s767676
5s348218
tRNAs13__10
16s93_16s10816s89
5s385s39gca185
atc20atc2023s76
gca129gca1285s
23s7623s130
5s18
16s280207207208221400343
23s14376767576143144
5s
5sconstant39 aas117 pbs

ppm remarques

ppm chromosome

tRNAs	21	17	11				
16s	207	207	400				
23s	76	76	76				
5s	34	82	18				
							
tRNAs	13	-	-	10			
16s	93		16s	108		16s	89
5s	38		5s	39		gca	185
atc	20		atc	20		23s	76
gca	129		gca	128		5s	
23s	76		23s	130			
5s	18						
														
16s	280	207	207	208	221	400	343
23s	143	76	76	75	76	143	144
5s							
							
5s	constant	39 aas	117 pb				
											
*Remarques :Il n’y a pas de doublons dans les 13 blocs à rRNA, ni dans les blocs sans rRNA.						
	- La majorité des tRNAs se trouvent dans les clusters à rRNA 73 contre 37.						
	- Les blocs 16s23s5s sont majoritaires , 10 sur 13, dont 7 ne portent pas de tRNAs.						
	- Les intercalaires 16s-23s sont quasiment identiques pour 7 blocs/10 les 3 autres sont doubles.						
	- Les intercalaires 23s-5s sont aussi quasiment identiques pour 10/12 les autres sont doubles.						
	- Les 2 intercalaires 16s-5s sont moitié de ceux de23s-5s.						
	- Voir la liste ci-dessus pour les intercalaires et le nombre de tRNAs.						
							
@1	- Le bloc 16s5s-atcgca-23s-10aas a son 5s anormalement positionné, pas après 23s						
	mais après 16s. Certains génomes (ref.) n’ont que que ce type.						
	-Le bloc 16s5s-atcgca-23s5s-13aas porte les 2 types de position alors que en général						
	un bloc à 2 5s est du type 16s23s5s5s, avec les 2 5s du même côté du 23s.						
							
Séquences des doubles :  Il n’y a pas de doublons dans les 13 blocs à rRNA, ni dans les blocs sans rRNA. 	

ppm plasmide

Plasmide		
24.10.19 Tanger		
*Remarques : 		
	- Il n'y a pas de cluster avec des gènes rRNAs, mais il existe au moins un plasmide  avec ce type	
	de cluster (ref.) chez les bactéries.	

	- 46 gènes de tRNA sur 49 sont regroupés en 11 152 pb pour une longueur de plasmide de 510 118.	
	Soit 2 % seulement de la taille du plasmide.	

	- Ces 46 gènes sont répartis en 4 clusters dont le principal avec 39 gènes contient 2 cds entourés	
	chacun par 2 tRNAs. Les 3 autres ne contiennent pas de cds à l’intérieur . Les 3 1ers clusters sont contigus	
	et entre le 3ème et le 4ème existe un seul cds particulier  de 83 aas, trans-rg, transcription regulator.	
	Il est précédé d’une transcriptase reverse, rev-trans, de154 aas.	

	- Particularité du cluster principal: régularité qui n'existe pas chez les clusters du chromosome.	
		+ dans le chromosome les intercalaires des clusters avec ou sans rRNA,
		moyenne et variance sont égales et du même ordre que la moyenne du cluster principal,
		à peu près 20, alors que sa variance est quasiment double, 36 pb. 
		+ 33 des intercalaires faibles du plasmide ont 6 et 3 pour respectivement moyenne et variance
		+ Les intercalaires élevés sont répartis régulièrement et sont du même ordre que ceux
		entre tRNA-cds. Voir la liste ci-dessous où les intercalaires avec cds sont signalés en gras.

	- Les intercalaires entre les cds d'encadrement des 4 clusters sont aussi du même ordre que ceux à l'intérieur du cluster principal.	
	Cette similitude et la contiguité entre les cds militent pour le regroupent de ces 4 clusters.	

	- Les 3 derniers tRNAs du plasmide, aux adresses élevées, ne semblent pas former un groupe de clusters :	
	Chaque tRNA est, à peu près, aussi proche d’un cds d’encadrement que dans le cluster principal (248 24 161),	
	mais il est très éloigné de l’autre cds d’encadrement (444 783 977). De même la distance entre les cds est très élevées, 1401.	

	- Si l'on considère le groupe des 4 clusters à 46 gènes de tRNA comme encadré par 2 cds, les intercalaires proches et éloignés 	
	équivalents respectivement à ceux des 3 tRNA à adresses élevées, sont du même ordre, 109 et 536. Et dans ce groupe	
	la distance entre 2 cds contigus reste largement inférieure aux 1401 des gènes à adresses élevées, 442 qui est une exception	
	par la fonction régulatrice d’un des 2 cds de l’intercalaire, « cds  trans-rg », alors que les autres intercalaires 	
	sont inférieurs à 216.	

	- Dans la série de 31 gènes il y a très peu de doublons comme le chromosome: Ils sont signalés par le signe +. 	
	Mais ils ne présentent pas de séries de gènes identiques ou de répétitions de séquences comme dans d’autres génomes, 	
	(ref.) à part la séquence cca-tgg répétée 2 fois. Sinon les doublons sont séparés par de nombreux autres gènes.	
	Si l’on compare par rapport aux séries longues des clusters avec rRNA du chromosome, 21 aas,  ou sans rRNA, 15 aas, 	
	les 31 aas de la série du plasmide, de part sa longueur et le nombre limité de type de gènes (ceux se terminant par a et c) 	
	candidats à la création dans le cluster, il est normal qu’il y ait des doublons. D’autant plus que la série fait appel 	
	à des gènes rares, ctt ata tat.	
	Donc le plasmide ne déroge pas à l’absence  des doublons du génome en entier.	
		
	- @1,2 aas rares, acg et ctt, ou très rares, tat et ata.	
		
	- @3 regroupement de 5 gènes de tRNA longs dont 4 Ser,  3 rares et un doublets de rares. Alors qu’aucun gène de ser n’est 	
	présent dans la série de 31 gènes.	
		
	- @4 l’intercalaire négatif élevé entre le cds (124aas) et le gène de gac  illustre bien l’intégration des cds du groupe des 4 clusters
	au processus de création de gènes.	
	
entre aas et cds du	
cluster principal	
1-2 	cds	536
2-3 	tgc	63
5-6 	cca	101
10-11 	gac	125
18-19 	tgg	131
20-21 	ggc	55
21-22 	ttc	22
27-28 	gca	109
31-32 	tgg	33
33-34 	cds	-24
35-36 	tac	86
39-40 	acg	100
40-41 	cds	89
42-43 	aca	35
	
entre cds de clusters	
cl1-cl2		150
cl2-cl3		216
cl3-trans rg	195
trans rg-cl4	442

ppm distribution

Bc4 ppm, Paenibacillus polymyxa SC2. bacilli.
bc41 ppm, distribution des blocs sans rRNA. Chromosome
g1t1 
atgi1tcttatatgf1
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc1tcc1tac1tgc1
atc2accaac2agc1
ctc2ccc1cac1cgt
gtc1gcc1gac1ggc1
tta1tca1taatga
ataaca1aaa1aga2
ctaccacaa1cga
gta1gca3gaa2gga1
ttg1tcg1tagtgg1
atgj1acg1aag1agg
ctg2ccgcagcgg1
gtggcggagggg
baci>1aa=1aa-5s+5s-16s+16stotal
ppm2215542
bc42 ppm. Distribution des blocs avec rRNA. Chromosome
g1t1 
atgitcttatatgf3
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc2tcc2tac3tgc1
atc1acc1aac4agc2
ctcccccac1cgt4
gtcgccgac4ggc4
ttatcataatga
ataaca3aaa5aga
cta2cca4caa3cga
gta5gca2gaa4gga3
ttg2tcgtagtgg
atgj2acgaagagg
ctg1ccgcagcgg
gtggcggagggg
baci>1aa=1aa-5s+5s-16s+16stotal
ppm6868
bc43 ppm. Distribution des blocs sans rRNA. Plasmide
g1t1 
atgi1tcttatatgf1
attactaatagt
ctt2cctcatcgc
gttgctgatggt
ttc2tcc1tac3tgc1
atc3accaac3agc1
ctcccccac1cgt
gtcgccgac2ggc1
tta2tca2taatga
ata1aca2aaa1aga1
cta1cca2caa2cga2
gtagca1gaa2gga3
ttg1tcg2tagtgg3
atgjacg1aagagg
ctgccgcagcgg
gtggcggagggg
baci>1aa=1aa-5s+5s-16s+16stotal
ppm45651

Paenibacillus mucilaginosus 3016

pmq opérons

  • Liens: gtRNAdb , NCBI , génome
  • Lien tableur: pmq opérons
  • Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
B5 Paenibacillus mucilaginosus 3016
58.3%GC24.7.19 Paris110 doublesintercalcdsaaavec aacdsacdsd
9206..10276CDS322322357
10599..1213916s269
12409..1534323s95
15439..155555s178178178
15734..17190CDS3061486
20252..21532CDS474742747
21580..21666tca140140
21807..22157CDS hp@117117
22175..22357CDS hp23*61
22381..22524CDS hp86*48
comp22611..22796CDS hp138*62
comp22935..25265replicase156*777
25422..26165CDS220220248
comp26386..26460cgg183183183
26644..27168CDS151287175
178456..179454CDS298298333
179753..18129916s254
181554..18448823s168
184657..1847735s15
184789..184876agc2929
184906..184982atgj3939
185022..185097gta1515
185113..185189atgf1414
185204..185280gac4848
185329..185404ttc55
185410..185485aca99
185495..185579tac1515
185595..185670aaa183183183
comp185854..187104CDS30460417
comp217565..218146CDS129129194129
comp218276..218350cgg261261
218612..219643CDS34238344
253882..254526CDS677*677215
255204..25674516s268
257014..25994823s95
260044..2601605s55
260216..260292atc1919
260312..260387gca+1616
260404..260475gaa2 gca99
260485..260569tac2020
260590..260665aac33
260669..260744gta1919
260764..260840gac2020
260861..260933ttc1515
260949..261021aaa1010
261032..261118ctg33
261122..261196ggc1212
261209..261280tgc1515
261296..261369cgt55
261375..261448cca158*158
261607..261682gca44
261687..261759acc55
261765..261854tcg1919
261874..261961agc1717
261979..262054gtc55
262060..262134acg3939
262174..262262tcc4141
262304..262386ctc283283*283
262670..263515CDS314679282
578195..579055CDS324324287
579380..58092116s258
581180..58411423s166
584281..5843975s31
584429..584505aac66
584512..584600tcc3838
584639..584710gaa1111
584722..584797gta1717
584815..584891atgf1515
584907..584983gac6767
585051..585125acg1111
585137..585212cac1010
585223..585297caa55
585303..585378aaa1717
585396..585470ggc+4040
585511..585585ggc2 ggc2424
585610..585692ttg55
585698..585774cca1919
585794..585867gga11
585869..585942aga187187187
586130..586885CDS85587252
672473..672949CDS181815918
672968..673043aac77
673051..673138agc@2297297
673436..673507gaa99
673517..673599ctc180180
673780..674199CDS182140
674382..675278CDS159159299
675438..675520ctc646464
675585..675833CDS1845083
694284..695636CDS797*797451
696434..69797416s261
698236..70117023s94
701265..7013815s43
701425..701498atc1111
701510..701584gaa55
701590..701665gtc55
701671..701747atgf44
701752..701825tgg99
701835..701909caa88
701918..701990aaa1818
702009..702095ctg44
702100..702174ggc1111
702186..702259cgt1212
702272..702348cca577*577*577
702926..703120CDS37032065
1073441..1074214CDS373373258
1074588..107613616s260
1076397..107933123s168
1079500..10796165s9
1079626..1079701aac66
1079708..1079796tcc3838
1079835..1079906gaa1111
1079918..1079993gta1717
1080011..1080087atgf1313
1080101..1080177gac4949
1080227..1080302ttc44
1080307..1080382aca1313
1080396..1080481tac88
1080490..1080560tgg1313
1080574..1080649cac2626
1080676..1080747caa99
1080757..1080831ggc1212
1080844..1080917tgc1010
1080928..1081016tta2020
1081037..1081113cgt33
1081117..1081199ttg147147147
1081347..1081973CDS128630209
1210604..1213519CDS354354972
1213874..1213949gca1616
1213966..1214037gaa1212
1214050..1214125gta1616
1214142..1214218gac1717
1214236..1214311cac99
1214321..1214395caa99
1214405..1214477aaa88
1214486..1214572ctg33
1214576..1214647ggc169169169
comp1214817..1215602CDS378784262
1594387..1594665CDS537*53793
1595203..159674316s252
1596996..159993023s94
1600025..16001415s43
1600185..1600261atc1919
1600281..1600356gca1717
1600374..1600445gaa88
1600454..1600529gta+55
1600535..1600610aca2 gta1010
1600621..1600705tac1818
1600724..1600799aac44
1600804..1600879gta2121
1600901..1600977atgf1212
1600990..1601066gac3434
1601101..1601176cac1313
1601190..1601264caa88
1601273..1601345aaa1717
1601363..1601448ctc1313
1601462..1601548ctg55
1601554..1601628ggc1414
1601643..1601713tgc1010
1601724..1601797cgt55
1601803..1601876cca105105105
1601982..1602245CDS23253588
1834781..1835260CDS106106160106
1835367..1835439gcc137137
comp1835577..1835978CDS371114134
comp2207093..2208091CDS192192333192
2208284..2208367ctg+4949
2208417..2208500ctg2 ctg315315
2208816..2209952CDS1246561379
3456514..3456786CDS25625691
3457043..3457119ccc142142142
3457262..3457483CDS154775774
comp5005241..5005426CDS12712762127
comp5005554..5005636ctc4040
comp5005677..5005765tcc1313
comp5005779..5005852atg1919
comp5005872..5005958tcg167167
5006126..5006220ncRNA137703532
comp6383256..6384173CDS228228306
6384402..6384477gtc696969
comp6384547..6385458CDS5453304
comp6390912..6391130CDS14214273142
comp6391273..6391358tta77
comp6391366..6391442atgi1919
comp6391462..6391538atgf370370
comp6391909..6392460CDS962046184
7354507..7354737CDS34234277*342
comp7355080..7355162ctc2828
comp7355191..7355279tcc1212
comp7355292..7355368atgf1414
comp7355383..7355459atgj1414
comp7355474..7355561agc88
comp7355570..7355659tcg44
comp7355664..7355736acc44
comp7355741..7355816gca119
7355936..7356030ncRNA@336
comp7356067..7356140cca66
comp7356147..7356220cgt104*104
comp7356325..7356396ggc77
comp7356404..7356490ctg99
comp7356500..7356572aaa99
comp7356582..7356656caa99
comp7356666..7356741cac1717
comp7356759..7356835gac1212
comp7356848..7356923gta44
comp7356928..7357003aac1515
comp7357019..7357103tac88
comp7357112..7357187aca55
comp7357193..7357264gaa1515
comp7357280..7357355gcc99
comp7357365..7357438atc54
comp7357493..73576095s112
comp7357722..736065523s258
comp7360914..736245416s403*403
7362858..7363397CDS254752180
7618150..7618842CDS280280231*280
comp7619123..7619193ggg335335
7619529..7620461CDS46171311
comp7666633..7668069CDS104104479104
comp7668174..7668244ggg55
comp7668250..7668326cca106*106
comp7668433..7668506cgt1111
comp7668518..7668592ggc55
comp7668598..7668684ctg1313
comp7668698..7668783ctc1616
comp7668800..7668872aaa1010
comp7668883..7668967tac2828
comp7668996..7669071ttc12
comp7669084..76692005s159
comp7669360..767229723s256
comp7672554..767409516s537*537
7674633..7675382CDS177794250
comp7853177..7853761CDS575719557
comp7853819..7853892cac230230
comp7854123..7854196cac404*404
comp7854601..7854801CDS24563967
comp8100441..8100854CDS123123138123
comp8100978..81010945s167
comp8101262..810418023s248
comp8104429..810596916s325325
comp8106295..8106636CDS45281114
comp8151918..8152448CDS460*460177*460
comp8152909..81530315s94
comp8153126..815606023s258
comp8156319..815785916s456*456
8158316..8158642CDS98285109
8256928..8257746CDS838327383
comp8257830..8257903gga55
comp8257909..8257985cca1616
comp8258002..8258078cgt44
comp8258083..8258157ggc88
comp8258166..8258248cta4242
comp8258291..8258366aaa88
comp8258375..8258449caa99
comp8258459..8258532tgg44
comp8258537..8258613atgf55
comp8258619..8258694gtc55
comp8258700..8258774gaa1111
comp8258786..8258859atc43
comp8258903..82590195s94
comp8259114..826204823s255
comp8262304..826384516s306306
comp8264152..8264370CDS5837373
comp8322744..8323205CDS393393154*393
comp8323599..83237155s94
comp8323810..832674823s258
comp8327007..832854716s369369
comp8328917..8330413CDS21505499
comp8351919..8354414CDS396396832
comp8354811..8354884atg149149149
comp8355034..8355537CDS34450168
8389988..8390512CDS296296175*296
comp8390809..83909255s94
comp8391020..839395423s259
comp8394214..839575416s234234
comp8395989..8396255CDS22022289
comp8616478..8616924CDS417*417149
8617342..8617418gac157157157
8617576..8618541CDS105821322
8724363..8724614CDS455*45584
comp8725070..8725160tcg165165165
comp8725326..8725559CDS920578
opérondoublesintercalairescdsaaavec aacdsacdsd

pmq cumuls

cumuls. Paenibacillus mucilaginosus 3016
opéronsFréquences intercalaires tRNAsFréquences intercalaires cdsFréquences aas cds
effectifgammessans rRNAsavec rRNAsgammescdsgammescds dirigégammescdsacdsd
avec rRNAopérons141011010100158
16 23 5s 0520141075032012001810
16 atc gca0401121004400300126
16 23 5s a960141501160240093
max a2380012001180250064
a doubles3100002503100160000
spéciaux0120023006120370000
total aas138140003507140380000
sansopérons17160014006160590010
1 aa111800045031803100010
max a92000050032004110000
a doubles1205700
total aas351812862316231
total aas173
remarques3
avec jaunemoyenne16235213
variance20184122
sans jaunemoyenne1614207126
variance121110649

pmq blocs

B5 Paenibacillus mucilaginosus 3016, RNAs blocs
CDS29832437312
16s254258260159
23s168166168256
5s15319537
1er aaagcaacaacttc
aas916179
CDS183187147104
CDS6777975375443
16s26826125211294
23s959494258255
5s554343403306
atc / aas2211192312
CDS28357710534283
CDS322123460393296
16s269167949494
23s95248258258259
5s178325456369234

pmq remarques

*Remarques : 										
 Que des blocs 16-23-5s, 14. Très peu d’opérons sans rRNA, 35 aas pour 17 opérons. Très peu de doubles, 4 doublets.
#@1	Suite aux gènes de protéines cotranscrits avec les gènes de tRNA, voir eco, j’ai entouré les  opérons tRNA, dans les 7 génomes suivants, 
	Par 2 CDS, un avant et un après. Dans cette remarque j’ai voulu montré les intercalalires et les tailles des CDS qui suivent l’opéron. 
	Ce sont pour la plupart de petites protéines hypothétiques, largement plus petites que FT-U mais plus grandes que tpr (voir eco). 
										
#@2	L’intercalaire maximum qui laisserait penser qu’on a affaire à 2 opérons différents. Une recherche simple des promoteurs me paraît 
	difficile dans les bases de données , sauf dans BioCyc qui est payant, aussi je me base sur le regroupement des gènes pour  
	décider que je suis en présence d’un opéron ou non. Mais arrivé à  ce stade de ma réflexion, comme je l’expiciterai plus tard, je ne  
	m’interesse plus à l’existence de l’opéron mais seulement au regroupement CDS-séquence à t-rRNAs-CDS qu’il soit sur 1 ou 2 brins. 
	Ce sont seulement les statistiques des intercalaires et, surtout, le sens 16s-23s qui paraît prévilégier les intercalaires courts, 
	qui m’ontpoussé à changer cette limite vers 400 pb au lieu de 210, limite basée sur l’intercalaire max de 264 entre les 2 derniers 
        tRNAs du 21aas de bsu qui est bien un opéron dans BioCyc.
										
#@3	Voici une séquence qui n’est pas un CDS et pas sur le même brin que le reste du groupe, mais qui répond aux niveaux critères 
	de la remarque @2 précédente. L’intercalaire entre les 2 tRNAs du même brin qui enjambent cette séquence est de 250 pb. 
										
#Séquence des doubles : Très peu de doubles. 3 doublets se trouvent avec les rRNAs dont 1 est successif, un 4ème doublet successif se trouve dans 
	un opéron sans rRNAs. Les doublets dans ce génome sont rares mais se répartissent proportionnellement sur les 2 types d’opérons.

#Les intercalaires dans les blocs : rappel des opérons à bloc chez eco	voir	sigma FIS	362	162	Terminateur
	#: - CDS-16s		234, 298-537, 677 797		voir ici	sigma FIS	442	322	rien
	#: - 16s-23s		258				néant		sigma FIS	473	228	Terminateur
	#: - 23s-5s		168*4, 112, 94*9		93*7		sigma FIS	480	95	Terminateur
	#: - 5s-tRNA		9-15*3	31-54*6			8-12*2, 52	Sigma Lrp-leu	377	228	rien
	#: - L’orientation CDS-16s, CDS de fin de bloc.		83-105*3	Sigma Lrp-leu	373	300	Terminateur
								123-187*5	sigma FIS	614	74	Terminateur
								283-577*6					
										
#Les intercalaires entre tRNAs										
	#: - Dans les opérons sans rRNAs	inf à 20 14/18		16±12				
	#: - Dans les opérons à rRNAs		inf à 20 107/128	16±20				
										
#Les intercalaires avec les CDS des bordures										
	#: - tous les CDS									
	#: - Les CDS orientés									
										
#Taille des CDS de bordure en aas										
	#: - tous les CDS									
	#: - Les CDS orientés									
										
Notes : l’opéron de BioCyc et la direction 16s-23s dans les statistiques des intercalaires des CDS. Promoteur et terminateur. 

Les cds					
Bacteria; Firmicutes; Bacilli; Bacillales; Paenibacillaceae;Paenibacillus.					
bloc				protein		interc	aas
268	262304..262386		ctc		283	-
95	262670..263515		PRD domain	267	282
55	263783..265834		GlcT		179	684
atc	266014..266286		Hpr		-8	91
22	266279..268003		PeP			575
					
258	585869..585942		aga		187	-
166	586130..586885		biotine Stase	40	252
31	586926..587918		BioB		8	331
aac	587927..589093		nanoate		176	389
16	589270..589914		hydrolase		215
					
	20252..21532		Ser ligase	47	427
	21580..21666		tca		140	
	21807..22157		CDS hp		17	117
	22175..22357		CDS hp		23	61
	22381..22524		CDS hp		86	48
	22611..22796		CDS hp		138	62
	22935..25265		Replicase	156	777
	25422..26165		Peptidase	220	248
comp	26386..26460		cgg		183	
	26644..27168		sigma factor	151287	175

Les blocs à rRNAs					
CDS	298	324	373	12	
16s	254	258	260	159	
23s	168	166	168	256	
5s	15	31	9	537	
1er aa	agc	aac	aac	ttc	
aas	9	16	17	9	
CDS	183	187	147	104	
					
CDS	677	797	537	54	43
16s	268	261	252	112	94
23s	95	94	94	258	255
5s	55	43	43	403	306
atc/aas	22	11	19	23	12
CDS	283	577	105	342	83
					
CDS	322	123	460	393	296
16s	269	167	94	94	94
23s	95	248	258	258	259
5s	178	325	456	369	234

pmq distribution

Bc5 pmq, Paenibacillus mucilaginosus 3016. bacilli.
bc51 pmq, distribution des blocs sans rRNA
g1t1 
atgi1tcttatatgf1
attactaatagt
cttcctcatcgc
gttgctgatggt
ttctcc1tactgc
atcaccaac1agc1
ctc3ccc1cac3cgt
gtc1gcc1gac2ggc1
tta1tca1taatga
ataacaaaa1aga
ctaccacaa1cga
gta1gca1gaa2gga
ttgtcg2tagtgg
atgj2acgaagagg
ctg3ccgcagcgg2
gtggcggagggg1
baci>1aa=1aa-5s+5s-16s+16stotal
pmq241135
bc52 pmq. Distribution des blocs avec rRNA.
g1t1 
atgitcttatatgf7
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc4tcc4tac6tgc3
atc5acc2aac4agc3
ctc4ccccac4cgt7
gtc3gcc1gac6ggc9
tta1tcataatga
ataaca4aaa8aga1
cta1cca7caa4cga
gta7gca4gaa4gga2
ttg2tcg2tagtgg3
atgj2acg2aagagg
ctg5ccgcagcgg
gtggcggagggg1
baci>1aa=1aa-5s+5s-16s+16stotal
pmq138138

pmq intercalaires entre cds

  • Lien NCBI
  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

Fréquences: gammes, moyennes et variances

intercalaires	total	%	intercalaires	moyenne	ecartype	plage
négatif		487	11	négatif 	-12	17		-1 à -119
zéro		22	0.5				
1 à 200		2560	57	0 à 200		87	59	
201 à 370	920	21	201 à 370	266	47	
371 à 600	315	7.1	371 à 600	463	66	
601 à max	157	3.5	601 à 1613	868	250	
Total 4461			Total 4454	166	192		-119 à 1613

pmq les fréquences

  • Lien tableur: pmq intercalaires entre cds
  • Légende: long, longueur en pbs.
    - 16s, 23s5s, blocs à rRNAs seuls.Voir lmo opérons pour leurs intercalaires
    - agc, aaa-atc, blocs à tRNAs seuls. Voir pmq opérons pour leurs intercalaires
pmq Les fréquences des intercalaires entre cds
adresseintercalinter-gènelongintercalfréquencecumul/%intercalfréquence
253921814316s 22aas7187-7011022
1594387731616s 19aas6678-602-141
694284728916s 11aas5918-503-23
1073441713216s 17aas6605-409-31
578195707416s 16aas6567-3018min à -1-4241
178456639916s 9aas5917-2043487-50
92065457néant-106111%-64
43751631613néant0362-72
32349761576néant10185-847
14336631551néant20221-91
19613321546néant30193-106
19483921534néant40172-1122
40645081497néant50126-120
17358631485néant60107-133
40674491378néant70107-1417
28756261352néant80148-150
8969261351néant90130-163
12106251297100122-1710
20695621279110115-180
15291841277120110-190
18972521277130128-208
29102371276140100-210
37490651276150111-223
4906359127016089-2310
192151612631701031 à 200-240
8800031252180992560-253
500453611931909557%-2613
359256118420099-270
1773925115721097-280
3687367114122089-296
1886363110923083-300
5259590108824086-311
3089348108725071-326
328760110842605652
933373107727065reste14
1233491105428054487
1379835105229036
14381971052300376004304
297038710453104465031
24770510383204270018
168728210273304175011
2362680101334032201 à 37080017
350339208509
4544722-119shift 2gènes161053603021%90012
5318942-119shift 2gènes186553702495011
1976860-116shift 2gènes16153803010006
5337597-115shift 2gènes19733902210504
3673911-113shift 2gènes4194002011007
5433750-101shift 2gènes50024101611502
2131496-95shift 2gènes11894201512003
4669248-954301812500
2553569-894402013009
2198194-754501213500
1029214-744601214003
1297148-654701314500
3921139-654801515002
4451392-564901115502
4115825-535001716002
4456706-51510816501
2961518-4952012150
5210453-495309
1644157-4754014371 à 600
2542276-4655012315
1663382-4456097.1%
3095318-4457011
4122676-415804601 à max
4613340-415909157
4039349-4060063.5%

Lactobacillus delbrueckii subsp. bulgaricus ATCC BAA-365

lbu opérons

  • Liens: gtRNAdb , NCBI
  • Lien tableur: lbu opérons
  • Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
B6 Lactobacillus delbrueckii subsp. bulgaricus ATCC BAA-365
49.8%GC29.7.19 Paris110 doublesintercalcdsaaavec aacdsacdsd
comp18533..19237CDS128128235128
19366..19438act@1195195
19634..20371CDS6912246
27284..29785CDS276276*834
30062..30134act134134134
30269..30907CDS11768213
42676..43248cds hp451*451*191
43700..4527116s209
45481..4839123s69
48461..485775s275275275
48853..49091cds hp5667980
comp105771..106547CDS565625956
comp106604..106679aag125125
106805..107533CDS103754243
211288..212553CDS9494422
212648..212720acc232323
comp<212744..213262CDS64997173
278260..278928CDS696922369
comp278998..279068ggg181181
279250..280275CDS44047342
comp324323..324949CDS117117209117
325067..325138ggc+44
325143..325216ccg2 ggc108
325325..325399ggc155155
325555..326016CDS37886154
363903..364394CDS989816498
364493..364564caa614*614
365179..366360CDS-14*394
366347..367402CDS7575352
367478..367559tac55
367565..367636caa626262
<367699..368318CDS14127207
382446..382907CDS303015430
382938..383026ctt118118
383145..383768CDS70441208
454210..455529CDS616144061
455591..455665agg341341
456007..457035CDS75557343
532593..533285CDS828223182
comp533368..533442cgg296296
533739..534782CDS48963348
583746..584728CDS575732857
comp584786..584858cag55
comp584864..584935gag170170
585106..586110CDS94988335
681099..682741CDS518*518*548
683260..68483116s106
684938..685011atc6969
685081..685153gca127
685281..68819123s68
688260..6883765s208208208
comp688585..689801CDS55794406
comp745596..745821CDS13413475134
comp745956..746044tcg787*787
746832..749597CDS36741*922
786339..787004CDS545422254
787059..787142ctg109109
comp787252..787872CDS2072207
comp789945..791867CDS613*613*641
792481..79405216s105
794158..794231atc6969
794301..794373gca126
794500..79741023s69
797480..7975965s878787
797684..798559CDS36292
comp798596..800178CDS530*530*528
800709..800781aac@233
800785..800858cca2424
800883..800954ggc3030
800985..801058cgt22
801061..801133gta33
801137..801208gaa4242
801251..801338tca99
801348..801421atgf33
801425..801498gac66
801505..801577ttc88
801586..801667tac44
801672..801742tgg1313
801756..801831cac2626
801858..801928tgc2828
801957..802041ttg356356356
802398..802961CDS284259188
comp1087221..1088531CDS157157437157
comp1088689..1088760caa656*656
comp1089417..1090313CDS173317*299
comp1263631..1265769CDS188188*713188
comp1265958..1266031aga222222
1266254..1268632CDS84103*793
comp1352736..1354022CDS989842998
1354121..1354204ctg204204
comp1354409..1354928CDS13182173
comp1368111..1369307CDS161161399161
comp1369469..1369541gta33
comp1369545..1369616gaa138*138
comp1369755..1369828atgj66
comp1369835..1369925tcc88
comp1369934..1370006aac7
comp1370014..13701305s69
comp1370200..137311123s126
comp1373238..1373310gca6969
comp1373380..1373453atc105
comp1373559..137513016s547*547
1375678..1376604CDS102845*309
comp1479450..1479824CDS200200125
comp1480025..1480101gac2626
comp1480128..1480199gaa33
comp1480203..1480275gta22
comp1480278..1480351cgt3535
comp1480387..1480458ggc36
comp1480495..14806115s68
comp1480680..148359023s208
comp1483799..148537016s153153153
comp1485524..1485716CDS2094464
comp1506661..1507464CDS270270268
comp1507735..1507807aag+3434
comp1507842..1507914aag5 aag3333
comp1507948..1508020aag3333
comp1508054..1508126aag@33333
comp1508160..1508232aag130130130
comp1508363..1509226CDS167288
1509394..1510872CDS106106493106
comp1510979..1511051gta33
comp1511055..1511126gaa151*151
1511278..1511366ctt113113
1511480..1512010CDS21195177
comp1533206..1534129CDS355355308
comp1534485..1534557acg154154154
comp1534712..1535950CDS18502413
1554453..1554638CDS30330362303
comp1554942..1555029agc673*673
comp1555703..1556203CDS595*167
1556799..1558178CDS277277460
comp1558456..15585725s68
comp1558641..156155123s126
comp1561678..1561750gca6969
comp1561820..1561893atc105
comp1561999..156357016s189189189
1563760..1563948CDS1927463
comp1583223..1584392CDS151151390151
comp1584544..1584628ttg+1717
comp1584646..1584730ttg2 ttg2828
comp1584759..1584829tgc2 ttc2626
comp1584856..1584931cac2 atgf1313
comp1584945..1585015tgg44
comp1585020..1585101tac88
comp1585110..1585182ttc66
comp1585189..1585262gac33
comp1585266..1585339atgf99
comp1585349..1585436tca4242
comp1585479..1585550gaa258*258
comp1585809..1585899agc22
comp1585902..1585975atc33
comp1585979..1586049gga1414
comp1586064..1586136ttc1717
comp1586154..1586227atgf1111
comp1586239..1586312atgi1212
comp1586325..1586398atg3636
comp1586435..1586508cca66
comp1586515..1586588cgt55
comp1586594..1586679tta1515
comp1586695..1586766ggc44
comp1586771..1586843aca1111
comp1586855..1586936cta1212
comp1586949..1587021aaa22
comp1587024..1587096gta157157
comp1587254..1588681CDS539476
comp1589221..1590557CDS156156446156
comp1590714..15908305s68
comp1590899..159380923s126
comp1593936..1594008gca6969
comp1594078..1594151atc105
comp1594257..159582816s581*581
comp1596410..1597276CDS189853*289
comp1787130..1788440CDS298298437298
comp1788739..17888555s68
comp1788924..179183423s@4208
comp1792043..179361416s436*436
comp1794051..1794596CDS-8*182
comp1794589..1795436CDS138138283138
comp1795575..1795648gac33
comp1795652..1795724gta22
comp1795727..1795800cgt3535
comp1795836..1795907ggc1919
comp1795927..1796000cca33
comp1796004..1796076aac7
comp1796084..17962005s68
comp1796269..179917923s208
comp1799388..180095916s501*501
comp1801461..1802087CDS*209

lbu cumuls

cumuls. Lactobacillus delbrueckii subsp. bulgaricus ATCC BAA-365
opéronsFréquences intercalaires tRNAsFréquences intercalaires cdsFréquences aas cds
effectifgammessans rRNAsavec rRNAsgammescdsgammescdsdgammescdsa
avec rRNAopérons910010101005
16 23 5s 022033950220020011
16 atc gca5401131001240230019
16 23 5s a260201501160340011
max a780052001480350011
a doubles010000250310046002
autres012000300612027001
total aas2614001350214058002
sansopérons2316010400216059001
1 aa16180004501180110001
max a26200005001200211000
a doubles3101050
total aas724818643264
total aas98
remarques
avec jaunemoyenne138320
variance81182
sans jaunemoyenne1429159114275
variance12298550122

lbu blocs

B6 Lactobacillus delbrueckii, RNAs blocs
5s685s68
23s12623s126
gca69gca69
atc105atc105
16s16s
aac7
16s10616s1055s69
atc69atc6923s126
gca127gca126gca69
23s6823s69atc105
5s5s16s
ggc36aac7
5s685s685s6816s209
23s20823s20823s20823s69
16s16s16s5s

lbu remarques

  • Les indices des bacilli
*Remarques : Ce génome se distingue par un indice 4 fois supérieur des gènes de tRNAs 					
	par rapport à ceux du total des bacilli.				
					
@1	Les gènes de tRNA se terminant par g et t sont rares chez les 				
	et ont un indice total de 5 par génome. Ce génome en a 20.				
	La plus part sont isolés, seuls ou dans de petits clusters sans rRNA.				
	aag se distingue par sa fréquence élevée, 6, et surtout par sa répétition de 5				
	dans un seul cluster.				
	Cependant  chez les bacilli les gènes présents ont un indice plus élevés que 				
	les très rares. J’ai repéré 4 groupes :	
		
			indice		présents			absents
	rares moyens	99>ind>43	aag6 cgg agg ctt2 ctg2 		(ctc gtc)
					tcg acg (acc tcc)		
	rares		26>ind>11	ggg ccg cag gag act2		(gcc)
	très rares	7,9>ind>0,6					gtg gcg ttt cct (ccc ata)
	nuls		0,6>ind						autres xxt, tous absents
					
@2	Les clusters sans rRNAs sont beaucoup plus longs que ceux avec rRNA, 26 15 5,				
	contre 6 5 5.	Les petits clusters sont en grande partie ceux de @1.			
	Les clusters  26 et 15 n’ont pas de doublons ou très peu et se comportent comme				
	les clusters avec rRNAs longs des bacilli (ppm bsu lmo lma* pmq ban*) :				
	 pas de répétition, pas de séquence et doublons séparés. 				
					
@3	répétition de 5 de aag, voir @1 ci-dessus.				
					
@4	5 blocs 635 et 4 blocs 6-atcgca-35 avec des intercalaires identiques. Très peu de 				
	gènes tRNA à la suite de ces blocs (6 5 5 )  contrairement aux autres bacilli étudiés qui 				
	dépassent les 21 aas : ppm bsu lmo lma* pmq ban*.				
					
Séquences des doubles (indiqués par le signe + dans le tableau): 
  Les doubles, peu nombreux, se trouvent dans les clusters sans rRNAs. pas de séquences mais une répétition de 5 chez les gènes  rares.
  Voir ci-dessus @2.		

lbu distribution

Bc6 lbu, Lactobacillus delbrueckii subsp. bulgaricus ATCC BAA-365. bacilli.
bc61 lbu, distribution des blocs sans rRNA.
g1t1 
atgi1tcttatatgf3
attactaatagt
ctt1cctcatcgc
gttgctgatggt
ttc3tcc2tac3tgc2
atc1acc1aac1agc1
ctcccc2cac2cgt2
gtcgccgac2ggc4
tta1tcataatga
ataacaaaa1aga
cta1cca1caa1cga
gta3gcagaa3gga1
ttg3tcgtagtgg2
atgj1acgaag5agg
ctgccgcag1cgg
gtggcggag1ggg
baci>1aa=1aa-5s+5s-16s+16stotal
lbu5656
bc62 lbu. Distribution des blocs avec rRNA.
g1t1 
atgitcttatatgf
attact2aatagt
ctt1cctcatcgc
gttgctgatggt
ttctcc1tactgc
atc5acc1aac2agc1
ctcccccaccgt2
gtcgccgac2ggc2
ttatcataatga
ataacaaaaaga1
ctacca1caa2cga
gta3gca5gaa2gga
ttgtcg1tagtgg
atgj1acg1aag1agg1
ctg2ccgcagcgg1
gtggcggagggg1
baci>1aa=1aa-5s+5s-16s+16stotal
lbu16161042

ban* Bacillus anthracis strain 2002013094

  • Attention: la notation KEGG pour ce génome n'existe pas. Elle est remplacée par ban*. Mais par commodité j'ai mis ban pour la suite. Ce n'est pas le génome ban de KEGG Bacillus anthracis Ames

ban opérons

  • Liens: gtRNAdb , NCBI , génome [orgn]
  • Lien tableur: ban opérons
  • Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
B7 Bacillus anthracis strain 2002013094
35.1%GC15.8.19 Paris112 doublesintercalcdsaaavec aacdsacdsd
618142..618366CDS18818875188
618555..618627gtc419*419
comp619047..619235CDS63
comp1102183..1102602CDS130130140130
comp1102733..1102804gaa+11
comp1102806..1102880aac2 aca88
comp1102889..1102965atc2 tca1111
comp1102977..1103047tgg66
comp1103054..1103126aca99
comp1103136..1103211ttc99
comp1103221..1103296gac44
comp1103301..1103377atgf2020
comp1103398..1103490tca5454
comp1103545..1103637tca2020
comp1103658..1103730gca1616
comp1103747..1103820cca1010
comp1103831..1103904cgt33
comp1103908..1103996tta1616
comp1104013..1104087ggc2929
comp1104117..1104197cta2222
comp1104220..1104295cac99
comp1104305..1104380aca44
comp1104385..1104460gta4
comp1104465..11045805s97
comp1104678..110760423s141
comp1107746..110929916s694*694
1109994..1113038CDS*1015
comp1306706..1307848CDS198198381
comp1308047..1308120gga115115115
comp1308236..1308889CDS218
1312025..1312345CDS207207107207
comp1312553..1312637ttg1010
comp1312648..1312718tgc1414
comp1312733..1312807ggc55
comp1312813..1312887caa6363
comp1312951..1313026cac1919
comp1313046..1313119tgg77
comp1313127..1313210tac1717
comp1313228..1313303gta55
comp1313309..1313383gaa2424
comp1313408..1313480acc44
comp1313485..1313559aac9
comp1313569..13136845s96
comp1313781..131670923s141
comp1316851..131840516s386*386
1318792..1319148CDS119
1556278..1556507CDS57577757
comp1556565..15566805s49
comp1556730..156012623s173
comp1560300..156213216s476*476
1562609..1563322CDS238
>1566949..1567219CDS99999099
comp1567319..15674345s46
comp1567481..157040923s142
comp1570552..157211516s451*451
1572567..1574498CDS*644
1579539..1580615CDS141435914
comp1580630..15807455s45
comp1580791..158391223s153
comp1584066..158572016s294294
comp1586015..1587520CDS*502
comp1600693..1601166CDS174174158
comp1601341..1601416gac33
comp1601420..1601496atgf12
comp1601509..16016245s@146
comp1601671..160459823s141
comp1604740..160629416s75
comp1606370..1606440gga11
comp1606442..1606518cca+44
comp1606523..1606599cgtSéquence 1033
comp1606603..1606691tta1616
comp1606708..1606782ggc2929
comp1606812..1606892cta1414
comp1606907..1606982aaa55
comp1606988..1607062caa87*87
comp1607150..1607225gac4646
comp1607272..1607347gta44
comp1607352..1607426gaa11
comp1607428..1607502aac2 aac88
comp1607511..1607587atc1111
comp1607599..1607669tgg66
comp1607676..1607748aca99
comp1607758..1607833ttc88
comp1607842..1607917gac44
comp1607922..1607998atgf2020
comp1608019..1608111tca2 tca5454
comp1608166..1608258tca2020
comp1608279..1608351gca1616
comp1608368..1608441cca1010
comp1608452..1608525cgt33
comp1608529..1608617tta1616
comp1608634..1608708ggc2929
comp1608738..1608818cta1313
comp1608832..1608907aaa55
comp1608913..1608987caa87*87
comp1609075..1609150gac4646
comp1609197..1609272gta44
comp1609277..1609351gaa88
comp1609360..1609450agc33
comp1609454..1609528aac114114114
comp1609643..1610101CDS153
comp1702642..1703788CDS114114382114
comp1703903..1703975gca1010
comp1703986..1704057ggc55
comp1704063..1704138aaa55
comp1704144..1704218caa6565
comp1704284..1704366tac1717
comp1704384..1704459gta55
comp1704465..1704539gaa2424
comp1704564..1704636acc44
comp1704641..1704715aac9
comp1704725..17048405s82
comp1704923..170785123s141
comp1707993..170954516s223223
comp1709769..1709987CDS73
comp1767157..1767618CDS206206154206
comp1767825..17679405s45
comp1767986..177091323s141
comp1771055..177260816s372*372
comp1772981..1774480CDS*500
comp1787717..1790188CDS259259*824
comp1790448..1790519gaa1313
comp1790533..1790606atgj@2160160160
comp1790767..1791249CDS161
comp1820538..1820717CDS19019060190
comp1820908..18210235s44
comp1821068..182399623s77
comp1824074..1824149gca88
comp1824158..1824234atc130
comp1824365..182591916s217217
comp1826137..1826406CDS90
comp1832600..1832992CDS166166131
comp1833159..1833251tca156156156
comp1833408..1834682CDS425
1839668..1840669CDS343433434
comp1840704..18408195s44
comp1840864..184379123s76
comp1843868..1843943gca88
comp1843952..1844028atc130
comp1844159..184571316s240240
comp1845954..1848425CDS*824
1873838..1875127CDS139139430139
1875267..1875342aaa1313
1875356..1875427gaa2121
1875449..1875524gac4141
1875566..1875638ttc403*403
1876042..1876749CDS236
comp2217640..2217846CDS20520569205
2218052..2218130cgg255255
2218386..2219693CDS436
comp2428815..2429495CDS404*404227
2429900..243145616s139
2431596..243452423s97
2434622..24347375s4
2434742..2434817gta+44
2434822..2434897aca2 cta99
2434907..2434982cac2 aca2222
2435005..2435085cta2929
2435115..2435189ggc1616
2435206..2435294tta33
2435298..2435371cgt1010
2435382..2435455cca1616
2435472..2435544gca2020
2435565..2435657tca5454
2435712..2435805cta2020
2435826..2435902atgf11
2435904..2435979gac1212
2435992..2436067ttc1414
2436082..2436157aca1010
2436168..2436243aaa1313
2436257..2436327gga1010
2436338..2436414atc77
2436422..2436496aac77
2436504..2436594agc66
2436601..2436672gaa595959
2436732..2436842CDS37
2798971..2799474CDS109109168109
2799584..2799657gga11
2799659..2799735aga407*407
2800143..2800343CDS67
comp2991608..2992366CDS242242253
2992609..2992682atgi221221221
2992904..2993515CDS204

ban cumuls

  • Lien tableur: ban cumuls
  • Note du 16.11.20: attention le @1 doit être intégré dans les rRNA et non dans les sans. Refaire les calculs.
cumuls. Bacillus anthracis strain 2002013094
opéronsFréquences intercalaires tRNAsFréquences intercalaires cdsFréquences aas cds
effectifgammessans rRNAsavec rRNAsgammescdsgammescdsdgammescdsa
avec rRNAopérons11132101010010
16 23 5s 042025475022012009
16 atc gca2403610034013006
16 23 5s a5604215066024004
max a21800220078005004
a doubles210020250810016001
autres012000300312047001
total aas6614000350014028000
sansopérons916000400216029002
1 aa5180004503180010000
max a33200005000200211001
a doubles100040
total aas463759341938
total aas112
remarques2
avec jaunemoyenne1815232132274
variance211414362238
sans jaunemoyenne14165191
variance1471124

ban blocs

B7 Bacillus anthracis, RNAs blocs
aagtaaacatgfaacCDS
inter aa49129404
5s97964682139
23s14114114114197
16s694386752234
CDSCDSCDSggaCDSgta
CDS579914206
5s49464545
23s173142153141
16s476451294372
CDS19034
5s4444
23s7776
gca88
atc130130
16s217240
CDS

ban séquences

  • Lien au tableau ban opérons
  • Lien tableur: ban séquences
  • Lien bsu-lmo
  • Légende: 33 aas, cluster à 33 gènes de tRNA
    - répétitions de séquence intra bloc: Dans le bloc 33aas uniquement, il y a une séquence de 10aas répétée. Elle est divisée de 2 séquences de 5 chacune, cyan et bleu.
    - répétitions de séquence entre blocs
    • - entre les clusters 11aas et 9aas: une séquence de 5 se répète, le jaune.
    • - entre les clusters 33aas 21aas et 19aas je repère 3 grandes séquences qui se répètent, contenant des sous séquences qui se répètent aussi: séquence de 16 (cadre solide) commune à 33aas et 19aas, séquence de 15 (cadre en tirets) commune à 21aas et 19aas et une séquence de 12 commune aux 3 clusters et composée de la séquence 5 cyan et d'une séquence de 7aas (rouge) contenant atgf et un doublet tca. Il faut noter ici que tca est modifié en cta alors que les intercalaires atgf-cta-tca et atgf-tca-tca ne changement pas, 20-54. C'est que cta et tca sont des tRNAs de même longueur, seule une mutation ponctuelle est en cause.
    • - entre le cluster 33aas et 21aas existe un bloc commun de 3 gènes gaa-agc-acc qu'on ne peut mettre en parallèle. A-t-il un rôle important dans les recombinaisons?
    - Les intercalaires qui changent: la plus part des intercalaires se répètent comme les gènes sauf les intercalaires de aca-ttc-gac-atgf qui sont constants dans les clusters 33aas et 19aas et diffèrent dans le 21aas. De même pour cca-cgt (cyan) qui diffèrent dans 33as mais restent constants entre les 3 clusters. Ce qui différencie les 2 séquences cyan de 33aas. En fin de 33aas le triplet gaa-agc-aac se répète au début de 21aas mais avec des intercalaires changeant, 8-3 contre 6-7. Ces changements dans les intercalaires laissent penser qu'ils se produisent lors des recombinaisons des blocs intra cluster (cyan 1 et 2 de 33aas) ou entre clusters.
B7. Bacillus anthracis strain 2002013094,
séquences des gènes tRNA dans les clusters à rRNA.
33 aasinter21 aasinter19 aasinter11 aasinter
gga1ttg10
cca4tgc14
cgt3ggc5
tta16caa63
ggc29cac19
cta14tgg7
aaa5tac17
caa87gta5
gac46gaa6gaa24
gta4agc7acc4
gaa1aac7gaa1aac
aac8atc10aac8
atc11gga13atc11
tgg6aaa10tgg6
aca9aca14aca9
ttc8ttc12ttc9
gac4gac1gac4
atgf20atgf20atgf20
tca54cta54tca549 aasinter
tca20tca20tca20
gca16gca16gca16gca10
cca10cca10cca10ggc5
cgt3cgt3cgt3aaa5
tta16tta16tta16caa65
ggc29ggc29ggc29tac17
cta13cta22cta22gta5
aaa5cac9cac9gaa24
caa87aca4aca4acc4
gac46gtagtaaac
gta4
gaa8
agc3
aac

ban occurrences

  • Légende: atgi pour Ile2, atgf pour fMet et atgj pour Met
I11. Occurrence des gènes tRNA chez ban*
ttttcttattgt
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc4tcctac2tgc1
atc5acc2aac6agc2
ctcccccac3cgt4
gtc1gccgac7ggc6
tta4tca6taatga
atgi1aca5aaa5aga1
cta5cca4caa4cga
gta6gca6gaa8gga4
ttg1tcgtagtgg3
atgf/j4/1acgaagagg
ctgccgcagcgg1
gtggcggagggg

ban intercalaires

  • Légende: aa pour gène tRNA, inter aa pour intercalaire rRNA-aa
I11. Intercalaires des rRNAs chez ban*
aagtaaacatgfaacCDS
inter aa49129404
5s97964682139
23s14114114114197
16s694386752234
CDSCDSCDSggaCDSgta
CDS579914206
5s49464545
23s173142153141
16s476451294372
CDS
CDS19034
5s4444
23s7776
gca88
atc130130
16s217240
CDS

ban remarques

  • Liens: ban séquences, ban intercalaires, ban occurrences, indices bacilli
  • Note du 16.11.20: attention le @1 doit être intégré dans les rRNA et non dans les sans. Refaire les calculs.
  • Remarques:
    1. @1 Existence des blocs à rRNA inversés
      - Ce sont des blocs dont les gènes tRNAs se trouvent juste après le rRNA 16s au lieu d’être après le 5s ou parfois le 23s dans le sens 16s23s5s. J’en ai rencontré beaucoup dans les génomes détaillés dans ces annexes. Mais leurs présences systématiques dans les études exhaustives des fiches me laissaient penser à croire en leur existence.
      - En effet, le comportement des blocs normaux laissait penser que la juxtaposition des gènes tRNAs et du 16s était fortuite, le bloc 16s serait mobile et s’introduirait au hasard à côté d’une séquence de gènes tRNA. Dans l’étude des intercalaires entre gènes de tRNA, je voulais savoir s’il y avait une différence entre les blocs à rRNA et les blocs sans. Tout au début, je considérais les gènes de tRNA des blocs inversés comme appartenant aux blocs sans rRNA. Cependant l’intercalaire entre le 16s et le 1er aa était si faible quelquefois que cela me gênait de l’en séparer. Dans les cumuls de ce génome ban*, j’ai considéré la séquence de 33aas comme n’appartenant pas au bloc 16s adjacent. Cependant la moyenne et la variance des intercalaires sont les mêmes que celles des blocs 16s normaux.
      -Avec le génome ban* j’ai pu comparer les séquences des gènes tRNA ici et il est évident qu’avec la disposition des sous séquences et leurs intercalaires tout se passe comme si les réarrangements étaient dus à l’existence des blocs 16s. Et donc que la séquence des 33aas devait se trouver à la suite du 5s et a été déplacée par retournement, ce qui a facilité l’homogénéisation des séquences 12aas (cadres en tirets) par conversion dans les 3 blocs. Ensuite une conversion entre blocs 2 à 2 s’est faite séparément. Donc avant les conversions, il y a eu le retournement de 33aas et avant d’être 33aas, il y a eu duplication du bloc cyan+bleu.
      - Donc après cette analyse des séquences, je considérerai tous les blocs inversés comme appartenant au bloc 16s quelle que soit la distance de juxtaposition. Il reste cependant une inconnue : est-ce que l’espace entre 16s et le 1er aa est dû à notre incapacité à reconnaître une séquence fonctionnelle, ou bien effectivement dans certains rares cas li y a eu juxtaposition au hasard.
    2. @2 Il n’y a que 13 tRNAs sans rRNA. Tous les atgf se trouvent avec rRNA alors qu’il n’y a qu’un seul exemplaire de atgi et atgj. Voir le tableau des occurrences totales de ban* et le tableau ci-dessous pour les gènes rares.
      - Ils se répartissent en 8 clusters dont 5 ne contiennent qu’un seul gène. Trois gènes rares chez les bacilli s’y trouvent, gtc cgg aga.
      - Par comparaison les clusters à rRNAs ne contiennent que 3 gènes rares sur 99, 2 acc et tgc.
      - Le plus grand cluster à 4 gènes ressemble beaucoup au au bloc bleu du cluster 33aas, aaa gaa gac ttc contre aaa caa gac gta gaa pour le bloc bleu.
      - Au tableau des indices bacilliles 3527 gènes atg ne sont pas différenciés pour 672 génomes. Le décompte suivant montre que atgi et agj ont un indice moyen, un gène par génome, donc c’est un gène obligatoire comme l’est tgc.
		
Les gènes rares chez les bacilli				Clusters sans rRNAs de ban*
	indice pour 100 génomes	   occurrence chez ban*			
	tcc		108			0			aaa  gaa  gac  ttc
	acc		83			2			gtc
	ccc		5,7			0			gga
	gcc		26			0			gaa atgj
	tgc		106			1			tca
	aga		108			1			cgg
	cga		5,4			0			gga  aga
	agg		66			0			atgi
	cgg		99			1			
	ctc		67			0			
	gtc		47			1			

Décompte des atg pour 678 génomes, 30.10.19 Tanger .			
	atg	indice	décompte	
	fMet	260	1762	
	Ile2	133	901	
	Met	139	941	
	total		3604
  • Les intercalaires des clusters à rRNAs. Dans le tableau ban intercalaires, je ne mets en valeur que les intercalaires faisant intervenir les rRNAs.
    - les intercalaires 5s-23s: 4 blocs avec des gènes tRNA ont un intercalaire double des 7 autres et le bloc inversé se comporte comme les autres: 97-82 contre 49-44.
    - L'intercalaire 23s-16s: il est constant pour 7 blocs, 142-139 les 2 autres ont 10% (153) et 20% (173) de plus.
    - L'intercalaire aa-5s: il est très faible, 4-12. L’intercalaire aa-16s du bloc inversé est du même ordre que le 5s-23s et cela est du au retournement de la séquence des 33aas.
    - L'intercalaire cds-5s : sur les 6 blocs qui le portent 3 sont très faibles, 57 34 14 et les 3 autres sont moyens relativement aux cds-16s, 99 190 206, et restent orientés cds-16s-5s-cds.
    - L'intercalaire cds-16s: ils sont très élevés mais peu variables. 5 blocs ne contenant pas d'aas tournent autour de 420, 476-372, un sixième a 50% de plus, 694. Les 4 restants ont un intercalaire faible et se répartissent en 2 avec aas, 217 240, et 2 sans aas, 223 294.
    - L'homogénéité de ces blocs est comparable avec celle de bsu.
  • Séquence des doubles : Très peu de doubles, si l’on ne tient pas compte de la duplication des blocs cyan et bleu de 10 aas dans le cluster à 33aas. Dans celui-ci il y a 2 doubles gac aac et une répétition tca-tca. Si l’on tient compte des aas proche du 5s, il faut ajouter atgf (double) et gac (triple). Pour le cluster 21aas aca et cta sont doubles, et pour le 19aas aca est double et tca répété. Les clusters 11aas et 9aas n’ont pas de doubles.

ban distribution

  • Lien tableur: ban distribution
  • Notes:
    - Les avant 16s, -16s, sont comptés comme les après 5s, +5s. Ils sont au nombre de 33 et ne sont pas soulignés.
    - Les 1-3aas après 5s, +5s, sont soulignés: atgf gac
    - duplicata: tca2
Bc7 ban, Bacillus anthracis strain 2002013094. bacilli.
bc71 ban, distribution des blocs sans rRNA.
g1t1 
atgi1tcttatatgf
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc1tcctactgc
atc2accaacagc1
ctcccccaccgt
gtc1gccgac1ggc2
ttatca1taatga
ataacaaaa1aga
ctaccacaacga1
gtagca2gaa2gga
ttgtcgtagtgg
atgj1acgaagagg
ctgccgcagcgg
gtggcggagggg
baci>1aa=1aa-5s+5s-16s+16stotal
ban85417
bc72 ban. Distribution des blocs avec rRNA.
g1t1 
atgitcttatatgf4
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc3tcctac2tgc1
atc3acc2aac6agc2
ctcccccac3cgt4
gtcgccgac6ggc6
tta4tca5taatga
ataaca5aaa4aga
cta5cca4caa4cga
gta6gca4gaa6gga2
ttg1tcgtagtgg3
atgjacgaagagg
ctgccgcagcgg
gtggcggagggg
baci>1aa=1aa-5s+5s-16s+16stotal
ban9595

bacilli synthèse

bacilli distribution par génome

bacilli distribution par génome
baci>1aa1aa-5s+5s-16s+16sduplica1-3aastotal
bsu1885224286
lmo98444267
lam22141643463
ppm6721685161
pmq221113802173
lbu49161610798
ban85603342112
total19583039435311210760

bacilli distribution du total

  • Lien tableur: bacilli distribution du total
  • Légende:
  • Tableau de gauche
    - Les couleurs cyan et jaune sont les emplacements des >3 des +5s de bacilli + clostridia
    Cyan pour les valeurs faibles, total 82.
    Jaune pour les valeurs fortes et en gras les plus fortes, total 410.
    blanc pour les valeurs intermédiaires, gca et atc le sont aussi, total 225.
    - Le rouge pour l'emplacement des +16s occupés, gca et atc.
    - Les encadrés sont les emplacements des 1-3aas des +5s de alpha + gamma.
    - Le -16s de 33 aas est compté ici comme un +5s long (inversion).
  • Tableau de droite: Les duplicata ne sont pas comptés dans le total de 43 mais dans le total des >1aa du tableau de gauche.
  • Tableau des indices, en-tête: total des génomes, total des tRNAs, indice ttt, indice tgt.
Bacilli. Distribution du total.
bacilli. Distribution du total: >1aa 1aa +5s >3
g1t1 
atgi8tcttatatgf34
attact2aatagt
ctt5cctcatcgc
gttgctgatggt
ttc23tcc12tac24tgc12
atc16acc8aac32agc17
ctc11ccc2cac21cgt27
gtc8gcc4gac34ggc39
tta16tca17taatga
ata1aca23aaa30aga9
cta15cca27caa29cga2
gta36gca17gaa42gga19
ttg13tcg10tagtgg15
atgj14acg7aag10agg3
ctg15ccg2cag1cgg8
gtggcggag2ggg4
baci7>1aa1aa-5s+5s-16s+16stotal
type207830394330717
bacilli. Distribution du total: +16s -16s +5s <4 dupli
g1t1 
atgitcttatatgf2
attactaatagt
cttcctcatcgc
gttgctgatggt
ttctcc1tactgc
atc15acc1aac4agc
ctcccccaccgt1
gtcgccgac2ggc3
ttatcataatga
ataacaaaaaga
ctaccacaacga
gtagca16gaagga1
ttg2tcgtagtgg
atgjacgaag5agg
ctg2ccgcagcgg
gtggcggagggg
baci7dupli1aa-5s+5s-16s+16stotal
type12 1023143
bacilli. indices du 29.5.20 618 génomes
g1t1618493660,20
atgi146tct0,3tat0,5atgf285
att0,2act11aat0,5agt
ctt47cct0,6cat0,2cgc0,2
gtt0,2gct0,5gatggt
ttc272tcc120tac239tgc117
atc310acc92aac378agc159
ctc75ccc6,1cac186cgt288
gtc53gcc30gac386ggc310
tta211tca244taa1,1tga1,8
ata2,1aca294aaa340aga119
cta199cca243caa299cga6,3
gta397gca443gaa468gga305
ttg125tcg47tag0,8tgg137
atgj152acg47aag73agg72
ctg60ccg19cag17cgg109
gtg0,8gcg8,6gag16ggg18
intermaxmintotal
282045046347958

bacilli distribution par type

Bacilli. Distribution par type.
bacilli. distribution des solitaires
g1t1 
atgi2tcttatatgf
attact2aatagt
ctt2cctcatcgt
gttgctgatggt
ttctcctactgc
atc1acc2aac1agc1
ctc3ccc2caccgc1
gtc5gcc2gac1ggc
tta2tca5taatga
ataaca1aaaaga7
ctaccacaa4cga
gtagcagaagga5
ttgtcg5tagtgg
atgj2acg3aag4agg3
ctg5ccgcagcgg8
gtggcggag1ggg3
baci7intermaxmintotal
1aa27134383
bacilli. distribution du type >1aa sans duplicata.
g1t1 
atgi3tcttatatgf7
attactaatagt
ctt3cctcatcgt
gttgctgatggt
ttc9tcc3tac11tgc5
atc3accaac9agc6
ctc4ccccac9cgc3
gtcgcc1gac11ggc7
tta3tca5taatga
ata1aca4aaa8aga1
cta3cca5caa10cga2
gta8gca2gaa19gga4
ttg4tcg3tagtgg7
atgj4acg2aag1agg
ctg1ccg2cag1cgg
gtggcggag1ggg
baci7intermaxmintotal
>1aa5911521195
bacilli. distribution des +5s >3
g1t1 
atgi3tcttatatgf18
attactaatagt
cttcctcatcgt
gttgctgatggt
ttc14tcc9tac13tgc7
atc12acc6aac22agc10
ctc4ccccac12cgc23
gtc3gcc1gac22ggc29
tta11tca7taatga
ataaca18aaa22aga1
cta12cca22caa15cga
gta28gca15gaa23gga10
ttg7tcg2tagtgg8
atgj8acg2aagagg
ctg7ccgcagcgg
gtggcggagggg1
baci7intermaxmintotal
+5s>313527913427

bacilli par rapport au groupe de référence

Comparaison avec la référence
tRNAsblocs tRNAsblocs rRNAs
baci81aa>1aadup+5s1-3aasautrestotal
21faible432151382
16moyen27594135231227
14fort13115327982418
83195124271033760
10g+cga16125538
2agg+cgg11011
4carre ccc125825
5autres448
432151382
total tRNAs ‰
baci81aa>1aadup+5s1-3aasautresbaci ‰ref.‰
21faible572871710826
16moyen36785178341299324
14fort171514367113550650
109257165621343760729
10g+cga2116775010
2agg+cgg1414
4carre ccc167113316
5autres5511
5728717108
blocs tRNAs ‰ total colonne %
baci81aa>1aaduptotalref.‰1aa>1aadup
21faible1487217238265211
16moyen93203143103243330
14fort45397104526501659
2866724129072983195
10g+cga5541171141037
2agg+cgg383826
4carre ccc4117591628
5autres1414289
148721723843

bacilli, estimation des -rRNAs

  • Lien tableur: bacilli, estimation des -rRNAs
  • Liens fiche: typage
  • Légende: prélèvement de la base gtRNAdb le 29.5.20
    - ttt et tgt sont nuls partout
    - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
    - Voir la légende des tris, g1 t1 et des couleurs

bacilli, calcul des -rRNAs

bac bacilli 32 génomes
bac1 cumul des +rRNAs de la fiche bacilli pour 32 génomes
g1t1 
atgi20tcttatatgf91
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc63tcc30tac56tgc30
atc92acc27aac99agc38
ctc15ccccac53cgt82
gtc3gcc1gac106ggc101
tta59tca49taatga
ataaca87aaa84aga1
cta54cca77caa69cga
gta113gca122gaa94gga49
ttg32tcg2tagtgg42
atgj32acg3aagagg
ctg12ccgcagcgg
gtggcggagggg1
baci32intermaxmintotal
6931171251889
bac2 indices du clade bacilli du 29.5.20 de gtRNAdb pour 100 génomes
g1t1 6180.20
atgi146tct0.3tat0.5atgf285
att0.2act11aat0.5agt
ctt47cct0.6cat0.2cgc0.2
gtt0.2gct0.5gatggt
ttc272tcc120tac239tgc117
atc310acc92aac378agc159
ctc75ccc6.1cac186cgt288
gtc53gcc30gac386ggc310
tta211tca244taa1.1tga1.8
ata2.1aca294aaa340aga119
cta199cca243caa299cga6.3
gta397gca443gaa468gga305
ttg125tcg47tag0.8tgg137
atgj152acg47aag73agg72
ctg60ccg19cag17cgg109
gtg0.8gcg8.6gag16ggg18
gtRNAintermaxmintotal
282045046607984
bac3 cumul des -rRNAs de l'annexe bacilli 7 génomes
g1t1 
atgi5tcttatatgf7
attact2aatagt
ctt5cctcatcgc
gttgctgatggt
ttc9tcc3tac11tgc5
atc4acc2aac10agc7
ctc7ccc2cac9cgt4
gtc5gcc3gac12ggc10
tta5tca10taatga
ata1aca5aaa8aga8
cta3cca5caa14cga2
gta8gca2gaa19gga9
ttg6tcg8tagtgg7
atgj6acg5aag10agg3
ctg8ccg2cag1cgg8
gtggcggag2ggg3
baci7intermaxmintotal
9013169290
bac4 indices des +rRNAs de la fiche bacilli pour 100 génomes
g1t1 
atgi63tcttatatgf284
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc197tcc94tac175tgc94
atc288acc84aac309agc119
ctc47ccccac166cgt256
gtc9.4gcc3.1gac331ggc316
tta184tca153taatga
ataaca272aaa263aga3.1
cta169cca241caa216cga2.0
gta353gca381gaa294gga153
ttg100tcg6.3tagtgg131
atgj100acg9.4aagagg3.0
ctg38ccgcagcgg8.0
gtggcggagggg3.1
baci32intermaxmintotal
21663659785903
bac5 estimation des -rRNA du clade bacilli pour 100 génomes
g1t1 
atgi84tct0.3tat0.5atgf1
att0.2act11aat0.5agt
ctt47cct0.6cat0.2cgc0.2
gtt0.2gct0.5gatggt
ttc75tcc26tac64tgc23
atc23acc8aac69agc40
ctc28ccc6.1cac20cgt32
gtc44gcc27gac55ggc-6
tta27tca91taa1.1tga1.8
ata2.1aca22aaa78aga116
cta30cca2.0caa83cga6.3
gta44gca62gaa174gga152
ttg25tcg41tag0.8tgg6.0
atgj52acg38aag73agg72
ctg23ccg19cag17cgg109
gtg0.8gcg8.6gag16ggg15
-rRNAintermaxmintotal
6548455822081
bac6 indices des -rRNAs de l'annexe archeo pour 100 génomes
g1t1 
atgi71tcttatatgf100
attact29aatagt
ctt71cctcatcgc0.2
gttgctgatggt
ttc129tcc43tac157tgc71
atc57acc29aac143agc100
ctc100ccc29cac129cgt57
gtc71gcc43gac171ggc143
tta71tca143taatga1.8
ata14aca71aaa114aga114
cta43cca71caa200cga29
gta114gca29gaa271gga129
ttg86tcg114tagtgg100
atgj86acg71aag143agg43
ctg114ccg29cag14cgg114
gtggcggag29ggg43
baci7intermaxmintotal
128618719864143

bacilli, comparaison clade-annexe des -rRNAs

  • Lien tableur: bacilli, comparaison clade-annexe des -rRNAs
  • Légende
    - bac7. diff, somme des couleurs de bac7. La différence entre tRNAs est faite entre bac5 et bac6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
    - bac8. rap, rapport des sommes couleurs bac5/bac2. Le rapport -rRNA/total est celui du tRNA de bac5 sur celui de bac2.
  • Fréquences des différences en % du tableau bac7
gamme		0/0	10	20	30	40	50	60	70	80	90	100		total
fréquence	0	2	3	1	9	6	5	9	5	3	6	1	50
tot ≤ 50						21							
  • Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 43% au dessus de celle de la fiche des bacilli.
tRNAs		fiche		annexe
sans		925		290
avec		1902		470
genomes		32		7
indice %	29		41
bac bacilli 32 génomes
bac7 bacilli, différence clade-annexe des -rRNAs
g1t1 
atgi14tct100tat100atgf99
att100act62aat100agt
ctt34cct100cat100cgc100
gtt100gct100gatggt
ttc42tcc39tac59tgc67
atc61acc73aac52agc60
ctc72ccc79cac84cgt44
gtc39gcc37gac68ggc104
tta63tca36taa100tga100
ata85aca69aaa32aga1
cta29cca97caa58cga78
gta62gca54gaa36gga15
ttg71tcg64tag100tgg94
atgj39acg47aag49agg40
ctg80ccg34cag16cgg5
gtg100gcg100gag44ggg65
diffintermaxmintotal
8678388502554
bac8 bacilli, rapports -rRNA/total
g1t1 
atgi57tcttatatgf0.2
attact100aatagt
ctt100cctcatcgc100
gttgctgatggt
ttc28tcc22tac27tgc20
atc7acc8aac18agc25
ctc38ccc100cac11cgt11
gtc82gcc90gac14ggc-2
tta13tca37taatga100
ata100aca8aaa23aga97
cta15cca1caa28cga100
gta11gca14gaa37gga50
ttg20tcg87tagtgg4
atgj34acg80aag100agg100
ctg38ccg100cag100cgg100
gtg100gcg100gag100ggg83
rapintermaxmintotal
23198826

bacilli discussion

Cet article est issu de Wikiversity. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.