< Recherche:Les clusters de gènes tRNA et rRNA chez les procaryotes < Fiche
Fiche mémoire sur Synthèse par clade


Synthèse bactéries

Type 16s-y-23s5s

Type y cumuls

  • Lien tableur: Type y cumuls
  • Légende: M.aas, moyenne et variance des tRNAs par génome, avec ou sans rRNA.
Sb1. Synthèse type 16s-y-23s5s
M.aas avecM.aas sansgénomesblocscladelien16s23s5s16s23s,5s16s,23s5scdsatcgcagcaatcgcaatcatcgca-cdsgcaatc-cdsgca-cdscds-gca-atc-gta-cdsatc-gaaatc-gccgca-ccagaagcc-gaagaa-cdsgaa-aaa-gtagaa-aaa-gca-gtagaa-aaa-gta-cdsgccatgf
14 ± 1950 ± 161166a-firmicutesautres 431535
21 ± 2348 ± 1943264clostridiaC4.cumuls1605242326123182
59 ± 2829 ± 1932288bacilliBx322844151
8 ± 546 ± 870203alphaalpha 281381742311
8 ± 454 ± 1144164betabeta2312732
10 ± 658 ± 20144733gammagamma 7934915417314254136231
5 ± 358 ± 121964deltadelta 184213
5 ± 340 ± 340110epsilonepsilon 1114130189
0 ± 054 ± 1099354actinobacteriaactino 33024
8 ± 554 ± 1729122bacteroidesbactero 181022
5 ± 728 ± 62032tenericutestener 18518
2 ± 148 ± 3715deinococcusdeino 213
2 ± 048 ± 2815chloroflexichlor834
2 ± 137 ± 61316spirochaetesspiro2275
4 ± 249 ± 143178cyanobacteriacyano1747131
1 ± 137 ± 11217chlamydiaechlam152
2 ± 146 ± 21032thermotogaetoga18518
3 ± 149 ± 356acidobacteriaautre6
4 ± 246 ± 17815aquificaeautre213
4 ± 138 ± 136deferribacteresautre6
6 ± 448 ± 19316fusobacteriaautre115
36nitrospiraeautre15
415planctomycetesautre123
38synergistetesautre62
49verrucomicrobiaautre81
1320total11tot115132
6782674total type995103433991967671683723142541362392
% type3733,71312371362827250,72,60,71,10,41,5950,41,12,20,71,13,40,7
% groupe401494101
groupe16satc,gcagaa
type16s23s5s16s23s,5s16s,23s5scdsatcgcagcaatcgcaatcatcgca-cdsgcaatc-cdsgca-cdscds-gca-atc-gta-cdsatc-gaaatc-gccgca-ccagaagcc-gaagaa-cdsgaa-aaa-gtagaa-aaa-gca-gtagaa-aaa-gta-cdsgccatgf

Type y par tRNA

  • Lien tableur: Type y par tRNA
  • Légende: tri sur %16s, 16s23s5s. Jaune comme les protéobacteria, moins de 28% 16s, cyan comme les firmicutes plus de 53% de 16s.
    - total11, 11 clades mineurs, voir la liste
  • Note: Le taux des jaunes ne contiennent pas les gamma
totaux	clades	génomes	blocs		
	36	678	2674		
					
tRNA	cumul	%	clades	génomes	notes
gca	1249	316	31		
atc	1235	312	31		
16s	1039	263	27		
gaa	272	69	1	68	sur 144 génomes gamma
cds	121	31	11		
gta	13	3	2	6	4 gamma + 2 total11
gcc	11	3	2	6	3 gamma 3 clostridia
aaa	11	3	1	4	gamma
cca	4	1	1	2	gamma
atgf	2	1	1	1	clostridia
total	3957	10*			* 1 % des tRNAs rares
Y Les types y
Y.1 Les types y , effectifs
blocscladetotal 16stotal gca,atctotal gaa%16s%tgca%tgaagcaatc16scdsgaarares
6acidobacteria060100660
6deferribacteres060100660
9verrucomicrobia0901009901
164beta5159397155155235
203alpha101935951911891032
733gamma79376273115137378373791427229
110epsilon129811898980111
16spirochaetes2141388972
15aquificae213138713132
122bacteroides18104158510210418
6nitrospirae151783551
78cyanobacteria176122784861171
20total1151525751515542
64delta18462872434518
15chloroflexi875347378
264clostridia1659963387563160910
66a-firmicutes43236535231843
16fusobacteria11569315511
32tenericutes23972281923
32thermotogae23972281923
8synergistetes627525226
288bacilli2286079215945228
15planctomycetes12380203312
17chlamydiae15288122215
15deinococcus1501000
354actinobacteria35401000
Y.2 Les types y , taux
Pour 1000 blocsPour 1000 tRNAs
blocscladegcaatc16scdsgaararestotalgcaatc16scdsgaa
164beta9459451221321164474476101
203alpha9419314915820794534482476
733gamma516509108193714015623303266912238
110epsilon80972710091645492442616
16spirochaetes5634381251125
15aquificae8678671331867
122bacteroides836852148183645546480
6nitrospirae8338331671833
78cyanobacteria6157822181316283784801348
64delta6727032811656406425170
total708170791233393157864494487825
15chloroflexi2004675331200167389444
264clostridia2842396063438120123719950528
66a-firmicutes3482736521273274214512
16fusobacteria3133136881313
32tenericutes312817191031
32thermotogae312817191031
8synergistetes2502507501250
288bacilli2051567921153178136687
15planctomycetes2002008001200
17chlamydiae1181188821118
total1980257771403438117691682196073

Type y synthèse

  • gca atc gaa: 2 aas remarquables atc gca pour tout clade sauf deino et actinobactéria qui n'en contiennent pas du tout. Puis pour les gamma 1 aa en plus, remarquable, gaa.
  • Les cds: beta + alpha 68 pour 367 blocs et gamma 14 pour 733 blocs soit 10 fois moins. Les actino en ont autant que alpha beta, 24 pour 354 blocs. Les clostridia en ont autant que les gamma, 9 pour 264 blocs. Ils sont très rares chez les autres clades. La véracité des cds
  • Les blocs 16s23s5s cassés, 16s,y23s5s: chez les archées ils sont courants et y peut être gca. Il en existe quelques rares cas chez la plupart des clades bactériens accompagnés par une majorité de blocs entiers. Cependant certains génomes n'ont que des blocs cassés. Ainsi Deino en a 13 sur 15 où les blocs sont de la forme 16s, 23s5s-ggc. Il y en a 8 chez les alpha et 11 chez les epsilon tous les deux sous la forme 16s,23s5s.
  • Les blocs cassés 16s23s,5s: comme pour les précédents. Ils sont plus rares, 5 pour les tener et 5 pour les toga.
  • Les clades bactériens sont regroupés nettement en 3 groupes, le 1er avec moins de 28% de blocs 16s23s5s et 72% de 16s-y-23s5s contient les protéobactéria, le 2ème avec un taux de 16s compris entre 53 et 80 %16s et contient les firmicutes, le 3ème sans type y est représenté par les actino avec un effectif élevé de 354 blocs, il est accompagné par les deino avec un effectif de 15 seulement.
  • Les tRNAs y rares:
    - gcc tout seul, proche de gca, 8 chez les clostridia et 1 chez les gamma. Il accompagne gaa et atc chez les gamma, au total dans 11 blocs.
    - aaa gta accompagnent gaa chez les gamma dans 11 blocs, gaa-aaa-gta ou gaa-aaa-gca-gta.
  • Les blocs propres aux firmicutes 16s5s-y-23s: bacilli clostridia
    - 16s5s-y-23s avec y absent on a 16s5s23s. Il y en a 6 chez les bacilli sur 288 blocs, 23 chez les clostridia sur 264 blocs et rien dans les a.firmicutes (autres) sur 66 blocs.
    - bacilli: 4 atcgca et 2 16s dont 5 ont un z long et 1 court. En jaune dans le tableau.
    - clostridia: les 23 concentrent 7 des 10 tRNAs rares et le seul long 15aas-16s5s-atcgca-23s des clostridia.
    - Ces blocs se comportent exactement comme les blocs 16s-y-23s5s chez les firmicutes:
    + dans la répartition des types y. Voir le type y
    + dans la répartition des z z' x avec une majorité de z z' x (1-3 ) pour les clostridia et une majorité de z4-23 chez les bacilli. Voir tableau des longueurs
16s5s23s clostridia et bacilli
z / y16satc,gcagccatgfz’
sans41223
1-31+151
4-8212
9-23121
710426
x / y16satc,gcagccatgfx
1-33115
4-8
9-2311
32106

Type 16s23s5s-z

  • Note: Les types z' des types x-16s23s5s-z' sont ici incorporés dans les décomptes.

Les 3 longueurs du type z

Sb2. Longueurs du type 16s23s5s-z
cladesans1-3>3total% z
gamma507218072530
alpha47145019276
proteo-autres3202303437
28 clades7274357756
bacilli1423511128851
clostridia119943925253
negativ481266627

Les type z 1-3

Les types 1-3 majoritaires
  • Lien tableur: Les types 1-3 majoritaires
  • Légende
    - Colonne 23 clades, regroupe les clades à très faible effectif des 1-3. Ce sont delta (5), 4 clades de Les autres bactéries (1 pour chlam) et les 18 autres clades de autres sans fuso (5). L'effectif de ces 23 clades est de 11, en bas de la 2ème colonne Type.
Z13.1 Les types 1-3 majoritaires
typeblocs%1-3genoTypeblocsgeno23 cladesblocsgeno
gamma725144beta164445 clades
gac-tgg663062tac-gga-acc1010delta6119
gac8037525s1chlamydae1712
acc- 5s462146cyano7531
reste2612deino157spiro2113
total 1-3218100ggc116toga2010
18 clades
alpha19270chloro158Acidobacteria65
atgf1399648atgf63Aquificae158
reste64Armatimonadetes11
total 1-3145100fuso163Caldiserica11
aac53Chrysiogenetes31
bacilli28832reste3Deferribacteres63
atgf-gac195419Dictyoglomi21
aac-acc7207tener3220Elusimicrobia11
reste926aac33Fibrobacteres31
total 1-335100reste5Gemmatimonadetes11
Ignavibacteriae11
clostridia25243actino35399Nitrospirae53
aac192016tcc22Planctomycetes114
aaa12137Synergistetes83
atgi-gca10118bacteroi12229Thermobaculum21
ttc10117cca,tca2Thermodesulfobacteria32
reste4346Verrucomicrobia94
total 1-394100epsilon11140Candidatus Saccharibacteria22
divers7274128
a.firmicutes6611
aac542223 clades274128
reste758divers11
total 1-312100
Les types z taux des 1-3
  • Lien tableur: Les types z taux des 1-3
  • Légende: du tableau
    - deino*, les blocs sont cassés 16s,23s5s-ggc
    - chlam*, les 5 tRNA sont sur le brin opposé du bloc.
    - tener* 11aas voir la séquence
    - Ligne 16 clades, regroupe les clades à très faible effectif des x+z. Ce sont les 19 clades des autres sans fuso aquifecae planctomycetes.
  • Note: clostridia, LOI.BINOMIALE(L641;254;0,0025;0)
  • Les z de 4 de long: Voir ci-dessous le tableau des fréquences. Pour clostridia le cds étant considéré comme un intercalaire son bloc est compté comme un 1-3 et donc on a 3 fois 1-3 et 2 fois 4-8, c'est à dire 5 z de longueur 4.
clostridia 1-3	2 * 16s23s5s-ttc-5s-ttc-aaa		clostridia 4-8	2 * 16s23s5s-caa-gaa-tac-ggc
		    16-gca-atc-235-aac-5s-ttc-tgc	bacilli  4-8	    16-gca-235-gta-gga-atc-gaa
		    16s23s5s-aaa-cds-5s-aaa				
gamma 1-3	    16s23s5s-acc-5s-acc-5s				
  • Les cds des 1-3 en x et z: sont considérés comme des intercalaires pour faire ressortir les tRNAs. Au total 13 blocs:
    - 9 blocs ont le cds après 23s
    - 3 blocs firmicutes ont le cds après le 5s
    - 1 bloc clostridia a le cds avant le 16s
gamma			16gaa23-cds-5s-5s 		
alpha			16atcgca-*-23-cds-5s-atgf   5
clostridia		16s-cds-16s°-23s-cds-5s		
			16s23s5s-aaa-cds-5s-aaa		
			ttc-cds-16s5s-atc-23s-aac-atgf		
a.firmicutes		16s23s5s-cds-tgc-tta		
			16s23s5s-cds-tac-caa		
T.desulfobacteria	16atcgca23-cds-5s	   2
  • Les types majoritaires en fréquence, voir ci-dessous les 2 tableaux des fréquences: Le rouge, un seul type. L'orange 1 seul type à plus de 70% ou bien partagé par 2 ou 3 types.
		type		n	total	%
alpha		atgf		144	145	99
gamma avant	cgg-cac-cca	10	10	
gamma 1		gac		80	101	80
gamma 2		gac-tgg		66		
		acc-5s		46		
				112	115	97
bacilli après	atgf-gac	19	
		aac-acc		7	
				26	28	93
bacilli avant	cgt-gga		4	5	80
clostridia 2	atgi-gca	10	28	36
clostridia 1	aac		19		
		aaa		12		
		ttc		10		
				41	56	73
beta		tac-gga-acc	10	10	
tener* après	11aas		5	5	
tener avant	tac		5	5	
deino*		ggc		11	11	
chloro		atgf		6	6	
chlam* avant	cac		5	5	
Z13.2 Les types z taux et fréquences des 1-3
Z13.21 taux des 1-3, après
cladetotal1-31-3%x+zx+z%
alpha1921457614576
gamma7252183024033
bacilli288351216457
clostridia252943710843
a.firm6612181827
beta164117149
epsilon111761110
delta6158610
tenericutes32820
deino151111
chloro1566
fuso1688
chlam1716
aquificae1514
11035325550
actino35320,620,6
bacteroides12221,643,3
cyano75
spiro21
toga20
planctomycetes11
60240,761,0
16 clades543659
total26255692277229
Z13.22 fréquence des 1-3, après
clade01234>4
alpha47145
gamma50710111511
bacilli14262811110
clostridia12056286537
a.firm475346
beta153110
epsilon1047
delta5731
tenericutes*193325
deino*411
chloro96
fuso862
chlam161
aquificae141
actino3512
bacteroides1202
cyano75
spiro21
toga20
planctomycetes11
16 clades513
total1896359180247158
Z13.23 fréquence des 1-3, avant
clade123>4
alpha
gamma9310
bacilli1512
clostridia5612
a.firm
beta3
epsilon1111
delta1
tenericutes511
deino
chloro
fuso
chlam*5
aquificae21
actino
bacteroides2
cyano
spiro
toga
planctomycetes
16 clades11
total35161416
Les types z 1-3 synthèse
  • Les z de longueur 1-3 sont en nette rupture avec les z de longueur 4, tableau z13-22. Les z de longueur 4 sont très peu nombreux, 7 sur 2625. Et quand on les compte dans les 1-3 ils contiennent un 5s. Ceux comptés dans les 4-8 s'apparentent aux autres de longueur supérieure à 4 et on en dénombre alors que 3 sur 2625 blocs.
  • Les z' des blocs avant 16s x-16s23s5s-z' ont des types apparentés aux blocs sans x, voir analyse des clostridia et les z' des x des bacilli (atgf).
  • Les 1-3 se répartissent en clades ayant beaucoup et en clades sans ou avec très peu, tableau sb2 et z13-21.
    - Chez les proteobacteria les alpha se distinguent des gamma par leurs taux de 1-3, 76% contre 30% pour les gamma.
    - Les firmicutes ont un taux de z de 50% mais le rapport 1-3 sur >3 s'inverse entre bacilli et clostrida, respectivement 35/111 et 94/39.
    - Les actino ont la particularité d'avoir 2 z de type 1-3 sur 354 et un seul type y, le 16s23s5s.
    - On peu distinguer donc 3 groupes par leurs taux de z (x + 1-3 + >3)
    1. Un groupe de 10 clades, à fort taux de z: alpha gamma firmicutes, à grands effectifs, tener deino chloro fuso chlam aquifecae, à petits effectifs.
    2. Un groupe de 6 clades à très faible taux de z: actino bacteroides cyano, à grands effectifs, spiro toga planctomycetes, à petits effectifs.
    3. Un groupe de 3 clades à taux de z intermédiaire, avec aussi des effectifs faibles: delta beta epsilon. Leurs taux peuvent évoluer dans un sens ou l'autre si les effectifs venaient à augmenter.
    4. Le groupe de 16 clades à très faibles effectifs sont donnés pour mémoire.
  • Les 1-3 se répartissent en majoritaires et en rares. Seuls les clostridia possèdent beaucoup de rares alors que les alpha possèdent 144 d'un seul type majoritaire, atgf. Il y a 13 types majoritaires (voir la liste jointe au tableau z13.22 des fréquences).
  • Les majoritaires se répartissent sur plusieurs génomes et procèdent donc d'un processus général, voir tableau z13.1.
  • Les x de type 1-3 des blocs avant 16s, s'ils diffèrent des z 1-3, ont aussi des types majoritaires. Il y a 4 majoritaires chez les x. Voir tableau z13.23.
  • Les blocs 16s-5s-23s: sont propres aux firmicutes dans les 1-3 x et >3
  • Les blocs 16s23s-*-5s propres aux clostridia, existent en 5aas.
  • Les cds des 1-3 (z et x) voir liste
  • Note:
    - Sauf pour les clostridia les fréquences ne suivent pas une loi binomiale décroissante de 0 à 3. Les fréquences des alpha sont inversées (en % 24 76 0 0), celles des gamma (70 15 15 0), les bacilli, les clostridia.
    - En plus, à part les clostridia, un clade n'a qu'un à 2 types de z-1-3 se réduisant souvent à un seul aa (alpha atgf, gamma gac).
    - Les clades se constituent en 2 groupes, un avec beaucoup de z-1-3 (alpha …), l'autre avec très peu (actino) pour des effectifs élevés ou moyens.
Les tRNA 1-3 majoritaires
Z13.3 Les tRNA 1-3 majoritaires
gammatotal%clostridiatotal%bacillitotal%31 cladestotalclade
gac15145aac3826atgf2031aac17tener
tgg7322ttc1913gac19295s14delta
acc5717aaa1712aac1218acc13beta
5s5015atgi1410acc711ggc11deino
tca3gca1410cgt2gga10beta
ttc2acc5ctc1tac10beta
tta1tgc5ctg1atgf6chlor
tac15s4gaa1cds2
cds1gaa4tca1gta2
33998atc3gta1tcc2actino
alphatta36589aga1
atgf14496gac2a.firmicutesatgi1
cds5gga2aac626atgj1
cgg1ggg2tgg417cca1
15096gta2cac2cgc1epsilon
aca1cds2gaa1
atgf2cgt2tca1
cds2acg1tgc1
cgg1agc195
ctc1caa1
ggc1gaa1
gtg1tac1
tgg1tgc1
14471tta1
2343
Les tRNA 1-3 rares
  • Lien tableur: Les tRNA 1-3 rares
  • Légende
    - Les couleurs correspondent à la classe des tRNA, sans couleur sont des tRNA rares, rouge pour aucun effectif, jaune pour peu rares et cyan grands effectifs avec dégradé.
    - Tableau Z13.3 Les tRNA 1-3 rares, les effectifs de la couleur cyan (max) sont ceux des clades à faible effectif de ces tRNA. Ils correspondent à ceux de la colonne divers du tableau Z13.4 Liste des tRNA 1-3.
    - Tableau Z13.4 Liste des tRNA 1-3, les effectifs sont triés en ordre croissant. Deux colonnes sont affectées aux tRNA qui peuvent exister en grande quantité dans certains clades, max et très faibles dans d'autres, divers. Ainsi on a 713 max, 35 divers, 48 peu rares, 20 rares et 0 de la classe zéro. Le max de acc est égal à gamma + bacilli + beta (10). Le max de 5s est égal à gamma + delta (4).
  • Les groupes de tRNA 1-3: 48+1+4-3
tRNA 1-3
classetRNAeffectif
zéro140
max1322
rare1419
cgc11
peu rare848
  • Les tRNA 1-3 rares:
Z13.4 Les tRNA 1-3 de type 16s23s5s-z
Z13.41 Les tRNA 1-3 rares
1-3totalatgfatgicds5s
tRNA103211214
ttttcttattgt
attactaatagt
cttcctcatcgc1
gttgctgatggt
ttc2tcc2tac2tgc7
atc3acc8aac0agc1
ctc2ccc0cac2cgt4
gtc0gcc0gac2ggc1
tta5tca5taatga
ata0aca1aaa0aga1
cta0cca1caa1cga0
gta5gca0gaa7gga2
ttg0tcg0tagtgg1
atgj1acg1aag0agg0
ctg1ccg0cag0cgg2
gtg1gcg0gag0ggg2
Z13.42 Liste des tRNA 1-3
tRNA maxtRNA rare
cladetRNAmaxdiverstRNAdiverstRNAdivers
alphaatgf1702cds12aca1
gamagac1702gaa7acg1
"tgg771tgc7aga1
"acc748gta5agc1
firmicutesaac730tca5atgj1
gama5s5414tta5caa1
clostridiattc192cgt4cca1
"aaa170atc3cgc1
"atgi141cac2ctg1
"gca140cgg2gtg1
deinoggc111ctc2
betagga102ggg2
betatac102tcc2
713355810
Les tRNA z1-3 sur fond de référence
  • Lien tableur: Les tRNA z1-3 sur fond de référence
  • Légende: Légende: pour les couleurs voir le tableau référence.
  • - Note:
    + Les max se retrouvent dans les références jaunes aux taux supérieurs à 3.7% ( 8 / 13) sauf tgg (78) avec 2.5%. Parmi les 3 valeurs élevées en z-1-3 qui restent 2 ont des valeurs jaunes parmi les plus élevées (atgf 172 51, gac 172 55) et une, a sa valeur jaune moyenne (aac 73 39).
    + Les 4 autres max se répartissent en acc (82 12) complètement dissymétrique mais qui est accompagné de 5s (68 en z-1-3 et quasi nul en référence) dans le type acc-5s des gamma; en gca (14 21) à bascule directe, et en atgi (15 15) en bascule inverse. Les 2 gca et atgi se trouvent dans le type atgi-gca (10) des clostridia.
    + Les z-1-3 rares et peu rares se répartissent apparemment au hasard sur tous les références: ainsi les 14 rares ont 5 sur les blancs (15) et 9 sur les couleurs (30).
z13 Les tRNA 1-3, sur référence
totmaxrareatgfatgi5scds
81674868172156812
ttttcttattgt
attactaatagt
cttcctcatcgc1
gttgctgatggt
ttc21tcc2tac12tgc7
atc3acc82aac73agc1
ctc2ccccac2cgt4
gtcgccgac172ggc12
tta5tca5taatga
ataaca1aaa17aga1
ctacca1caa1cga
gta5gca14gaa7gga12
ttgtcgtagtgg78
atgj1acg1aagagg
ctg1ccgcagcgg2
gtg1gcggagggg2
Les tRNA 1-3 synthèse
  • le classement des z-1-3: voir le calcul des majoritaires d'après le classement des types, et voir les rares.
  • Comparer avec
    - Le type y, gca se caractérise par la bascule firmicute, un z-1-3 monolytique avec atgi-gca et un taux de 31%, unique en y. Le tRNA gca intervient aussi dans les blocs doublons des 9-23 des bacilli en compagnie de tta gta aca aac ggc.
    - Les z longs des firmicutes, voir la note sur les références des firmicutes en z longs.
    - Le type x: Voir la synthèse des x.
  • Tableaux de multiplicité: alpha (atc 241 gca 239 atgf 236), gamma et actino bacteroidites.
    - gamma
    + > 250 max 377 aaa, ggc gaa gta aac 311, cgt atgf gac atc gca 283, ctg 252. tac 227 ttc 175.
    + < 10 gtg gcg gag
    - bacteroi, > 200 atc 295 gca 286. < 10 gtg gcg.
    - actino, max ggc 184 gtc 145 gag 143, mini gcg 86 et reste > 99.

Les type z supérieurs à 3 synthèse

Les type z supérieurs à 3 synthèse, caractéristiques
  • Ce type z est quasiment propre aux firmicutes. J'ai trouvé deux exceptions, chez les tenericutes (6 génomes dont 5 z et un z') et epsilon (1 génome sous forme de type x).
  • Le taux des z par rapport aux blocs sans z est proche de 50% contrairement aux alpha gamma actinomycètes chez qui ce rapport est respectivement de 76 30 et 99%.
  • Le taux z1-3/z>3 est inversé entre bacilli et firmicutes.
  • La frontière z3-z4 est très nette.
  • Les séquences de tRNAs supérieures à 3 se trouvent aussi chez les avant-16s, dans les types x et/ou z' ( les avant-16s s'écrivant sous la forme x-16s-z', où 16s représente le bloc interne comprenant 16s 23s 5s et éventuellement quelques tRNAs entre 16s et 23s).
  • La frontière paraît très nette entre z8-z9 chez les bacilli où les z9 ont un effectif de 25 contre seulement 3 pour z8. Chez les clostridia c'est moins nette 4 contre 3. J'ai analysé donc les z4-8 et les z9-23 séparément.
  • Les séquences des z > 3 se caractérisent par
    - une grande variabilite de la longueur allant de 4 à 33 avec une moyenne de 13.9 chez les bacilli (97 15 12 blocs pour z9-23 z4-8 x9-23); chez les clostridia de 4 à 43 avec une moyenne de 13.0 (24 14 6 blocs pour z9-23 z4-8 x-16s-z')
    - au niveau total des tRNAs la multiplicité est due à la multiplicité des z et non à des doublons dans le même z contrairement aux cluster sans rRNAs étudiés dans les annexes. Les bacilli ont jusqu'à 14 z9 doublons.
    - Absence des doubles de tRNAs par répétition dans le bloc, cependant 2 blocs ont présenté des duplications de séquences. C'est ainsi dans le bloc de 33 aas de bacilli où il y a 2 séquences de 10 aas identiques séparées par une séquence de 8 autres, et dans un bloc de 8 aas d'epsilon avec 2 séquences de 3 qui se suivent.
    - La majorité des tRNAs composant ces séquences longues, z z' x, ne concerne qu'une vingtaine d'aas dans leurs cumuls chez les bacilli et les clostridia, B-C total blocs longs (tRNAs en jaune). Ramenés pour 1000 tRNAs les jaunes paraissent semblables mais les rouges basculent entre bacilli et clostridia, ainsi gca (37-2) aga (1-37) ttg (19-0). D'autres tRNAs sont équivoques. C'est pour cela que j'ai voulu lever ces cas équivoques, dans le tableau B2-C2 de la même référence, en calculant la plus grande variation en % des variations en pour 1000 de B2 moins C2, le dénominateur étant le plus faible entre B2 et C2 pour un tRNA donné. Effectivement apparaissent 2 nouvelles bascules tcc avec une variation de 898 et cgt avec 233 comparée à la plus petite variation rouge précedente, ttg de 1860. Les jaunes ont une variation inférieure à 78 (gga) en valeur absolue.
Comparaison des z9-23 B-C
  • Comparaison des z9-23 B-C avec la loi binomiale.
    - J'ai signalé ci-dessus qu'une grande différence entre B et C est due au grand nombre de doublons z9-23 des bacilli par rapport à celui des clostridia. J'ai éliminé donc les doublons et je ne considère donc ici que la comparaison sans les processus de duplication. Ainsi certains aas seront moins avantagés par les duplications. Les tableaux z9-23 des bacilli et des clostridia donnent les effectifs sans doublons et montrent les tRNAs qui sont avantagés (en jaune foncé).
    - Je n'ai pas intégré les z4-8 car ils contiennent peu de tRNAs (93+83) et pouraient faire intervenir des processus différents de ceux des z9-23.
    - De même je n'ai pas intégré les x longs des 2 clades car ceux des bacilli se comportent clairement de façon différente des z9-23. Les x9-23 des bacilli au nombres de 12 blocs ont très peu de duplication mais les blocs ne diffèrent que par 1 à 3 aas, ce qui fait que certains aas sont très avantagés. En plus le tRNA ctc, rare dans les totaux des z longs, est très avantagé aussi. Chez les clostridia les x longs se comportent comme les z longs.
    - Les types z9-23 des 2 clades, sans doublons, sont donc homogènes et comparables (tableaux B-C.4 5 6), avec 45 blocs et 709 aas pour les bacilli, 21 blocs et 351 aas pour les clostridia. Dans cette référence (tableaux B-C.1 2 3) je compare aussi les totaux précédemment étudiés dans les grandes variations. Les aas ggc et gga apparaissent significativement différents entre les 2 clades alors qu'ils ne le sont pas en ne tenant pas en compte les doublons, et je n'ai pas pu les distinguer avec les grandes variations. Ce résultat justifie à lui seul, la nécessité d'éliminer les doublons pour la comparaison des 2 clades.
    - J'utilise ici la loi binomiale en prenant comme probabilité de base les taux des bacilli à partir desquels je calcule les taux espérés des clostridia pour un effectif de 351 aas, ainsi que leur intervalle de confiance.
    - comparaison des z9-23 bacilli et clostridia: Voir le classement des aas par groupes de pourcentages.
    + 23 tRNAs (jaune) entre les 2 clades, tous significativement semblables.
    + 7 bascules entre les 2 clades, 7 rouges, tous significativement différents.
    + 15 tRNAs très déficients, en clair. Les différences significatives sont rares pour ces tRNAs, dues aux faibles effectifs.
    + quasi absence des 5s et des cds.
    - Le référentiel: La somme des z9-23 des bacilli et des clostridia fait 1060 blocs, assez grande pour la comparer à d'autres processus aux faibles effectifs, surtout pour les 23 tRNAs semblables dont la somme a un sens. La couleur rouge des bascules indiquera si le type x y z z' à comparer va dans le même sens que les bacilli ou ou celui des clostridia. De même le référentiel fera ressortir un effectif élevé des aas en clair (déficients chez les z9-23 des firmicutes). Le référentiel se présente sous forme d'effectifs, tableau B-C.9 somme des tableaux B-C.4 et B-C.5 de la comparaison B-C ou sous forme de pourcentages, tableau B-C.8.
  • Comparaison des Cz'B-C9-23
    - Les z'9-23 sont ceux de 32 aas de 2 blocs des clostridia, les bacilli n'en ont pas (x-16s23s5s-z'). Je les ai ajoutés aux 351 des z9-23, soit 383 aas contre 1060 des bacilli.
    - Les résultats sont les mêmes qu'avec les z9-23 B-C du paragraphe précédent à la différence près qu'ils sont plus précis faisant apparaître ggc comme bascule (voir les bascules en bas des notes de ces tableaux).
Comparaison des z4-8 B-C
  • Liens aux tableaux: B-C C-B somme, B-C 105.
  • Jusqu'ici je considérait les z4-8 comme les z9-23 pour leur contenu en aas. C'est comme ça que j'avais additionné tous les z longs dans le tableau de comparaison du total des B et des C et que j'avais pu repérer les 1ers indices des bascules entre B et C (aas en rouge). Mais l'analyse plus fine que j'ai abordée au chapitre précédent en excluant les doublons des z9-23 m'a conduit à exlure aussi les avant-16s des bacilli pour leur comportement aberrant (paragraphe 3). Et pour plus d'homogénéité dans la comparaison des z9-23 B-C j'avais exclu les z4-8 aussi. C'est cela qui m'a conduit à comparer les effectifs des z4-8 B-C.
  • Comparaisons CzB-C4-8 et CzC-B4-8
    - Les bascules des z9-23 B-C sont conservées dans les z4-8 B-C: C'est un résultat très important à cause des faibles effectifs pour certaines bascules des Z9-23 B-C mais aussi sur l'incertitude de la taille de mon échantillonnage en général. Du fait que ces bascules se font toujours dans le même sens cela confirme leur existence et du coup les bascules propres aux z4-8, différentes des bascules z9-23 dans leurs comparaisons entre elles (C4-8/B4-8) ou avec les z9-23 (Bz9-23 /Cz9-23), prennent de la valeurs et pourraient avoir un sens.
    - Les bascules propres aux z4-8: J'ai adopté au début le même principe d'homogénéité que pour la comparaison des z9-23 B-C, je n'ai comparé que les z en excluant les avant-16s.
    - Avec uniquement les effectifs et au visu seulement j'ai repéré 8 bascules aac 10-5 gta 11-5 gaa 6-11 acc 5-1 cca 6-1 caa 2-7 gga 1-7 atgj 5-0. atgj 5-0, est une bascule 9-23. C'est renforcé par le fait que atgi+atgj fait dans 9-23, 21 pour 709 bacilli contre 22 pour 351 clostridia. Mais dans 4-8 la bascule atgj n'est pas respectée 5/0 au lieu de 0/5.
    - Comparaison des z4-8 avec la loi binomiale: Pour utiliser la loi binomiale je dois utiliser le clade au total le plus élevé (B 93) pour définir la probabilité de référence, effectif de l'aa divisé par le total. Hors pour des effectifs faibles certains aas sont nulles et donc leur probabilité de référence sera nulle, non utilisable pour les estimations. Ces aas ne seront pas comparés. Pour se faire il faut repartir de l'autre clade (C 83). Ce que je ai fait dans le paragraphe suivant. Trois types de différences significatives:
    + cgt, cet aa appartient aux bascules des z9-23 et confirme cette bascule, sans changer de sens.
    + atgj, cet aa appartient aux bascules des z9-23 mais ne confirme pas le sens de la bascule, il change de sens. Cela serait une caractéristique des z4-8
    + caa gga gga confirment la bascule propre aux z4-8.
    - Comparaison inverse C-B: Ici les probabilités de référence sont calculées sur les C4-8 avec un total de 83 aas. Deux types de différences significatives:
    + gca, cet aa appartient aux bascules des z9-23 et confirme cette bascule, sans changer de sens.
    + acc cca caa gga gta confirmant 3 nouvelles bascules propres aux z4-8, acc cca gta.
    - La comparaison des B-C et C-B révèle donc 6 bascules propres aux séquences de 4-8 de long, acc cca gga caa gaa gta qui n'appartiennent pas aux bascules des z9-23 et atgj qui appartient aux z9-23 mais qui change de sens dans les z4-8.
  • Comparaisons Cz'B-C4-8 et Cz'C-B4-8
    - Les z'4-8 sont ceux de 17 aas de 3 blocs des clostridia, les bacilli n'en ont pas (x-16s23s5s-z'). Je les ai ajoutés aux 83, soit 100 aas contre 93 des bacilli.
    - Les résultats sont les mêmes sauf gta qui cède la place à gac: dans les z4-8 les bascules respectives sont 11-5 et 5-8 et dans les z'4-8 11-7 et 5-10. Une seule différence significative apparaît pour gta dans z4-8 sur 2 attendues et inversement dans z'4-8 c'est le cas de gac. Si j'adopte les bascules in visu, il serait intéressant de considérer 8 bascules propres aux blocs de longueurs 4-8: acc cca gga caa gaa gta gac atgj.
Comparaison des z9-23 / z4-8 B-C
  • Liens aux tableaux: 9-23/4-8, Cz'B-C9-4, 9-23/105
  • Remarque sur la comparaison z9-23 B-C: Si j'adopte les mêmes différences entre z9-23 bacilli et clostridia (diviser les bacilli par 2, procédé in visu que j'ai adopté au chapitre précédent) je ne trouve que 2 tRNAs présentant une bascule outre les rouges, ggc 20.5-12 et gga 11.5-17, tgc 10.5-6 étant la limite (9-23/4-8, tableaux B-C.9 et B-C4-8 somme B+C ). Ceci montre l'absence d'autres bascules que les rouges remarqués dans cette comparaison.
  • Pour la comparaison z9-z4 je compare la somme Bz9-23 + Cz9-23 à la somme Bz4-8 + Cz4-8 et la somme Bz9-23 + Cz'9-23 à la somme Bz4-8 + Cz'4-8. Ce qui donne les tableaux 9-23/4-8 et Cz'B-C9-4. A la différence de la comparaison des z4-8 où les effectifs sont faibles et où j'ai du faire 4 tableaux Cz'B-C4-8 et des Cz'C-B4-8, ici je n'en fait que 2 grâce aux effectifs élevés des sommes des z4-8, 176, et des sommes des z'4-8 de 193. Les aas tca et gta ne sont pas significativement différents des z9-23 avec l'échantillon à 176 aas (9-23/4-8) et le deviennent avec 193 aas (Cz'B-C9-4).
  • Signification de la comparaison z9-23/z4-8: Alors que les bascules dans les comparaisons z9-23 et z4-8 concernent 2 processus dans chaque clade et donc sont propres aux clades, les bascules de la comparaison z9-23/z4-8 ne concernent plus les clades mais les 2 types z9-23 et z4-8 donc leurs longueurs. On assiste là à la manifestation de la propriété physique de l'ADN et non des fonctions protéiques éventuelles dans les processus affectés aux clades.
  • Les différences significatives de la comparaison z9-23/z4-8: Elles sont au nombre de 8.
    - Il y a 2 groupes un à bascules fortes et l'autre à bascule faible. Pour ce faire je fais le rapport cz'4-8 attendu (total 193) sur z'9-23 (total 1092). Pour un effectif nul je le remplace par l'unité. J'obtiens ainsi,
    + les bascules fortes atgf 55-6 cac 35-6 tgg 28-6 tca 33-6. Elles sont toutes directes de z9 vers z4. Le rapport de la bascule n'est pas inférieur à 4.9.
    + les bascules faibles aac 42-96 gta 62-102 gaa 61-108 acc 13-34. Elles sont toutes indirectes de z4 vers z9. Le rapport de la bascule n'est pas supérieur à 2.6.
    - Les intervalles de confiances sont solides: par là j'entends qu'avec un échantillon plus grand on aura toujours une différence significative ce qui rend la bascule réelle et effective.
    + L'existence effective de la bascule entre z9-23 et z4-8 pourrait être réduite à 2 intervalles de confiance solides avec une différence à la borne élevée: ce sont atgf avec une différence de 2,6 et aac avec 4,2, les 2 tRNA s'appuyant sur de grands effectifs.
    + Mais une solidité légèrement plus faible va toujours dans le même sens de la réalité des bascules de cette comparaison. Deux tRNA ont une différence à la borne de 1,3 et 1.8: cac gaa s'appuyant aussi sur de grands effectifs. Je considère que c'est une différence significative. gaa et cac ont respectivement dans le tableau 9-23/4-8, 1.0 et 1.1.
    + Quatre tRNAs pourraient porter sujet à caution, ce sont tgg tca gta acc avec soit des effectifs les plus faibles des 8 bascules, soit des différences à la borne aussi faibles avec respectivement 0.6 0.1 0.6 0.7 (Cz'B-C9-4) et 0.3 -0,2 -0.1 0.9 dans le tableau 9-23/4-8.
    - Manifestation de la propriété physique de l'ADN peut être à l'origine des bascules dans z9-23 et dans z4-8: Voir synthèse des bascules. Deux tRNA acc et gaa ont une bascule dans z4-8 et dans z9-z4, et atgj a une bascule dans z9-23 et dans z4-8.
    * La même bascule i9-4 est provoquée par C (gaa 6-13) ou B (acc 5-1) dans z4-8. La bascule d9-4 est provoquée par B et C dans z9-23 et leur absence simultanée dans z4-8 pour atgf cac tgg tca.
    * Pour atgj on a donc (i9, d4) et l'état de z9-4 dépend de C dans z9-23 (30-60) et de B dans z4-8 (5-0).
    * L'état de z9-4 dépend donc de B et/ou C dans Z4-8 et dans z9-23. Comme l'état de z9-4 est la manifestation physique de l'ADN (atgf cac tgg tca) les états des z9-23 et z4-8 le sont aussi.

Type z synthèse

Historique du typage x-16s-y-23s5s-z
  • La question des duplications des tRNAs reliées à leurs fonctions (ref article1): Dans ce but j'ai commencé à étudier les duplications des tRNAs dans les opérons à RNAs.
    - Les intercalaires: Très vite est apparue l'idée que la structure en boucle du tRNA devrait opposer une résistance à la réplication et aux réparations de l'ADN. Ceci aurait pour conséquence une destruction du tRNA et surtout des rRNAs qui contiennent l'équivalent de 1 20 40 structures de type tRNA pour respectivement 5s 16s 23s. Cette opposition aux maintenances de l'ADN engendre aussi la conservation de ces gènes de génération en génération. Elle devrait se traduire aussi par une très grande variabilité des intercalaires. C'est ce que j'ai mis en évidence dans cette première approche.
    - 1ère ébauche du typage. En partant toujours de l'article (ref article2) qui m'a mis sur la voie des opérons à RNAs j'ai étudié les duplications chez E.Coli, où la duplication ne se fait plus dans ces opérons, mais dans un cluster de tRNAs seuls. Ce qui m'a amené à comparer les intercalaires en relation avec le %GC de 16 génomes. Petit à petit sont apparus alors les types z et y (notation, 16s-y-23s5s-z ou x-16s-y-23s5s-z'), d'abord z puisqu'il est à l'origine des duplications et les différences de celles-ci entre bsu et eco, ensuite est apparu y qui s'imposait par la constance du cas atc-gca qui n'a aucune relation avec la fonction des tRNAs.
    - Les cds: En partant toujours de l'article (ref article2) qui parle de 2 opérons tRNAs+protéine, tpr et tufB, j'ai ajouté à mes intercalaires ceux des cds intra clusters et à leurs bordures dans eco cds. L'étude des cds est faite dans plusieurs génomes des annexes.
    - Le typage x y z, les longueurs de z: Si les annexes permettent de repérer les duplications avec ou sans rRNAs, les fiches ne concernent que les clusters à rRNAs sans l'encombrement des intercalaires. J'ai échantillonné chaque clade avec le 1er génome de la rupture du tri sur les 2 1ers qualificatifs du nom. Cette étude m' a permis alors de définir plus proprement les types et notamment de définir les 3 longueurs de z, sans 1-3 et >3 tRNAs. Ainsi sont apparus les 1-3 majoritaires de z dont l'exemple impressionnant des alphas. L'abondance d'un type donné de z1-3 pose alors le problème du génome: est-ce que cette abondance est due au fait que je suis tombé sur un génome particulier ou bien c'est une propriété générale. Dans la quasi totalité des cas il y a plusieurs génomes pour un type donné.
    - Le typage x-y-z', x n'est pas un accident: Ce n'est qu'à la synthèse finale sur les x que j'ai démontré leur existence propre et qu'ils ne sont pas dus à un réassemblent au hasard, par les réparations de l'ADN, d'un cluster 16s-y-23s5s-z. Les destructions et les réassemblements sont étudié dans les comparaisons entre 2 génomes proches phylogénétiquement: ecoN-eco, bsu-lmo, cdc - cdc8.
Hypothèse de la contrainte physique du cluster
  • Voir dans la comparaison des z9-23/z4-8, la manifestation physique de l'ADN (dernier paragraphe).
  • Voir comparaison B+C z2/z1 et comparaison B+C z4-8/z1-3.
  • Notes:
    - La force des gènes tRNAs, émise dans l'historique précédent
    - Comparaison entre les longueurs des types de séquences et non entre clades: La somme B+C annule l'influence du clade et on passe au clade supérieur, ici les firmicutes. Le processus en cause pour une longueur donnée réagit par rapport à la caractéristique commune des clusters firmicute et cette réaction est différente entre les 2 longueurs comparées. Cette réaction est la contrainte physique du cluster dans son ensemble, c'est à dire les 3 rRNAs, 16s 23s 5s.
    - Comment se fait alors la création du gène de tRNA: exclure la création base par base et la façon de l'alphabet suivant un programme prédéfini. Elle se ferait plutôt par appui sur un modèle et ce modèle serait ici le 5s. Les processus comparables sont la réplication, l'édition de gène par CRISP (qui fait intervenir un brin RNA avec DNA et les protéines de réparations) et le transfert d'un domaine protéique entre gènes de protéines.
    - Ce type de création explique la fréquence élevée d'un type de séquence créée et donc les répétitions que j'ai relevées pour les z9-23 ne sont pas des copies d'éléments mobiles mais des créations identiques. La fréquence d'une séquence donnée est le résultat de la facilité avec laquelle la contrainte physique du cluster est résolue par le processus de réparation/réplication.
    - Cela explique aussi que les types x de x-16s-y-23s5s-z' fassent intervenir des tRNAs et des séquences différentes des z, avec des fréquences plus faibles, car ce processus x change le sens de la direction de réparation/réplication qui, apparemment se fait dans le sens 16s 23s 5s.
    - La destruction des clusters conserve les séquences de tRNAs et ne détruit que les rRNAs. Voir
    - Un autre processus est à l'origine de la création de séquence de tRNAs dans les clusters sans rRNAs où les gènes sont répétés alors que dans les clusters avec rRNAs les gènes ne sont jamais répétés. Cas des actinomycètes où le processus z est réduit à 2 z1-3 pour 354 blocs étudiés.
    - Si on revient au processus de création de type alphabet, nous voyons que le processus par modèle le reproduit mais par gène et non par base par base. Le gène tRNA étant rigide (feuille de trèfle) le modèle est reproduit à l'identique sauf pour 3 bases (codon) ou 5 (codon plus les 2 bases l'entourant très sensibles lors de la maturation des ttRNAs) qui varient sous la contrainte physique du cluster dans le bloc de réparation.
    - La synthèse des z longs supérieurs à 3 m'a conduit à penser que même les comparaisons B-C révèlent la différence entre les 2 clusters qui contraignent différemment la réparation.
    - L'ajout des autres firmicutes ne modifie pas les résultats.
    - La comparaison entre proteobacteria, alpha + gamma, obéit toujours à la même hypothèse de la contrainte phsique du cluster.
Différents comportements des z
  • les longueurs, les taux, les génomes, les cds, les 16s5s23s, les cassés deino, les z' équivalents aux z. Sans z 1-3 4-8 9-23
conclusion
  • En conclusion: Malgré la ressemblance forte entre clostridia et bacilli pour les z longs, que ça soit les z9-23 (23 tRNAs jaunes) ou les z4-8 (17 sur 23 jaunes), les bascules fortes rouges ttg gca aga, la déficience en atgf chez les z4-8 et les caractéristiques uniques des x9-23 des bacilli ainsi que les nombreuses petites différences relevées (notamment les bascules des z4-8) laissent penser que chaque type de longueur z ou x correspond à un processus de création différent, Ce sont z1-3 z4-8 z9-23 et pour les avant 16s, x1-3 x4-8 x9-23 z'1-3 z'4-8 z'9-23.
  • Suite *******
  • Dans les totaux des blocs longs: les 2 types de bascules, tga cga ata (à compter sur toutes les bactéries), le 14 des ctc, ccc gcc gtc, 5s et cds.
  • Les cds internes ? pas de cds chez les bacilli beaucoup chez clostridia et autres firmicutes, 16s23s5s-cds-tgc-tta.
  • Les blocs bizarres 16s5s-*-23s propres aux firmicutes.
  • Tableau de multiplicité des bacilli
  • Tableau de multiplicité des clostridia

Type x-16s23s5s

Type x cumuls

Type x récapitulatif
  • Lien tableur: Type x récapitulatif
  • Légende:
    - 16*, autres dans les autres bactéries contient 19 clades dont 16 n'ont pas de avant 16s. Les 3 autres sont acidobacteria (acido) aquificae gemmatimonadetes (gemmati) listées en dernier.
    - total blocs, somme du tableau + différents + incomplets. Voir pour chaque clade ses blocs (tableau) et ses notes (différents + incomplets).
  • Notices: absence des x et y pour actino et x pour alpha
    - l'absence des x et y pour actino et x pour alpha peut être estimée par 2ơ, racine(effectif*p*(1-p))*2, l'intervalle de confiance [1] de la loi binomiale [2]. Pour p=0.01 la différence effectif*p moins 2ơ devient négative alors qu'elle reste positive pour p=0.02. Pour cette dernière valeur de p, zéro type avant 16s est statistiquement différent de effectf*0.02 puisque zéro est en dehors de l'intervalle effectf*0.02±2ơ. Pour actino (effectif de 354) il y a donc moins de 7 type x et y (354*0.02) et pour alpha (effectf de 208) moins de 4 de type x. Cela reste vrai pour le z de actino dont l'effectif est 2.
AV Bactéries. Récapitulatif des avant 16s, x.
AV1 Les taux des avant 16s par clade
référencescladetypelongscourtssanstotal xtotal blocsx %
courtsbacilliavant126182886
longsaprès153
courtsclostridiaavant212142645
longsaprès545
gammagammaavant22227423
après517
epsilonepsilonavant1341134
après4
tenericutestenericutesavant1673222
après142
betabetaagc1131652
atgf22
deltadeltagca111642
bacteroibacteroidescgt1121262
aac11
chlamchlamcac55517
acidoacidobacteriaaag1116
aquificaeaquificaecca-aga-atgf11315
gcc22
gemmatigemmaticca-aga-aag1111
autrescyano82
spiro25
chlor15
deino17
toga20
aphaalpha208
actinoactino354
autres16 clades*86
autresa.firmicutes67
totauxlongscourtssanstotal xtotal blocsx %
avant1665-
après62447
8127303
clades étudiéstotal tRNAs
total37courts av112
avec x12courts ap51
sans x25longs av197
longs ap48
AV2 Les types courts des avant 16s
cladetype avantntype aprèsn
bacillicgt-gga4atgf-gac14
ctc-gga1gta1
gga1
clostridiaatgf1aac2
gca-atc-gga1aac-aac1
atgi-gca1aac-atgf1
cag-gag1
5s-atgi-gca1
tcg1
tcc1
gac-ttc-ggc1
tca-tcc1
agc1
ttc-cds1
cgg-tgg1
gammacgg-cac-cca10
agc-gta3gac-tgg4
atgf3x-tgg1
aaa2
ttc1
atgj1
cgg1
ttg1
epsilonaag-caa-atgf1
aac1
aac-aac1
tenericutestac5aac1
aaa-cta1aac-5s-aac1
gta-aac2
betaagc1
atgf2
deltagca1
bacteroidescgt1
aac1
chlamcac5
acidobacteriaaag1
aquificaecca-aga-atgf1
gcc2
gemmaticca-aga-aag1
Type x en x-z
  • Note: ici le z remplace le z' dans la notation x-16s23s5s-z'
type x en court et long, x – z.
cladexcouxcou-zcouxcou-zlonxlonxlon-zcouxlon-zlontotal
gamma17522
bacilli1521018
clostridia4441114
epsilon314
tenericutes14117
reste1616
42185510181
Type x tRNAs
  • Lien tableur: Type x tRNAs
  • Légende:
    - Les couleurs adoptées ici sont celles des tRNA 1-3 rares des types 16s23s5s-z.
    - Le petit tableau précédent le grand affiche le total des effectifs de chaque couleur correspondant au degré de rareté des 1-3 de tpye z. Ainsi il y a 7 tRNA de classe zéro avec un effectif de 10, alors que chez les z cette classe a 14 tRNA avec un effectif de zéro.
  • Notice: 10 blocs x de gamma dans 10 génomes différents ne sont pas décomptés ici, avec x = cgg-cac-cca. Les 3 tRNAs sont rares. Ils se répartissent en 4 types de blocs différents: 416atcgca235 216atcgca235-gac-tgg 216gaa235 216gaa235-gac-tgg
tRNA 1-3
classetRNAeffectif
zéro710
max1240
rare921
cgc00
peu rare511
x16 Les tRNAs de type x-16s23s5s
x16.1 Sur couleurs de fond des types 16s23s5s-z
x-16totalatgfatgicds5s
tRNA828211
ttttcttattgt
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc3tcc2tac5tgc
atc1accaac4agc5
ctc1ccccac5cgt5
gtcgcc2gac1ggc1
ttatca1taatga
ataacaaaa3aga2
cta1cca2caa1cga
gta3gca4gaagga7
ttg1tcg1tagtgg1
atgj1acgaag3agg
ctgccgcag1cgg2
gtggcggag1ggg
x16.2 Liste des tRNA x-16s
tRNA maxtRNA rare
cladetRNAmaxdiverstRNAdiverstRNAdivers
alphaatgf-8cds1atgj1
gamagac-1gaa0cca2
"tgg-1tgc0caa1
"acc-0gta3agc5
firmicutesaac-4tca1aga2
gama5s-1tta011
clostridiattc-3cgt5cta1
"aaa-3atc1ttg1
"atgi-2cac5gcc2
"gca-4cgg2tcg1
deinoggc-1ctc1aag3
betagga-7ggg0cag1
betatac-5tcc2gag1
-4021zéros10
x13 Les tRNA 1-3, sur référence
totatgfatgi5scds
828211
ttttcttattgt
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc3tcc2tac5tgc
atc1accaac4agc5
ctc1ccccac5cgt5
gtcgcc2gac1ggc1
ttatca1taatga
ataacaaaa3aga2
cta1cca2caa1cga
gta3gca4gaagga7
ttg1tcg1tagtgg1
atgj1acgaag3agg
ctgccgcag1cgg2
gtggcggag1ggg

Les type x supérieurs à 3

Les type x bacilli
  • Légende: pour les couleurs vour le tableau référence.
    - Les tRNAs en foncé correspondent aux doubles des 97= blocs. Le rouge est l'exception des bacilli x-16s. Ici les 2 tableaux ayant été construits auparavant sont mis côte à côte pour la comparaison, tableau B9-23.2 et tableau B9-23. 12 Blocs avant 16s
  • Comparaison x z, bacilli. Il n'y a pas x-16s23s5s-z.
B9-23. Comparaison x z
B9-23.2 Effectifs 45 blocs #
tot45#atgfatgi5scds
709347
ttttcttattgt
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc27tcc14tac27tgc15
atc24acc9aac28agc13
ctc4ccccac24cgt30
gtc3gcc1gac37ggc41
tta19tca24taatga
ataaca33aaa32aga1
cta20cca28caa29cga
gta39gca22gaa38gga23
ttg16tcg2tagtgg21
atgj14acg2aagagg
ctg7ccgcagcgg
gtggcggagggg1
B9-23. 12 Blocs avant 16s, x-16s.
tot12xatgfatgi5scds
1575
ttttcttattgt
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc1tcctactgc
atc3accaac12agc11
ctc10ccccaccgt13
gtcgccgac13ggc3
tta3tca2taatga
ataaca2aaa12aga
cta6cca13caa12cga
gta10gca2gaa12gga11
ttgtcgtagtgg1
atgjacgaagagg
ctgccgcagcgg
gtggcggagggg
Les type x clostridia
  • Lien tableur
  • Légende: Pour les couleurs voir le tableau C9-23.1. Les 2 qui le suivent correspondent au tableau de leur somme déjà étudié les clostridia avant 16s: le tableau à 5 blocs contient les séquences longues z et le tableau à 2 blocs contient les séquences x.
  • Comparaison x z, clostridia. cd112 a un tRNA en plus non décompté, tcg-16s23s-gca-5s-12aas. cd001 contient du x et du z longs 5aas-16sgcaatc23s5s-6aas.
    - Autres x-16s, tenericutes et epsilon pour le 3ème tableau. Voir
    + aac-gaa-gta-aca-aaa-cta-16s23s5s tn012
    + 2*(aaa-gta-gac)-aaa-gag-16-gcaatc-235 ep057
    - Tenericutes 11aas, pour le 2ème tableau. Ce clade a 4 autres 16-atc-235-11aas, les 5 11aas ont une séquence identique.
    + tac-16-atcgca-235-gta-aca-aaa-tta-gca-atgj-atgi-tca-atgf-gac-ttc
C9-23. Comparaison x z
C9-23.1 Effectifs 21 blocs #
tot21#atgfatgi5scds
351209
ttttcttattgt
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc17tcc1tac14tgc5
atc8acc4aac13agc7
ctc1ccc2cac10cgt6
gtc3gcc4gac21ggc12
tta10tca8taatga
ataaca16aaa19aga13
cta11cca12caa13cga
gta21gca0gaa21gga17
ttg0tcg1tagtgg6
atgj13acg1aag1agg
ctg4ccg2cag1cgg2
gtggcggag2ggg
C4-23 5 Blocs avant 16s, 16s23s5s-z.
tot5zatgfatgi5scds
4822
ttttcttattgt
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc2tcctac3tgc1
atc1accaac3agc1
ctcccccac1cgt
gtcgccgac4ggc1
tta2tca1taatga
ataaca4aaa3aga1
cta1cca1caa1cga
gta4gcagaa4gga1
ttgtcgtagtgg1
atgj1acgaag1agg1
ctgccgcagcgg
gtggcggagggg
C4-23 2 Blocs avant 16s, x-16s.
tot2xatgfatgi5scds
201
ttttcttattgt
attactaatagt
cttcctcatcgc
gttgctgatggt
ttc1tcctac1tgc2
atcaccaac1agc1
ctcccc1caccgt1
gtc1gccgac1ggc3
ttatcataatga
ataacaaaa1aga
ctacca1caacga
gta1gcagaa1gga
ttgtcgtagtgg
atgj1acgaagagg
ctg1ccgcagcgg
gtggcggagggg

Type x synthèse

  • Le 1/3 des clades a des blocs avec x (récapitulatif en bas du tableau AV1)
  • Mais la moyenne par clade est de 3% des blocs (Av1, colonne x%)
  • Quand un x-16s a un z', x-16sy23s5s-z', ce z' est souvent le même que le z dans les blocs, 16sy23s5s-z. Voir dernière colonne de Av2. Les types x sont différents donc des z courts en général, voir _x_.
  • Comparaison des fréquences des tRNA 1-3 _z_ et _x_: Ces 2 tableaux montrent clairement que les x-16s et les 16s23s5s-z sont très différents, même quand un clade n'a pas de tRNA exceptionnels. Ainsi chez les x les rares rouges et blancs sont abondants alors que chez les z les rouges n'existent pas du tout. On a respectivement, pour jaune blanc rouge, 11 21 10 pour un total de 82, soit 50% chez les x et 48 20 0 pour un total de 103, soit 76%, chez les z. Cependant les divers cyan sont sous-estimés chez les z. Si on admet que les divers sont répartis au hasard, les clades max devraient en contenir autant. En doublant les divers (44) chez les z le total des 4 couleurs serait alors de 112 et le taux des jaunes + blancs + rouges serait de 68/112 = 61%, chez les z. Ceci montre qu'il y a un glissement aussi des divers vers les rares, jaune blanc rouge.
  • Les types x-16s cgg-cac-cca au nombre de 10 chez les gamma renforcent encore cette différence entre x et z, les 3 tRNA sont de la classe blanc, rares et non rares.
  • Comparaison des tRNA des x et z longs: Voir le tableau des types x en court et long
    - La dissymétrie quasi totale entre les bacilli (12 x-longs) qui n'ont pas de z-longs et les clostridia (5 z longs) qui n'ont qu'un seul x-long non ambigu montre bien que le processus à l'origine des avant 16s n'est pas aléatoire, c'est à dire qu'ils ne sont pas des réarrangements au hasard de blocs déjà produits par le processus de base. Cependant ce processus avant 16s paraît dérivé du processus de base. Ainsi le processus de base des bacilli donne très peu de 1-3 (voir pourcentage des z) et son processus avant ne donne que des x 9-23 longs (12) et peu de x 1-3 (6). Voir le récapitulatif. Le processus de base des clostridia donne beaucoup de 1-3 et son processus avant donne un seul x-long de 15aas et 12 x 1-3. Les clostridia donnent un bloc intéressant 5aas-16s23s5s-6aas qui s'apparente aux x 1-3 et ne peut être produit par le processus de base et donc est propre au processus avant des clostridia.
    - Les tRNA rares des x-longs: Les 12 x-longs des bacilli se différencient des 97 z-longs (tableau 97=) par le fait que les 10 blocs différents entre eux ne diffèrent que par 1 à 2 tRNA ce qui donne un tableau de tRNA très hétérogène alors que celui des z-long est homogène. C'est une propriété du processus avant des bacilli. La caractéristique des tRNA rares que j'ai montré pour les x 1-3 est moins évidente pour les x longs mais elle existe. Ainsi pour les bacilli le ctc rare chez les z-longs se trouve dans 10 x-longs comme une caractéristique de multiplication du processus avant. De même l'unique x-long des clostridia arbore 3 tRNA rares dont le plus rare d'entre eux, le ccc, les 2 autres sont gtc et ctg.
    - J'ai signalé d'autres x-longs appartenant à epsilon et aux tenericutes. Epsilon contient un tRNA rare aag et les tenericutes contiennent 5 séquences identiques, 1 x-long et 4 z-long (sans x) avec gca qui fait partie de la bascule bacilli-clostridia (ref).
  • Les x sur fond de référence des z longs des firmicutes.
  • Les réarrangements des clusters RNA (ref.) conservent les tRNA et les blocs avant-16s et surtout ne détruisent que les 16s et 23s.

Les cds intra bloc

cds cumuls

type y
  • alpha: 32 voir typage cds pour les cds avérés, typage cds et intercalaires pour les annexes, typage absence de cds pour la cause du rejet.
  • beta: les 35 blocs avec cds l'ont perdus
  • actino: 24 blocs perdus aussi
  • clostridia: 9, vérifiés dans cds notes
  • gamma: 15 voir cds notes et les cds dans les annexes, notamment eco cds et les opérons tRNA-protéine. Voir la création de gènes dans blogooolife . Voir l'organisation de l'opéron tac-tac-tpr.
  • total11 2, verrucomicrobia 1, epsilon 1 (exception), cyano 1.
type x z
  • Voir les cds des z1-3

cds synthèse

  • Les bacilles n'ont pas de cds intra bloc sur 288 blocs.

Synthèse blocs à RNA

  • Notes
    - récapitulatifs des cassés pour comparer avec les archées, 16s, 23s5s.
    - récapitulatifs des autres cassés, 16s*23s, perte du 5s
    - récapitulatifs des abîmés pour la théorie des cds

Synthèse archées

  1. https://fr.wikipedia.org/wiki/Th%C3%A9or%C3%A8me_central_limite
  2. https://fr.wikipedia.org/wiki/%C3%89cart_type#Exemples
Cet article est issu de Wikiversity. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.