Byte

Le byte (prononcé /baɪt/), ou multiplet en français[1], est  indépendamment de l'adressage physique de la mémoire  la plus petite unité « logiquement » adressable par un programme sur un ordinateur. Aujourd’hui, le besoin d'une structure commune pour le partage des données a fait que le byte de bits, ou 1 octet, s'est généralisé en informatique. Cependant,

  • jusque dans les années 1970, il existait des processeurs avec des bytes de tailles très variables ;
  • il existe, pour la programmation des automates et autres équipements industriels simples, des processeurs utilisant des mémoires adressables par quantité de 4 bits, voire moins ;
  • beaucoup de microprocesseurs adressent physiquement la mémoire par mot de plusieurs bytes afin d'augmenter les performances.

Pour les articles homonymes, voir Byte (homonymie).

Ne doit pas être confondu avec octet, bit ou mot (architecture informatique).

La généralisation des bytes de 8 bits conduit à la confusion des notions de byte et d'octet. L'octet, comme son nom l’indique, contient exactement 8 bits (en anglais eight-bit byte).

Histoire

Le terme Byte est créé en 1956 par Werner Buchholz[2],[3] alors qu'il travaille à la conception de l'IBM Stretch. C'est une déformation orthographique volontaire de l'anglais bite, littéralement « bouchée », pour éviter toute confusion avec bit par élision du e final. Le terme désigne par analogie la plus petite unité de données accessible via un bus de données[4].

Sur l'IBM Stretch, il est constitué de 1 à 8 bits consécutifs dans la mémoire, sa longueur étant déterminée par l'instruction exécutée[5].

Le byte est l'unité de stockage d'un emplacement mémoire, qui selon le processeur peut varier de quatre à plusieurs dizaines de bits. Chaque constructeur définissait la taille du byte en fonction de ses besoins du moment. Ainsi, par exemple, le PDP-10 utilise un byte par le jeu d'instructions en langage machine, qui a une taille variable. Sur cette même architecture, les mots, utilisés pour l'adressage mémoire, font 36 bits.

Distinction entre byte et octet

En anglais, la capacité de la mémoire informatique s'exprime généralement en bytes, alors qu'en français elle s'exprime plutôt en octets, ce qui était différent jusqu'à la généralisation des bytes de huit bits[Quand ?]. On peut donc considérer qu'une documentation en français qui exprime la capacité de mémoire en bytes a été mal traduite. Aujourd'hui, pour le Dictionnaire du multimédia. Audiovisuel, informatique, télécommunications[6] de l'AFNOR, le byte est « l'unité d'information correspondant à un octet, soit 8 bits ». La normalisation « IEC 80000-13 » va dans le même sens : normaliser la taille des bytes à 8 bits. C'est de cette normalisation du byte de 8 bits que vient la confusion.

En anglais comme en français, si l'on veut explicitement désigner une quantité de huit bits, on utilise le mot octet ; tandis que si l'on veut exprimer l'unité d'adressage indépendamment du nombre de bits, on utilise le mot byte. Ainsi la description formelle d’un langage de programmation utilisera sciemment le mot byte si le langage ne nécessite pas qu’un byte ait une taille d’un octet. C’est par exemple le cas du langage C, où un byte peut contenir plus de huit bits. Le mot octet est sciemment utilisé en français comme en anglais pour décrire un format de données au bit près. Ainsi, on trouve le mot octet dans des textes anglais comme le RFC 793[7] qui décrit le protocole de communication TCP d'Internet, ou dans le standard H.263 qui décrit une norme de codage vidéo numérique.

La même distinction entre byte et octet existe donc dans les deux langues, seul change le mot que l'on utilise couramment dans les cas où le byte mesure huit bits.

Confusion entre bit et byte

La capacité mémoire d'une puce de mémoire informatique est généralement donnée en bits (b), mégabits (Mb) ou gigabits (Gb), alors que la capacité mémoire de l'ensemble des puces d'un ordinateur est généralement donnée en bytes (B), mégabytes (MB) ou gigabytes (GB), ou en octets (o), mégaoctets (Mo) ou gigaoctets (Go). Des médias négligents font la confusion entre bit et byte et se trompent donc d'un facteur de huit, par exemple en écrivant « ordinateur doté de Gb de RAM » au lieu de « ordinateur doté de GB de RAM » ou « ordinateur doté de Go de RAM »[8].

La capacité des cartouches de jeu vidéo est généralement donnée en bits, ce qui fait exception à l'usage répandu du byte ou de l'octet pour la mesure d'une mémoire complète. Cela permet d'utiliser de plus grands nombres dans la communication, en écrivant « cartouche de Mb » (8 mégabits) au lieu de « cartouche de Mo » (1 mégaoctet).

Bytes multiples

En informatique, lorsqu’un processeur est capable de traiter plusieurs bytes en tant qu’entité unique, on appelle cette entité un « mot ». Les tailles de mot les plus courantes sont :

Comme pour les octets, les multiples sont kilobyte, mégabyte, gigabyte, etc.[9] des puissances de 10. Lorsqu'on utilise des puissances de 210 il faut intercaler un 'i'.

Notes et références

  1. Définitions lexicographiques et étymologiques de « multiplet » (sens DÉR. b)) dans le Trésor de la langue française informatisé, sur le site du Centre national de ressources textuelles et lexicales
  2. (en) Werner Buchloz, « The link system, §7 - Shift Matrix »,
  3. (en) Werner Buchloz, « The Word "Byte" Comes of Age ... », Byte Magazine, vol. 2, no 2, (lire en ligne)
  4. Byte, catb.org, Werner Buchholz et le terme byte.
  5. (en) F. P. Brooks, G. A. Blaauw et W. Buchholz, « Processing Data in Bits and Pieces », IEEE Transactions on Electronic Computers, vol. EC-8, no 2, , p. 118–124 (ISSN 0367-7508, DOI 10.1109/TEC.1959.5219512)
  6. 1996, p. 135.
  7. (en) Request for comments no 793.
  8. Pour être tout à fait précis, il faudrait l’exprimer en Gio, c’est-à-dire en giga binaire, donc en puissances de 2 (facteurs de 1 024 et non de 1 000).
  9. Bytes - Unités de mesures en multiples de "bytes", sur assiste.com, consulté le

Voir aussi

Articles connexes

  • Portail de l’informatique
Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.