Qu’est-ce que l’encodage en informatique?
Je précise avec le mot ‘informatique’ car l’encodage est utilisés dans plusieurs domaines.
Un encodage en informatique est le langage utilisé pour que les machines et les outils communiquent entre eux.
Derrière ce que nous voyons sur nos écrans (ordinateurs, tablettes, portables, etc) un autre langage est caché, que nous ne pouvons pas comprendre, sauf en ayant des connaissances sur le sujet.
Plusieurs langues existent dans le monde (français, arabe, anglais, hébreux, etc) et chaque langue a ses propres lettres et caractères. Et en informatique, plusieurs encodages existent et chacun sa syntaxe et ses propres caractères.
Si vous parlez le français et que vous partez dans un autre pays où les gens ne comprennent pas votre langue, ils ne vont pas pouvoir vous comprendre et vous n’allez pas pouvoir communiquez.
Les caractères des encodages sont organisés sous forme de tableaux.
Exemple simple:
1- Premier encodage: appelé ASCII (American Standard Code for Information Interchange) qui est un encodage américain. Et comme vous le savez, l’anglais n’a pas de caractères spéciaux (comme le « é », « è », « à » , etc).
Le tableau qui organise ses caractères est le suivant :
2- Le deuxième encodage: le ISO_8859_1 (ou Latin-1 ou Europe occidentale).
Le tableau suivant représente ses caractères, et les caractères spéciaux en font partie.
Derrière chacun de ses caractères (quelque soit l’encodage) se cache une suite de chiffres qui le représente. On ne va pas écrire ‘A’ pour demander d’écrire cette lettre, on va plutôt écrire une suite de chiffres et l’ordinateur va afficher la lettre A (c’est ce qu’on appelle la compilation).
- Exemple:
- Premier exemple:
- On écrit un programme avec l’encodage ISO_8859_1, qui inclue les caractères spéciaux.
- On écrit cette petite chaîne de chiffres « 001 » (juste comme exemple) qui représente la lettre « à » dans le tableau de l’encodage « ISO_8859_1 » .
- On demande à l’ordinateur d’afficher ce qu’on a écrit, en lui précisant que l’encodage utilisé est le ISO_8859_1.
- Dans ce cas il va bien faire son travail et afficher la lettre « à ».
- Deuxième exemple:
- Reprenant le premier exemple, mais au moment de demander à l’ordinateur de lire le code, on va le trahir et en lui indiquant que l’encodage est le « ASCII ».
- Il va chercher la case « 001 » pour l’afficher. Et dans ce cas, on aura pas la lettre « à » mais un autre caractère.
- Premier exemple:
Si vous avez choisi le mauvais encodage, vos données ne seront pas bien affichées. Comme dans l’exemple du tableau ci-dessous où j’ai choisi l’encodage « UTF_8 » pour ouvrir un fichier alors que ce n’est pas le bon.
Si je fais la correction en précisant que le bon encodage est « ISO_8859_1 », j’aurai le résultat suivant: