1.2 - EUC (Extended Unix Code)
Le code EUC est un codage dérivé du JIS. La différence vient du fait qu'il n'utilise pas de séquences d'échappement pour basculer entre le texte ASCII standard et le texte japonais. En contre-partie, les caractères japonais sont encodés en prenant son code JIS mais avec le 8ème bit positionné à 1.
Les autres caractères qui ont leur 8ème bit placé à 0 sont considéré comme du texte ASCII standard.
Par exemple, la chaîne "Japon 日本" encodée en EUC donnera :
Chaîne |
J |
a |
p |
o |
n |
|
日 |
本 |
Encodage EUC |
Caractères ASCII |
Caractères EUC |
74 |
97 |
112 |
111 |
110 |
32 |
C6 FC |
CB DC |
1.3 - Shift-JIS
Il s'agit d'un autre système d'encodage conçu par Microsoft. A l'instar de l'encodage EUC, il n'emploie pas de séquences d'échappement mais utilise le 8ème bit pour distinguer les deux types de caractères. Seulement, l'encodage des caractères proprement dit se fait sur une autre base que celle employée pour le code JIS et EUC.
La chaîne "Japon 日本" encodée en Shift-JIS donnera :
Chaîne |
J |
a |
p |
o |
n |
|
日 |
本 |
Encodage Shift-JIS |
Caractères ASCII |
Caractères Shift-JIS |
74 |
97 |
112 |
111 |
110 |
32 |
93 FA |
96 7B |
|