La plupart des fichiers texte sont stockés à l'aide de caractères ASCII - chaque caractère est codé sur un octet (8 bits). Cela signifie que nous pouvons avoir un maximum de 256 caractères différents. Ce n'est pas un problème dans la plupart des environnements anglophones, mais cela devient un problème une fois que vous commencez à coder des caractères dans différentes langues.

 

Unicode est une norme de codage de caractères qui tente de résoudre le problème du codage de tous les caractères internationaux possibles dans un format unique et unifié.

 

Comme pour la plupart des standards, vous avez le choix entre plusieurs saveurs. V prend en charge UCS-2 et UTF-8. (Voir la note ci-dessous concernant UTF-16)

 

Indicateur de la barre d'état

 

V détectera automatiquement la plupart des fichiers Unicode et les affichera en conséquence, y compris les fichiers contenant des caractères étrangers. UNI sera affiché dans la barre d'état pour indiquer que le fichier est un fichier Unicode. ANS (pour ANSI) sera affiché dans la barre d'état lorsque le fichier n'est pas un fichier Unicode.

 

If V ne devine pas le bon encodage, vous pouvez cliquer sur le UNI/ANS dans la barre d'état et sélectionnez le codage correct (en supposant que vous savez de quoi il s'agit).

 

Remplacement de police

 

V ne prend pas en charge la substitution de police (ou le remplacement de police). Sous substitution de police, si la police sélectionnée ne contient pas un caractère particulier, le programme essaiera d'utiliser une autre police pour afficher ce caractère. Depuis V ne fait pas de substitution de police, il est très important d'utiliser une police qui contient tous les caractères à afficher. En particulier, la norme Courrier la police ne doit pas être utilisée pour afficher les fichiers Unicode - Courier New devrait être utilisé à la place.

 

UCS-2 contre UTF-16

 

À proprement parler, V ne prend pas entièrement en charge UTF-16 - il ne prend en charge que UCS-2 (qui est le prédécesseur obsolète d'UTF-16).

 

UCS-2 est un codage de longueur fixe qui code tous les caractères sur une valeur de 16 bits (de 0 à FFFF). UTF-16 est un codage à longueur variable capable de coder toute la plage de caractères Unicode. En particulier, UTF-16 peut être utilisé pour coder des caractères supérieurs à FFFF.

 

Cependant, dans la plupart des cas, UCS-2 et UTF-16 sont identiques. Si les utilisateurs rencontrent des problèmes pour visualiser les fichiers Unicode, veuillez contacter v@fileviewer.com (de préférence en joignant une copie du fichier Unicode).

 

 

Notes

 

V ne prend pas en charge UTF-32

 

V ne prend pas en charge l'affichage RTL (droite à gauche)