Wikipédia:Unicode/Test
Vous pouvez, dans cette page, tester la présence sur votre système d’exploitation de polices permettant l’affichage de blocs de caractères nécessaires à la lecture de certains articles. Comparez ce que vous lisez dans la colonne Texte à l’image affichée. Si des carrés vides, des points d’interrogation ou autres apparaissent à la place des caractères attendus, reportez-vous à la page Unicode pour télécharger les polices idoines.
Rappelez-vous aussi qu’il est possible que des polices adaptées soient déjà installées, auquel cas c’est votre navigateur ou votre feuille de style qui est mal réglé : vérifiez la ou les polices que vous lui demandez d’utiliser pour l’affichage en vous reportant au manuel du logiciel.
Voir aussi : Wikipédia:Caractères spéciaux.
Écritures « simples »
[modifier le code]Caractères latins modifiés
[modifier le code]Ces caractères sont fréquemment utilisés dans les articles de linguistique et ceux consacrés aux écritures (en tant que caractères de transcription).
- Blocs : latin de base, latin-1, latin étendu A, latin étendu B, latin étendu additionnel, lettres modificatives avec chasse et diacritiques.
Alphabet phonétique international
[modifier le code]L’alphabet phonétique international utilise un mélange de caractères latins (et grecs « latinisés »), de diacritiques et de caractères qui lui sont propres. L’exemple suivant ne comprend bien sûr pas toutes les possibilités.
Texte testé | Image de référence |
---|---|
ʒə nə konɛ ply pɛːʁsɔn ɑ̃ mase |
- Blocs : extensions A.P.I., marques diacritiques, divers blocs latins (cf. précédemment).
Alphabet grec
[modifier le code]Système monotonique (moderne)
[modifier le code]L’affichage du grec monotonique (servant au grec moderne) ne soulève pas de problèmes importants : il est maintenant pris en charge par défaut dans la majorité des systèmes d’exploitation courants (GNU/Linux, Windows, Mac OS, etc.).
Texte testé | Image de référence |
---|---|
1 Στην αρχή ήταν ο Λόγος, και ο |
Système polytonique (ancien)
[modifier le code]De nombreux caractères étendus sont nécessaires au grec polytonique (servant principalement à noter le grec ancien). Dans le tableau suivant, lire correctement le texte tiré de l’Iliade garantit un affichage correct des articles consacrés au grec ancien ou qui en citent des mots. Parmi les caractères spéciaux indiqués, tous ne sont pas aussi importants ; ce sont principalement des lettres archaïques ou des variantes ainsi que des lettres coptes, qui seront cependant indispensables pour la lecture d’articles citant des textes épigraphiques voire pour ceux traitant des lettres en question et, plus généralement, de l’histoire de l’alphabet grec.
Texte testé | Image de référence | ||||||||
---|---|---|---|---|---|---|---|---|---|
|
Notes :
- Actuellement, la prise en charge des claviers pour le grec ancien sous GNU/Linux ne permet pas, par défaut, de coder correctement les voyelles accentuées de l’alphabet grec : en effet, les caractères attendus sont remplacés par ceux du grec moderne, qui possèdent leur propre emplacement et sont, selon les polices, parfois affichés surmontés d’un accent droit et non d’un accent aigu oblique.
- L’affichage d’un accent en forme de petit tilde latin (˜) au lieu de la forme d’un accent circonflexe latin (^) n’est pas incorrect en grec ; le tilde est correct historiquement, mais s’est transformé au cours du temps en accent circonflexe en grec moderne, et Unicode représente les deux formes avec un seul caractère diacritique, unifié avec l’accent circonflexe latin.
- En revanche, l’esprit doux (en forme d’apostrophe courbée ou de petit coin supérieur droit, et qui représente une consonne étymologique absente) et les accents aigus et graves (traits non courbés et penchés) doivent clairement être distingués, et s’inscrivent à la gauche d’une lettre majuscule grecque, et non au-dessus (contrairement au tréma) ; ils peuvent se combiner avec la même lettre, l’esprit étant affiché à gauche de l’accent s'il s'agit d'une lettre majuscule ; par ailleurs, l’accent peut s’inscrire normalement au milieu d’un tréma.
Alphabet cyrillique
[modifier le code]Les caractères suivants sont archaïques et moins fréquemment affichés par les polices courantes : Ѡ, ѧ, Ѣ et ѣ ainsi que les diacritiques о҅ et о҃. Cette lacune ne gênera cependant aucunement la lecture des articles courants citant des mots en cyrillique des langues modernes actuelles.
Alphabet tifinaghe
[modifier le code]Utilisé pour l’écriture du berbère.
- Bloc Unicode : Tifinaghe (U+2D30 à U+2D6F).
Syllabaires japonais
[modifier le code]On peut noter que ces écritures s’utilisent souvent conjointement avec les sinogrammes (dans leur forme japonaise qui peut selon les cas être traditionelle, ou parfois simplifiée), et il existe de nombreux cas où les caractères alphasyllabaires japonais sont disposés en blocs carrés dans leur forme réduite (souvent pour des abréviations ou mots d’usage courant). Certains diacritiques communs aux deux syllabaires peuvent s’y ajouter et se combiner pour distinguer des consonnes qui restent confondues dans le syllabaire non modifié : ces diacritiques (comme le ten) sont d’usage très courant et leur prise en charge est normalement requise dans toutes les polices japonaises.
Pour l’écriture idéographique kanji : 日本語, voir les sinogrammes ci-après.
Syllabaire hiragana
[modifier le code]Texte testé | Image de référence |
---|---|
あいうえお |
Syllabaire katakana
[modifier le code]Texte testé | Image de référence |
---|---|
アイウエオ |
L’alphabet runique des peuples nordiques anciens.
Texte testé | Image de référence |
---|---|
ᛡᛅᚱᛅᛚᛏᚱ ᛁᛅᛋ᛬ᛋᚫᛣ᛫ᚢᛅᚾ᛫ᛏᛅᚾᛉᛅᚢᚱᚴ |
- Bloc : Runes (U+16A0 à U+16F0).
Écritures à rendu complexe
[modifier le code]Elles sont traitées à part :
Écritures alphabétiques de droite à gauche
[modifier le code]- Test en hébreu ; voir aussi hébreu et alphabet hébreu.
- Test en arabe ; voir aussi arabe et alphabet arabe.
- Test en syriaque (page manquante à faire) ; voir aussi syriaque et alphabet syriaque.
- Test en thâna (page manquante à faire) ; voir aussi divehi (ou maldivien) pour l’alphabet thâna.
Voir aussi texte bi-directionnel.
Alphasyllabaires indiens
[modifier le code]Ces écritures d’origine brahmique forment de nombreuses ligatures et formes contextuelles selon les voyelles et modifications semi-vocaliques de syllabes de base. Ce ne sont pas à proprement parler des alphabets, ni des syllabaires (ou alors ce sont des syllabaires à rendu complexe). Notez que certaines langues indiennes utilisent normalement l’alphabet arabe (par exemple l’ourdou), mais sont parfois transcrites en écriture devanagari ou latine.
Alphasyllabaire thaï
[modifier le code]Si vous utilisez Microsoft Internet Explorer, configurez votre navigateur en allant dans Démarrer > Outils > Panneau de configuration > Options Internet et en cliquant sur le bouton Polices... Choisissez Thaï dans le menu déroulant du haut et indiquez la police Tahoma.
Texte testé | Image de référence |
---|---|
วิกิพีเดีย |
Alphasyllabaire tibétain
[modifier le code]Texte testé | Image de licence CC BY-SA 3.0 |
---|---|
༐ༀ་མ་ཎི་པ་དྨེ་ཧཱུྃ༐ |
Syllabaires et autres écritures « simples » utilisant un nombre étendu de glyphes
[modifier le code]Ces écritures sont facilement prises en charge, car elles ne nécessitent pas la prise en compte de nombreuses ligatures, ni la prise en charge d’un mode d’écriture bidirectionnel. Cependant, le nombre de glyphes à prendre en charge est important, et ces écritures demandent le plus souvent des polices spécifiques.
Syllabaire guèze
[modifier le code]Le syllabaire est utilisé en Afrique orientale (principalement en Éthiopie et Érythrée) pour l’écriture des textes écrits dans les langues suivantes :
- Guèze (ancien amharique d’usage liturgique de l’Église chrétienne éthiopienne, également utilisé en Israël par la communauté juive Beta d’origine éthiopienne)
- Amharique (moderne)
- Tigrinya
- Testez votre navigateur pour l’amharique
Alphabet coréen (hangeul)
[modifier le code]Bien que l’écriture hangeul utilise un alphabet très simple, elle se compose de façon complexe en groupes syllabiques, avec une syllabe par carré, et une disposition stricte dans le carré. Un nombre restreint de syllabes sont composées en coréen moderne, mais certaines syllabes du coréen ancien peuvent demander un rendu plus complexe.
Texte testé | Image de référence |
---|---|
한국어 |
Première ligne : syllabes précomposées, qui ne présentent pas de difficulté d’affichage particulière. Deuxième ligne : lettres (jamos) séparées, représentant le même texte, parfois affichées de la même manière (en carré) que la première ligne.
Caractères chinois (sinogrammes)
[modifier le code]Les sinogrammes peuvent se présenter en deux types selon leur présentation (apparence graphique) : les caractères traditionnels et les simplifiés. Les polices destinées à l’affichage du chinois ne sont pas toutes susceptibles de gérer les deux types à la fois.
Ils sont utilisés aussi en japonais dans une variante graphique appelée kanji, et furent aussi utilisés pour d’autres langues, comme le vietnamien avant sa conversion vers l’écriture latine, ou le coréen (dans sa variante hanja) avant sa conversion à l’alphabet hangeul, ou encore aujourd’hui pour la transcription de la langue mongolique (qui utilisait un syllabaire traditionnel) en Chine (mais en Mongolie, l’ancien syllabaire traditionnel a été remplacé par l’alphabet cyrillique).
Caractères traditionnels
[modifier le code]Texte testé | Image de référence |
---|---|
少小離家老大回、 |
Caractères simplifiés
[modifier le code]Texte testé | Image de référence |
---|---|
少小离家老大回、 |
Flèches
[modifier le code]Blocs situés hors du plan multilingue de base
[modifier le code]Le plan multilingue de base (ou PMB) définit des emplacements pour des caractères situés entre U+0000 et U+FFFF, soit 65536 emplacements (de 0 à 65535 compris), contenant la plupart des caractères et symboles utilisés dans les langues modernes actuelles.
Au-delà, hors du PMB, le codage des caractères peut soulever des problèmes pour certains systèmes d’exploitation et/ou navigateurs Internet ; en outre, rares encore sont les polices de caractères sachant coder et afficher les caractères en question, placés hors du PMB parce qu’ils sont d’usage beaucoup plus limité.
De fait, il est fréquent que les caractères hors du PMB ne soient pas affichés correctement, sauf si vous possédez le plan multilingue complémentaire et/ou un navigateur et une police sachant coder et afficher une ou plusieurs de ces langues.
Texte testé | Image de référence |
---|---|
𐌰𐌱𐌲𐌳𐌴𐌵𐌶𐌷𐌸𐌹𐌺𐌻𐌼𐌽𐌾𐌿𐍀𐍁𐍂𐍃𐍄𐍅𐍆𐍇𐍈𐍉𐍊 |
- Bloc : Gotique (U+10330 à U+1034A).
Texte testé | Image de référence |
---|---|
𐎀𐎁𐎂𐎃𐎄𐎅𐎆𐎇𐎈𐎉𐎊𐎋𐎌𐎍𐎎 |
- Bloc : Ougaritique (U+10380 à U+1039D).