Wiktionnaire:BCP 47
Composition | Type | Format | Listes des valeurs | Origine initiale des codes |
---|---|---|---|---|
Sous-labels génériques normalisés |
langue | à 2 lettres | liste des sous-labels | extraits de ISO 639-1 |
à 3 lettres | a · b · c · d · e · f · g · h · i · j · k · l · m · n · o · p · q · r · s · t · u · v · w · x · y · z | extraits de ISO 639-2, ISO 639-3 ou ISO 639-5 | ||
à 4 lettres | — | réservés pour versions futures de l’ISO 639. | ||
de 5 à 8 lettres | liste des sous-labels | registre IANA pour BCP 47 | ||
extensions de langue opt. : 0 à 3 |
3 lettres | sous-labels d’extension de : macrolangue · collection | parties de ISO 639-1 ou ISO 639-2 | |
écriture opt. : 0 ou 1 |
4 lettres | alphabétique unifiée · variante de forme graphique · écritures multiples · notations · traitement spécial | extraits de ISO 15924 | |
région opt. : 0 ou 1 |
2 lettres | sous-labels de pays et territoires | extraits de ISO 3166-1 | |
3 chiffres | sous-labels de continents et régions continentales | extraits de UN M.49 | ||
variantes opt. : 0 à 3 |
1 chiffre et 3 alphanums, ou de 5 à 8 alphanums |
restreintes à certains préfixes · non restreintes | registre IANA pour BCP 47 | |
extensions opt. : 0 ou plus |
1 lettre (sauf x) suivi d’1 ou plusieurs sous-labels de 2 à 8 alphanums |
t-* (transformations Unicode) · u-* (locales Unicode) | registre IANA pour BCP 47 | |
utilisation privée opt. : 0 ou 1 |
x suivi d’1 ou plusieurs sous-labels de 1 à 8 alphanums |
non spécifié | utilisation privée hors normes | |
Labels complets de compatibilité |
hérités | incompatible avec les sous-labels génériques |
listes par type de sous-label primaire avant extension : singleton du registre IANA · à 2 lettres · à 3 lettres |
anciennes versions de BCP 47 (RFC 4645 et RFC 4646) |
redondants | compatible avec les sous-labels génériques |
listes par type de redondance : d’extensions de langue · d’écriture · de région · de variantes |
Notes
[modifier le wikicode]- Les labels et sous-labels dont la date indique « 2029-09-09 » sont là de façon prévisionnelle, et reprennent les informations déjà publiées et approuvées des normes ISO 639 et ISO 15924, qui ont été ajoutés dans la nouvelle norme succédant à la RFC 5645 finalisée et approuvée (en fin août 2009). Ils ont été formellement enregistrés par l'IANA à cette date via la nouvelle "RFC 5646" qui a aussi été finalisée et approuvée, et ces RFC ont de nouveaux numéros 5645 et 5646 référencés dans la norme BCP 47 actuelle à la place des anciennes RFC 4645 et RFC 4646.
- Les labels complets dits redondants sont ceux qui ont été enregistrés spécifiquement dans le registre IANA en raison de limitations dans les versions précédentes des RFCs composant la norme BCP 47, mais pour lesquels un enregistrement spécifique du label complet ne serait plus aujourd’hui nécessaire, ces labels plus précis pouvant être composés directement de façon générative à l’aide des sous-labels qui ont été depuis ajoutés à la norme. Dans certains cas toutefois, ces labels complets possèdent eux même une forme simplifiée, indiquée dans la table générale des sous-labels correspondants dans le champ Valeur préférée, mais répétée aussi dans la table des labels complets redondants : ces labels complets redondants restent valides en tant qu’alias (non recommandés) du label complet indiqué dans la colonne Valeur préférée.
- Les autres labels complets dits hérités sont ceux qui ne peuvent pas être obtenus de façon générative par juxtaposition des sous-labels normalisés, et qui ont fait l’objet d’un enregistrement spécifique dans le registre IANA des labels et sous-labels d’identification des langues (et qui devraient encore être enregistrés spécifiquement en l’absence de label de valeur équivalente obtenu de façon générative par les sous-labels normalisés). Dans certains cas, la table contient une autre valeur préférée qui ne peut pas être déduite de la seule table des sous-labels normalisés : ces labels complets hérités et remplaçables (dont la remplaçabilité par une autre valeur préférée provient d’ajouts ou modifications dans une des normes ISO référencées indirectement par BCP 47) restent valides en tant qu’alias (non recommandés) du label complet correspondant indiqué dans le champ Valeur préférée, mais aucun autre label complet ne devrait être formé à partir des sous-labels composant un label complet hérité. Certains labels hérités des versions précédentes de BCP 47 peuvent devenir redondants dans une nouvelle version.
- Dans la norme BCP 47 (révisée transitoirement par les RFC 4645bis et 4646bis au début de l'année 2009 et finalisée dans les RFC 5645 et 4646), tous les labels ou sous-labels indiqués dans le champ Valeur préférée des enregistrements ne devraient plus nécessiter la consultation du label ou sous-label ciblé pour savoir s’il dispose lui-même d’une autre valeur préférée (en chaîne) car ils ciblent directement la dernière valeur recommandée. De même les noms indiqués dans le champ Description sont informatifs et donnés ici uniquement en anglais, tels qu’il figurent dans le registre officiel IANA. Ils ne constituent pas une préférence de désignation des langues ou variétés correspondantes (pas même en anglais).
- Dans tous les cas, l’ordre de présentation dans le registre IANA de tous les enregistrements de labels ou sous-labels d’identification des langues pour BCP 47 est non significatif (il n’est pas imposé au registre de maintenir ces enregistrements triés, les ajouts pouvant se faire par exemple en fin de table dans un ordre quelconque et les modifications autorisant un réarrangement du tri). Cependant, dans les sous-tables présentées dans les pages référencés par l’index ci-dessus, un critère de classement par type d’enregistrement puis par ordre alphabétique des valeurs du champ clé Label ou Sous-label permet de rechercher un label ou sous-label plus facilement, toutes les sous-tables pouvant aussi être triées sur d’autres champs.
Références
[modifier le wikicode]Les données présentées dans les tableaux de labels pour BCP 47 liés ci-dessus sont placées sous licence de l’IETF (http://trustee.ietf.org/docs/IETF-Trust-License-Policy.pdf, d’application effective depuis le 10 novembre 2008) car elles y représentent plus du cinquième du contenu textuel des pages correspondantes ; cette licence permet la copie et la publication gratuites des textes et données publiés dans cette norme, avec l’obligation d’attribution des auteurs et dates de publication par l’IETF. Les modifications autorisées sont la traduction fidèle et l’extraction de parties des textes correspondants publiés par l’IETF mais n’autorisent pas la modification des textes ou des données qu’ils contiennent, non attribuables à l’IETF ou aux contributeurs de ces documents tels que publiés par l’IETF. Ces documents référencés sont les suivants :
- Dernières RFC pour BCP 47
- RFC 5645 (document informatif), par Doug Ewell pour l’IETF, le 1er septembre 2009 : mise à jour du registre IANA des sous-labels de langue pour la RFC 5646 et la RFC 4647.
- RFC 5646 (document normatif), par Addison Phillips et Mark Davis pour l’IETF, le 1er septembre 2009 : syntaxe des labels pour l’identification des langues.
- RFC 4647 (document normatif), septembre 2006 : règles de sélection et d’utilisation des labels et sous-labels de langue du registre IANA.
- Anciennes RFC pour BCP 47
- RFC 4645[5] (ancien document informatif), septembre 2006 : version initiale du registre IANA actuel des sous-labels de langue pour la RFC 4646 et la RFC 4647, désuet, remplacé par la RFC 5645.
- RFC 4646[6] (ancien document normatif), septembre 2006, procédure et règles d’enregistrement de nouveaux sous-labels de langue auprès de l’IANA, désuet, remplacé par RFC 5646.
- RFC 3066[7] (ancien document normatif), janvier 2001, désuet, remplacé par les RFC 4646 et 4647.
- RFC 1766[8] (ancien document normatif), mars 1995, désuet, remplacé par la RFC 3066.
- Autres sources
- Composition des régions macrogéographiques (continentales), composantes géographiques des régions et composition de groupements sélectionnés économiques et d'autres groupements, pour les codes numériques (à trois chiffres) de ces régions définies par la norme UN M.49 (révision 4, juin 1999) de la Division statistiques des Nations unies.
- Référentiel des codes et noms de langues en français de la Bibliothèque nationale de France, pour les noms en français et synonymes de très nombreuses langues ou écritures (à partir de leur code alpha-3 de la norme ISO 639-2 ou d’autres normes bibliothécaires INTERMARC).
- Consulter les références en ligne
- ↑ (Anglais) Registre des composantes d’étiquettes linguistiques pour BCP 47, Internet Assigned Numbers Authority (IANA).
- ↑ (Anglais) Addison Phillips et Mark Davis, « Tags for Identifying Languages », Request for comments no 5646, Internet Engineering Task Force (IETF), septembre 2009.
- ↑ (Anglais) Addison Phillips et Mark Davis, « Matching of Language Tags », Request for comments no 4647, Internet Engineering Task Force (IETF).
- ↑ (Anglais) Doug Ewell, « Initial Language Subtag Registry », Request for comments no 5645, Internet Engineering Task Force (IETF), septembre 2009.
- ↑ (Anglais) Request for comments no 4645, Internet Engineering Task Force (IETF).
- ↑ (Anglais) Request for comments no 4646, Internet Engineering Task Force (IETF).
- ↑ (Anglais) Request for comments no 3066, Internet Engineering Task Force (IETF).
- ↑ (Anglais) Request for comments no 1766, Internet Engineering Task Force (IETF).
Voir aussi
[modifier le wikicode]- Wiktionnaire:ISO 639-1 pour les sous-labels de type langue, pour les langues codées de l’ISO 639-3 ayant aussi un code court (à deux lettres) dans la norme ISO 639-1.
- Wiktionnaire:ISO 639-2 pour les sous-labels de type langue, pour les langues codées de l’ISO 639-3 ayant aussi un code identique (à trois lettres) dans la norme ISO 639-2.
- Wiktionnaire:ISO 639-3 pour les sous-labels de type langue, pour les autres langues codées de l’ISO 639-3, ajoutés au registre IANA depuis août 2009.
- Wiktionnaire:ISO 639-5 pour les sous-labels de type langue, pour les familles de langues codées de l’ISO 639-5, ajoutés au registre IANA en tant que collections depuis août 2009.
- Wiktionnaire:ISO 15924 pour les sous-labels de type écriture, ajoutés dans l’ébauche “bis” de révision de BCP 47.
- ISO 3166-1 (sur Wikipédia) pour les sous-labels de type région à deux lettres, déjà présents dans l'ancienne version (et maintenus dans la révision “bis” et la version actuelle) de BCP 47.
- Wiktionnaire:UN M.49 pour les sous-labels de type région à trois chiffres, pour les régions non représentées dans ISO 3166-1 mais ajoutées (depuis dans la révision “bis” et dans la version actuelle) de BCP 47.