Overleg:ISO 639
Onderwerp toevoegenMet dank aan Luc Ockers, die toestemming gaf voor het gebruik van de data van zijn website; Ockers.be. GerardM 24 jun 2004 23:11 (CEST)
Hoi Gerard, bij mijn weten wordt "Cambodjaans" Khmer genoemd, of is er ergens een officieel iets in het xxx boekje dat zegt dat het Cambodjaans is? Ik hoor altijd het woord Khmer gebruikt om aan die taal te referen zowel door NL'ers, Belgen, Engelsen, Fransen, Thai om aan de taal van Cambodja te refereren. Niemand heeft het over Cambodjaans ..... Waerth 26 jun 2004 18:25 (CEST)
- Ik heb mijn lijst van mijnheer Ockers, voor mij is het belangrijk dat het Nederlandse woorden zijn voor veel talen. Ik ben absoluut geen maatstaf in dit kader. Cambodjaans en Khmer kunnen heel goed synoniemen zijn. Die mijnheer Ockera vertaalt voor zijn vak.. GerardM 26 jun 2004 19:49 (CEST)
- Ok, ik weet het ook niet ..... Waerth 27 jun 2004 22:04 (CEST)
Marokkaans
[brontekst bewerken]ik vroeg me af waarom Marokkaans niet in deze lijst staat. Wordt het anders genoemd en kijk ik er over?
ISO 639-1 Codes
[brontekst bewerken]Gerard ik zag dat je de hele lijst 2-letter codes eruit gegooid had onder het mom van dit is zwaar verouderd.
- Zolang 639-3 nog niet definitief is geldt RFC 3066 zeker nog en die beveelt aan vooral de 2-letter codes te gebruiken
- Ook in 639-3 zullen 639-1 2-letter codes nog geldig zijn
- Wikipedia gebruikt de 2-letter codes voor taalselectie
Staan ze je echt heel erg in de weg ?? ;o) pudding 24 feb 2006 13:05 (CET)
- Ik loop in de praktijk erg vaak tegen de problemen van het gebruik van de ISO 639-1 codes aan. Ze zijn niet alleen niet compleet, ze zijn zelfs in vele gevallen onjuist. Het gebruik van deze codes impliceert dat ze bruikbaar zijn. Die vooronderstelling is alleen te handhaven als je uitsluitend met de meest dominante talen van doen hebt.
- Het 'onjuist' ligt denk ik in 99% van de gevallen dat mensen in onbenul een alpha-2 landcode gebruiken ipv de taalcode.
- Het gebruik van deze codes impliceert dat ze bruikbaar zijn. Helemaal mee eens - ze zijn dus idd kennelijk bruikbaar. Sterker nog: ze worden nog steeds aangeraden/gespecificeerd (RFC 3066).
- ...is alleen te handhaven als je uitsluitend met de meest dominante talen van doen hebt. Nee. Het is heel simpel. Als een ISO 639 alpha-2 code voor een taal bestaat gebruik je die. Bestaat die code niet dan neem je ISO 639-2/T of nu dus liever 639-3. Wat is het probleem??.
- Dat mensen zich niet aan deze simpele conventie houden en verkeerde codes gebruiken, betekent niet dat je boos moet worden op deze conventie, maar op de mensen die het fout doen. Ik ben bang dat jij je nog heel lang aan zulke fouten zult kunnen ergeren. Ook in een wereld waar alles ISO 639 alpha-3 is zullen er sukkels zijn die een ISO 3166 alpha-3 landcode gebruiken ipv een taalcode pudding
- Verder is het ISO 639-3 traject doorlopen en wordt er nu verder gewerkt aan nieuwe voorstellen die voortbouwen op de ISO 639-3. Verder gebruikt Wikipedia zowel de twee als de drieletterige codes. Kortom ja ze staan me in de weg. GerardM 24 feb 2006 16:28 (CET)
Probeer voor de grap deze (alpha-3) eens: | Of deze: | In plaats van deze (alpha-2) links: | Of deze: |
---|---|---|---|
http://afr.wikipedia.org/wiki/ISO_639 | w:afr:ISO 639 | http://af.wikipedia.org/wiki/ISO_639 | w:af:ISO 639 |
http://dan.wikipedia.org/wiki/ISO_639 | w:dan:ISO 639 | http://da.wikipedia.org/wiki/ISO_639 | w:da:ISO 639 |
http://deu.wikipedia.org/wiki/ISO_639 | w:deu:ISO 639 | http://de.wikipedia.org/wiki/ISO_639 | w:de:ISO 639 |
- En ga vervolgens klagen bij wikimedia dat ze hopeloos achter lopen, dat dit echt niet kan, dat je zo geen gebruik kunt maken van het systeem, dat het een schande is dat ze zich aan zo'n breed gedragen standaard houden (met die belachelijke 2-letter codes) en dat het je vies tegenvalt dat ze niet bereid zijn de wereld deze vernieuwende 3-letter codes door de strot te duwen. (SCNR) beetje flauw ;) pudding
- Overigens, als je ze zou aanbevelen om binnenkort deze (en dergelijke)
- te veranderen in
- dan doe ik wel mee hoor :)
- Maar begrijp je m'n punt? De 2-letter codes zijn gewoon goed en zullen nog lang blijven. Het misstaat Wikipedia IMHO niet de geïnteresseerde lezer een overzichtje te presenteren van de belangrijkste codes zodat deze zich een beeld kan vormen zonder direct een externe link te moeten volgen. Hoe lang die lijst moet zijn is weer een ander verhaal. Misschien moet die lijst beperkt worden tot wat leuke voorbeelden van 'missers' bij ISO 639-2/B en /T ofzo.
- Ik stel voor dat we het artikel gebruiken om lezers op te voeden in het correcte gebruik van de codes (mijn toevoegingen deden dat overigens al meer dan het origineel) ipv ze de codes helemaal te onthouden. Met vriendelijke groet pudding 24 feb 2006 18:17 (CET)
- Ik plak nu (uit luiheid) de hele lijst van af.wikipedia erin (met alpha-2 en alpha-3 codes. Later nog eens kijken of die korter moet/kan en of het leuk is voorbeelden als die zh-min-nan erin te verwerken.
- Update: Dat was een slecht plan - had het Afrikaans over het hoofd gezien ... Ik zal later een aanzetje maken voor een tabel met:
639-1 | 639-2 | RFC 3066 | 639-3 | Engelse naam | Nederlandse naam |
Standaards zijn goed, oude standaards zijn erger dan bruikbaar
[brontekst bewerken]Wanneer je wil weten waar ik vandaan kom, kijk dan naar meta:Wiki for standards. Standaards zijn goed, zonder standaards is het niet mogelijk om het over de zaken die een standaard regelt eens te zijn. Sommige standaards zoals de kilo is een "absolute" standaard. ISO-639 is dat in alle gevallen niet. Op elke tot dus ver uitgebrachte versie is het nodige af te dingen. Zo zijn diverse codes in 639-1 geen taal maar taalfamilies. Omdat de "standaard" stelt dat het een taal betreft zitten we nu met een ku en een nap en worden andere talen (nog) niet erkent.
- Dat ISO 639 verre van perfect is/was zal ik niet tegenspreken. Maar het ding is er en is IMHO toch echt wel (één van?) de belangrijkste en meest toegepaste standaard(en) voor het coderen van talen in informatieverwerkende systemen. Als zodanig denk ik dat het zeker binnen Wikipedia past informatie over deze standaard te verstrekken. Of de complete lijst die jij eruit geknikkerd hebt echt nodig is of fout was of 'beter kon', daar valt over te praten. Ik vond vooral de manier waarop je die lijst (waar anderen hun best op hebben gedaan) nogal plompverloren verwijderde ietwat lomp en de motivatie ervoor veel te kort door de bocht.
- Als jij kritiek hebt op de standaard, of op de manier waarop mensen ermee omgaan of op de samenstelling van de lijst (en het zit je zo diep) dan kun je denk ik beter tijd investeren en bijdragen door dit (als POV gekenmerkt?) in het artikel te verwerken of door de lijst te verbeteren. Dat schiet meer op dan zomaar werk van anderen weggooien omdat het niet in je straatje past.
- De ISO-639-1 is een verouderderde standaard. Het feit dat mensen deze nog steeds gebruiken doet daar niets aan af. Het is juist POV om deze lijst nog steeds als bruikbaar te afficheren.
- Ik afficheer niets - ik documenteer dat wat de basis is van current practice
- De ISO-639-1 is een verouderderde standaard. Het feit dat mensen deze nog steeds gebruiken doet daar niets aan af. Het is juist POV om deze lijst nog steeds als bruikbaar te afficheren.
Wanneer je stelt dat Wikipedia iets gebruikt, dan betekent dat uitsluitend dat dat de conventie binnen de Wikimedia Foundation is. Wanneer je stelt dat omdat iets nog steeds gebruikt wordt dat het daarom "goed" is. Dan vergis je je.
- Ik zeg niet dat de standaard (in alle opzichten) goed is. Ik zeg dat deze (en juist de alfa-2 codes) momenteel (nog) veel gebruikt wordt -o.a. door Wikipedia- en dat het dus zinnig is voor Wikipedia om de standaard goed te documenteren. Daar hoort dan m.i. ook een overzicht van alfa-2 codes bij - zeker voor zover die op Wikipedia van toepassing zijn. -- pudding
- Nogmaals Wikimedia Foundation gebruikt de standaard niet het is een mix met toevoegingen en daarmee is de lijst waar ik je naar verwees bruikbaarder dan de oudste en kortste lijst de lijst waar jij een lans voor breekt.
- Ik breek geen lans voor die lijst. Ik zeg dat je hem niet weg moet gooien als je niet bereid bent er moeite voor te doen om hem te verbeteren of te vervangen door wat beters. De lijst waar jij naar verwijst is een mogelijke kandidaat daarvoor, maar is misschien ook niet alles. Ik heb er nu geen tijd voor om het uit te zoeken of iets beters bij elkaar te scharrelen. Wat het ding op een woordenboek doet is mij overigens ook volledig duister, maar dat terzijde.
- Nogmaals Wikimedia Foundation gebruikt de standaard niet het is een mix met toevoegingen en daarmee is de lijst waar ik je naar verwees bruikbaarder dan de oudste en kortste lijst de lijst waar jij een lans voor breekt.
De enige waarde die ISO-639-1 codes hebben is om aan te geven wat de meer recente conventie is zodat mensen kunnen overstappen. Om deze codes voor iets nieuws te gebruiken is onverantwoord of je staat absoluut niet stil bij wat het is dat je gebruikt.
- Omdat het nog zoveel in gebruik is en 'oud spul' ook nog lang zal bestaan, gaat het niet aan de informatie zomaar te verwijderen. Als je mensen duidelijk wilt maken dat ze de codes voor nieuwe projecten niet moeten gebruiken kun je dat goed gemotiveerd in het artikel kwijt. Ik had daar overigens al een (voor verbetering vatbare) aanzet toe gegeven. Ook kun je het overzicht (nu op een aparte pagina) uitbreiden met de alfa-3 codes of andere codes die jij voor zinniger houdt. Waarschijnlijk is het overzicht op Wiktionary al een verbetering, maar ze zouden misschien eerst eens naast elkaar gelegd moeten worden
- Of de codes echt zo kwalijk zijn en wat dan wel een goede (beste) oplossing is valt overigens ook nog te bezien. Zie mijn opmerkingen over de 'macrotalen' in het artikel. Simpelweg nld nemen voor alles wat nu nl is klopt in elk geval ook niet. Als jij een standaard/voorstel weet te vinden die een veel betere oplossing voor alle problemen rond de classificatie/codering van talen biedt dan ISO 639-3 dan verdient die aandacht en een dikke doorverwijzing in het artikel!!
- De discussie over wat een taal en wat een dialect is een terugkerend thema op de mailinglijsten van de WMF. Er is een aanvraag voor een nieuw project mbt standaarden, in WiktionaryZ zal ook dat een terugkerend probleem zijn.
- En precies daarom zal er altijd kritiek zijn op welke standaard dan ook die probeert dit abstract weer tye geven. Waar je de grens legt, maakt principieel niet zoveel uit. Op een gegeven moment is het beter om dan maar dat te gebruiken wat er is dan helemaal niets.
- De discussie over wat een taal en wat een dialect is een terugkerend thema op de mailinglijsten van de WMF. Er is een aanvraag voor een nieuw project mbt standaarden, in WiktionaryZ zal ook dat een terugkerend probleem zijn.
- Waarschijnlijk bereik je er overigens meer mee om met grieven (en verbeteringsvoorstellen?!) naar SIL/ISO te gaan dan er hier over te praten. Ik heb je link naar het Wikistandaard gebeuren gevolgd en het initiatief verdient lof. Ik zal het wat gaan volgen en misschien tzt bijdragen. Maar zolang dit of andere initiatieven niet met een beter bruikbaar systeem op de proppen komt dan ISO 639-3 en RFC 3066 of diens opvolger blijf ik voorlopig nog even het huidige systeem gebruiken als je het niet erg vindt. Bedenk ook dat niet iedereen iets beter nodig heeft, als 639-1 voldoet voor wat ik doen moet is het dus voor mijn toepassing een goede oplossing en voegt alles wat 'beter' is wellicht alleen maar onnodige complexiteit toe. -- pudding
- Wanneer mensen ISO-639-1 gebruiken voor een nieuwe toepassing dan is dat een belediging aan andere talen en, een belediging aan de intelligentie van de gebruikers.
- Dan zijn mensen die bereid zijn om 639-3 of een ander imperfecte oplossing te gebruiken een belediging voor alle talenvarianten die daar nog niet inzitten - dat zal nooit ophouden. Als ik bijvoorbeeld voor een documentatieproject van tevoren wéét dat het zich zal beperken tot wat mainstream west-europese talen en geen onderscheid moet maken op al te gedetailleerd niveau, dan beledig ik juist Vlamingen door nld te gebruiken in plaats van nl (zolang er voor de taalgroep geen macrotaal gedefinieerd/geaccepteerd wordt).
- In mijn ogen beledig ik een Vlaming of Shuar-indiaan niet door voor mijn project een codering te kiezen waar zijn individuele taal niet in zou passen als er in het project van te voren goed in te schatten is dat zulke individuele taalvarianten een onwenselijke detaillering aanbrengen of voor het project nooit relevant zullen zijn. Ik vind het eerder beledigend om te vooronderstellen dat ik daarmee mensen zou beledigen ;-)
- Wanneer mensen ISO-639-1 gebruiken voor een nieuwe toepassing dan is dat een belediging aan andere talen en, een belediging aan de intelligentie van de gebruikers.
- Overigens is er voor zover ik weet nog helemaal geen nieuw algemeen aanvaard en breed gedragen systeem om met de discrepanties tussen ISO 639 alfa-2 en ISO/DIS 639-3 om te gaan en is daarmee in feite momenteel RFC-3066 nog van kracht. Als ik morgen een nieuw project begin wat rekening wil houden met veel talen, zal ik dus nog steeds uitgaan van RFC-3066 en daarmee ook van ISO 639 alfa-2. Het lijkt me dan ook voorbarig om nu al te zeggen dat het ontzettend fout (en dom?) en beledigend is om nog ISO 639 alfa-2 te gebruiken. Of kun jij nu al naar een beter functionerend en net zo breed gedragen voorstel verwijzen?
Zo wordt de "standaard" in een CAT-tool gebruikt; voor het gemak kozen de ontwikkelaars voor de taalcodes die JAVA bood. De consequentie is dat deze tool nu niet bruikbaar is voor meer dan 8000 talen.
- Dus hebben de makers van die CAT-tool verkeerde keuzes gemaakt en zal het ding wel niet overleven en zal er hopelijk een beter alternatief een (belangrijke) plaats in de markt krijgen. Ook de gebruikers die de tool hebben gekozen/gekocht valt wellicht een verkeerde keuze te verwijten. Maar wat draagt dit bij aan de discussie?? -- pudding
Overigens als je behoefte hebt aan meer ISO-639 info GerardM 25 feb 2006 14:13 (CET)
- Bedankt voor je info/links (!) Ik hoop dat ik duidelijk heb kunnen maken waarom ik het niet met het zondermeer verwijderen van de lijst eens was/ben. Wel wil ik best meedenken/doen over een goed alternatief. Ik betwijfel sterk het nut van het volledig dupliceren van de hele ISO 639-3 lijst op Wikipedia, al zijn er misschien argumenten voor te vinden. Als grootste voordeel zou ik dan zien dat we zo voor alle taalnamen ook de Nederlandse benaming kunnen documenteren en daarmee alvast een wikilink hebben om een artikel over de taal te beginnen. Maar dan hoort de lijst niet thuis onder ISO 639 maar onder Lijst_van_alle_talen_op_de_wereld of zoiets (wat ze bij de lijst met alle dialecten proberen te doen begrijp ik helemaal niets van, maar dat terzijde). Voor documentatie van ISO 639 op Wikipedia denk ik dat een volledige lijst van alle door Wikimedia gebruikte codes wellicht voldoende is. pudding
- Het enige wat je duidelijk maakt is dat je niet begrijpt hoe verdervelijk het gebruik van verkeerde standaards is. Nogmaals de Wikimedia Foundation conformeert zich niet aan de standaard. GerardM 26 feb 2006 09:24 (CET).
- ALs je RFC-3066 (en dus ISO 639 alfa-2) als verdervelijk wilt betitelen stel ik voor dat je eerst met een beter alternatief op de proppen komt. Maar dat is eigenlijk niet het punt.
- Wat ik vooral duidelijk probeer te maken is dat ik het niet nuttig vind documentatie over een oude standaard die veel gebruikt is zomaar plompverloren te verwijderen. Mensen zullen die standaard in bestaand materiaal nog jaren tegenkomen. En dat dan ongeacht of deze nou momenteel ook nog wel/niet de basis vormt voor wat er gangbaar is.
- Wikimedia mag zich dan (misschien?) niet volledig aan deze standaard conformeren - dat heb ik ook nooit gezegd - maar ze gebruikt de standaard wel degelijk en dan dus vooral ook de alfa-2 codes waar jij zo'n hekel aan hebt. Documenteren van die codes blijft dus zinnig (en niet alléén omdat Wikimedia ze toepast, maar vooral vanwege het grote (historisch)-belang wegens zeer verbreid gebruik.)
- Het enige wat je duidelijk maakt is dat je niet begrijpt hoe verdervelijk het gebruik van verkeerde standaards is. Nogmaals de Wikimedia Foundation conformeert zich niet aan de standaard. GerardM 26 feb 2006 09:24 (CET).
- Nogmaals: Je weet deze dingen kennelijk beter dan ik, dus als je het artikel wilt gebruiken om mensen op een neutrale manier te informeren over de nadelen en valkuilen bij het gebruik van ISO 639 codes zou ik je willen aanmoedigen de aanzet die ik daartoe heb gegeven op te pakken en te verbeteren. Ik zou het overigens wel waarderen als je dat dan doet door vooral betere alternatieven aan te dragen voor current practice en de documentatie over wat er gangbaar was/is wel overeind te laten. pudding
Vlaams is niet Belgisch Nederlands
[brontekst bewerken]In het artikel worden Vlaams (vls) en Belgisch Nederlands (nl-BE) op één hoop gegooid. Dit is onjuist.
Het Standaardnederlands kent drie of vier taalvarianten: Nederlands-Nederlands (nl-NL, ook Noord-Nederlands), Belgisch-Nederlands (nl-BE, ook Zuid-Nederlands), Surinaams-Nederlands (nl-SR, ook Suri-Nederlands) en Antilliaans Nederlands (zie Nederlandse Taalunie: Taaluniversum).
De officiële taal die in het gewest Vlaanderen gesproken wordt is niet het Vlaams, maar het Nederlands (Belgisch Nederlands).
Daarnaast worden er in de Franse Westhoek en provincie West-Vlaanderen verschillende dialecten gesproken, behorende tot de Vlaamse dialektgroep (vls), nauw verwant aan het Zeeuws (zie Streektaal.net en Ethnologue Language Map Belgium, Luxembourg and Netherlands). --Arne Bleijs 3 feb 2010 11:17 (CET)
- Hoi Arne, bedankt voor je commentaar. Kennelijk heb jij je beter in deze materie verdiept dan anderen, dus als je ongerijmdheden in het artikel tegenkomt ... voel je vrij en ga je gang :o) - Pudding 5 feb 2010 19:08 (CET)
Ik ben het met je eens; de pagina Vlaams niet; Ethnologue wel, denk ik.
Ethnologue : vls gooit ook Antwerps, Limburgs en Brabants erbij als extra dialecten van Vlaams.
Maar gelukkig verduidelijkt Ethnologue : nld de boel: "The variety of Dutch (not Vlaams [vls]) spoken in Belgium is only slightly different from the variety spoken in the Netherlands." en het geeft Oost-vlaams en Brabants(aan de kaart te zien incl. Antwerps) als Belgische dialecten.
Dus je hebt gelijk, pas het maar aan.
-- DasRakel 〒 26 feb 2010 02:30 (CET)