Skip to content

Commit 96b8c95

Browse files
bilashsaharonaldtse
authored andcommitted
Implemented un-mal-Mlym-Latn-1972
1 parent 8c72e4a commit 96b8c95

File tree

1 file changed

+251
-0
lines changed

1 file changed

+251
-0
lines changed

maps/un-mal-Mlym-Latn-1972.yaml

Lines changed: 251 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,251 @@
1+
---
2+
authority_id: un
3+
id: 1972
4+
language: iso-639-2:mal
5+
source_script: Mlym
6+
destination_script: Latn
7+
name: REPORT ON THE CURRENT STATUS OF UNITED NATIONS ROMANIZATION SYSTEMS FOR GEOGRAPHICAL NAMES --Malayalam Romanization Version 4.0
8+
url: https://www.eki.ee/wgrs/rom1_ml.htm
9+
creation_date: 1972
10+
confirmation_date: 2016
11+
description: |
12+
The United Nations recommended system was approved in 1972 (II/11) and amended in 1977 (III/12),
13+
based on a report prepared by D. N. Sharma. The tables and their corrections were published in
14+
volume II of the conference reports.
15+
16+
There is no evidence of the use of the system either in India or in international cartographic products.
17+
18+
Malayalam (Malayāḷam) uses an alphasyllabic script whereby each character represents a syllable rather
19+
than one sound. Vowels and diphthongs are marked in two ways: as independent characters (used syllable-initially)
20+
and in an abbreviated form, to denote vowels after consonants. The romanization table is unambiguous but now
21+
outdated because since the 1970's a new orthography has been introduced and the use of many character
22+
combinations and ligatures has been simplified. Nevertheless the user of the romanization table would have to
23+
recognize many ligatures not given in the original table. The system is mostly reversible but there exist some
24+
ambiguities in the romanization of vowels (independent vs. abbreviated characters) and
25+
consonants (ligatures vs. character sequences), particularly in the case of older orthography.
26+
27+
28+
notes:
29+
- |
30+
ടു For traditional script forms ഖു khu, മു mu, etc., exceptionally കു ku (ക്കു kku, ങ്കു ṅku), ഗു gu, ഛു chhu, ജു ju, ണു ṇu, തു tu, നു nu (ന്നു nnu), ഭു bhu, രു ru, ശു shu, ഹു hu
31+
- |
32+
ടൂ For traditional script forms ഖൂ khū, മൂ mū, etc., exceptionally കൂ kū, ഗൂ gū, ഛൂ chhū, ജൂ jū, ണൂ ṇū, തൂ tū, നൂ nū, ഭൂ bhū, രൂ rū, ശൂ shū, ഹൂ hū
33+
- |
34+
ടൃ Traditionally written in conjunction with the consonant character: കൃ kṛ .
35+
- |
36+
ടൗ In the older spelling: ൌ.
37+
- |
38+
ട്‌ Indicates absence of the inherent short [a] vowel, e.g. ക്‌ k , സ്‌ s. Special, co-called chillu-forms of consonants with that symbol: ണ്‍ ṇ, ന്‍ n, ര്‍ r, ല്‍ l, ള്‍ ḷ.
39+
- |
40+
റ Special ligature: റ്റ ṭ̈.
41+
42+
tests:
43+
- source: "ചൈനയ്ക്കെതിരെ ലഡാക്കിൽ സദാസജ്ജം; യുഎസിൽനിന്ന് ൭൨,൫൦൦ സിഗ്–൧൬ റൈഫിൾ"
44+
expected: "chainaykkĕtirĕ laḍākkil sadāsajjaṃ; yuĕsilninn 72,500 sig–16 ṟaiphiḷ"
45+
- source: "സർഗഭൂമിക’യ്ക്കില്ല; ലളിതച്ചേച്ചി അങ്ങനെ പറഞ്ഞിട്ടുണ്ടാവില്ല: ആർഎൽവി രാമകൃഷ്ണൻ"
46+
expected: "sargabhūmika’ykkilla; laḷitachchechchi aṅṅanĕ paṟaññiṭṭuṇṭāvilla: ārĕlvi rāmakṛṣhṇan"
47+
- source: "സ്വർണക്കടത്ത്‌: ഫൈസൽ ഫരീദും റബിന്‍സും ദുബായിൽ അറസ്റ്റിലായെന്ന്‌ എന്‍ഐഎ"
48+
expected: "svarṇakkaṭatt: phaisal pharīduṃ ṟabinsuṃ dubāyil aṟasṟṟilāyĕnn ĕnaiĕ"
49+
- source: "വരുമോ ചൈനയുടെ വാക്സീൻ?; ആഗോള ഉപയോഗത്തിന് ഡബ്ല്യുഎച്ച്ഒയുമായി ചർച്ച"
50+
expected: "varumo chainayuṭĕ vāksīn?; āgoḷa upayogattin ḍablyuĕchchŏyumāyi charchcha"
51+
- source: "കുട്ടികളുടെ മാനസിക പിരിമുറുക്കം മാറ്റാൻ പരിശീലനം; ക്ലാസുമായി പോക്സോ പ്രതി"
52+
expected: "kuṭṭikaḷuṭĕ mānasika pirimuṟukkaṃ māṟṟān parishīlanaṃ; klāsumāyi pokso prati"
53+
- source: "ആദ്യം അമിത് ഷാ, ഇപ്പോൾ മോദി; ബിജെപിയെ പുണരാൻ ജഗൻ; ആന്ധ്രയിലെ കരുനീക്കങ്ങൾ"
54+
expected: "ādyaṃ amit ṣhā, ippoḷ modi; bijĕpiyĕ puṇarān jagan; āndhrayilĕ karunīkkaṅṅaḷ"
55+
- source: "ലഹരിമരുന്ന് കേസ്: ബിനീഷ് കോടിയേരിയെ ഇഡി 6 മണിക്കൂർ ചോദ്യം ചെയ്തു"
56+
expected: "laharimarunn kes: binīṣh koṭiyeriyĕ iḍi 6 maṇikkūr chodyaṃ chĕytu"
57+
- source: "ഈന്തപ്പഴം വിതരണം ചെയ്തത് ശിവശങ്കര്‍ പറഞ്ഞതു പ്രകാരം: ടി.വി അനുപമയുടെ മൊഴി"
58+
expected: "īntappaḻaṃ vitaraṇaṃ chĕytat shivashaṅkar paṟaññatu prakāraṃ: ṭi.vi anupamayuṭĕ mŏḻi"
59+
- source: "൫൦൦൦ മണിക്കൂർ കാത്തിരിക്കാൻ തയാറെന്ന് രാഹുൽ: ഒടുവിൽ വഴങ്ങി ഹരിയാന"
60+
expected: "5000 maṇikkūr kāttirikkān tayāṟĕnn rāhul: ŏṭuvil vaḻaṅṅi hariyāna"
61+
- source: "കാരണം ഷോര്‍ട്ട്‌സര്‍ക്യൂട്ടല്ല; കത്തിയത് ഫയല്‍ മാത്രം, സാനിറ്റൈസര്‍ ഉള്‍പ്പെടെ കത്തിയില്ല"
62+
expected: "kāraṇaṃ ṣhorṭṭsarkyūṭṭalla; kattiyat phayal mātraṃ, sāniṟṟaisar uḷppĕṭĕ kattiyilla"
63+
- source: "വിമൺ സയൻറിസ്റ്റ്സ് സ്കീം"
64+
expected: "vimaṇ sayanṟisṟṟs skīṃ"
65+
66+
map:
67+
68+
rules:
69+
- pattern: ([ക]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
70+
result: 'k'
71+
- pattern: ([ഖ]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
72+
result: 'kh'
73+
- pattern: ([ഗ]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
74+
result: 'g'
75+
- pattern: ([ഘ]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
76+
result: 'gh'
77+
- pattern: ([ങ]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
78+
result: ''
79+
- pattern: ([ച]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
80+
result: 'ch'
81+
- pattern: ([ഛ]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
82+
result: 'chh'
83+
- pattern: ([ജ]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
84+
result: 'j'
85+
- pattern: ([ഝ]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
86+
result: 'jh'
87+
- pattern: ([ഞ]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
88+
result: ''
89+
- pattern: ([ട]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
90+
result: ''
91+
- pattern: ([ഠ]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
92+
result: 'ṭh'
93+
- pattern: ([ഡ]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
94+
result: ''
95+
- pattern: ([ഢ]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
96+
result: 'ḍh'
97+
- pattern: ([ണ]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
98+
result: ''
99+
- pattern: ([ത]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
100+
result: 't'
101+
- pattern: ([ഥ]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
102+
result: 'th'
103+
- pattern: ([ദ]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
104+
result: 'd'
105+
- pattern: ([ധ]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
106+
result: 'dh'
107+
- pattern: ([ന]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
108+
result: 'n'
109+
- pattern: ([പ]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
110+
result: 'p'
111+
- pattern: ([ഫ]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
112+
result: 'ph'
113+
- pattern: ([ബ]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
114+
result: 'b'
115+
- pattern: ([ഭ]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
116+
result: 'bh'
117+
- pattern: ([മ]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
118+
result: 'm'
119+
- pattern: ([യ]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
120+
result: 'y'
121+
- pattern: ([ര]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
122+
result: 'r'
123+
- pattern: ([ല]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
124+
result: 'l'
125+
- pattern: ([വ]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
126+
result: 'v'
127+
- pattern: ([ശ]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
128+
result: 'sh'
129+
- pattern: ([ഷ]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
130+
result: 'ṣh'
131+
- pattern: ([സ]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
132+
result: 's'
133+
- pattern: ([ഹ]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
134+
result: 'h'
135+
- pattern: ([ള]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
136+
result: ''
137+
- pattern: ([ഴ]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
138+
result: ''
139+
- pattern: ([റ]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
140+
result: ''
141+
- pattern: ([ക്ഷ]=?)(?=[\u0d3e\u0d3f\u0d40\u0d41\u0d42\u0d43\u0d46\u0d47\u0d48\u0d4a\u0d4b\u0d4c\u0d4d])
142+
result: 'kṣh'
143+
144+
characters:
145+
# I. Independent vowel characters
146+
'': 'a'
147+
'': 'ā'
148+
'': 'i'
149+
'': 'ī'
150+
'': 'u'
151+
'': 'ū'
152+
'': ""
153+
'': 'ĕ'
154+
'': 'e'
155+
'': 'ai'
156+
'': 'ŏ'
157+
'': 'o'
158+
'': 'au'
159+
160+
# II. Abbreviated vowel characters
161+
'': 'ā'
162+
'ി': 'i'
163+
'': 'ī'
164+
'': 'u'
165+
'': 'ū'
166+
'': ""
167+
'': "ĕ"
168+
'': "e"
169+
'': "ai"
170+
'': 'ŏ'
171+
'': 'o'
172+
'': 'au'
173+
174+
#III. Other symbols
175+
'': ''
176+
'': ''
177+
'': ''
178+
179+
#IV. Consonant characters
180+
'': 'ka'
181+
'': 'kha'
182+
'': 'ga'
183+
'': 'gha'
184+
'': 'ṅa'
185+
'': 'cha'
186+
'': 'chha'
187+
'': 'ja'
188+
'': 'jha'
189+
'': 'ña'
190+
'': 'ṭa'
191+
'': 'ṭha'
192+
'': 'ḍa'
193+
'': 'ḍha'
194+
'': 'ṇa'
195+
'': 'ta'
196+
'': 'tha'
197+
'': 'da'
198+
'': 'dha'
199+
'': 'na'
200+
'': 'pa'
201+
'': 'pha'
202+
'': 'ba'
203+
'': 'bha'
204+
'': 'ma'
205+
'': 'ya'
206+
'': 'ra'
207+
'': 'la'
208+
'': 'va'
209+
'': 'sha'
210+
'': 'ṣha'
211+
'': 'sa'
212+
'': 'ha'
213+
'ക്ഷ': 'kṣha'
214+
'': 'ḷa'
215+
'': 'ḻa'
216+
'': 'ṟa'
217+
'റ്റ': 'ṭ̈'
218+
219+
220+
'': ''
221+
'': ''
222+
'': ''
223+
"": '' # no need for zero with joiner
224+
"": '' # no need for zero with non joiner
225+
226+
227+
# numbers
228+
'': '0'
229+
'': '1'
230+
'': '2'
231+
'': '3'
232+
'': '4'
233+
'': '5'
234+
'': '6'
235+
'': '7'
236+
'': '8'
237+
'': '9'
238+
'': '10'
239+
'': '100'
240+
'': '1000'
241+
242+
243+
# chillu-forms of consonants note 5
244+
'ൿ': 'k'
245+
'': ''
246+
'': 'n'
247+
'': 'l'
248+
'': ''
249+
'': 'r'
250+
'സ്': 's'
251+

0 commit comments

Comments
 (0)