[Neobrahmigp] Tamil LGR Proposal and dependcies

Dr. Shanmugam Rajabadher shanfaace at gmail.com
Thu Aug 9 08:34:21 UTC 2018


Dear Dr.Sarmad,

I have reviewed the Tamil Document. Thanking Pitinan (XML updates) and
akshat for providing the inputs. This document has been updated with IP's
suggestions kindly share your view on the same so that we can proceed
further . PFAs

list of Attachments :

1. A proposal file (.docx)
2. Test labels file (.txt)
3. Updated XML file(.xml)
4. NBGP response to IP's Feedback (.docx)
5. A proposal file (.PDF)


Thanks and regards,
Dr.Shanmugam R.
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://mm.icann.org/pipermail/neobrahmigp/attachments/20180809/6127966d/attachment-0001.html>
-------------- next part --------------
#This document lays down the examples to test the Label Generation Rule Set for Tamil script.
#It provides a list of valid and invalid labels as per the WLE rules.
#The labels have been tagged as valid and invalid under specific rules. 
#However, the categorization of invalid labels under specific rules is given as per the general understanding of the LGR Tool by the NBGP. During testing with LGR tool whether it gets flagged under the same rule or the different one is totally dependent on the internal implementation of the LGR Tool. In case of discrepancy among the same, the fact that it is an invalid label should only be considered.

#Document Version : 2.2(LGR-Proposal_Tamil_20180802.docx)
#LGR Tamil Version : 3.0
#XML Name : Proposal-LGR-Taml-20180802.xml
#Valid - Case of "Vowels"
அ
ஆ
இ
ஈ
உ
ஊ
எ
ஏ
ஐ
ஒ
ஓ
ஔ
#Valid - Case of "CONSONANTS" and CONSONANT + MATRA combination
க
கா
கி
கீ
கு
கூ
கெ
கே
கை
கொ
கோ
கௌ
ங
ஙா
ஙி
ஙீ
ஙு
ஙூ
ஙெ
ஙே
ஙை
ஙொ
ஙோ
ஙௌ
ச
சா
சி
சீ
சு
சூ
செ
சே
சை
சொ
சோ
சௌ
ஜ
ஜா
ஜி
ஜீ
ஜு
ஜூ
ஜெ
ஜே
ஜை
ஜொ
ஜோ
ஜௌ
ஞ
ஞா
ஞி
ஞீ
ஞு
ஞூ
ஞெ
ஞே
ஞை
ஞொ
ஞோ
ஞௌ
ட
டா
டி
டீ
டு
டூ
டெ
டே
டை
டொ
டோ
டௌ
ண
ணா
ணி
ணீ
ணு
ணூ
ணெ
ணே
ணை
ணொ
ணோ
ணௌ
த
தா
தி
தீ
து
தூ
தெ
தே
தை
தொ
தோ
தௌ
ந
நா
நி
நீ
நு
நூ
நெ
நே
நை
நொ
நோ
நௌ
ன
னா
னி
னீ
னு
னூ
னெ
னே
னை
னொ
னோ
னௌ
ப
பா
பி
பீ
பு
பூ
பெ
பே
பை
பொ
போ
பௌ
ம
மா
மி
மீ
மு
மூ
மெ
மே
மை
மொ
மோ
மௌ
ய
யா
யி
யீ
யு
யூ
யெ
யே
யை
யொ
யோ
யௌ
ர
ரா
ரி
ரீ
ரு
ரூ
ரெ
ரே
ரை
ரொ
ரோ
ரௌ
ற
றா
றி
றீ
று
றூ
றெ
றே
றை
றொ
றோ
றௌ
ல
லா
லி
லீ
லு
லூ
லெ
லே
லை
லொ
லோ
லௌ
ள
ளா
ளி
ளீ
ளு
ளூ
ளெ
ளே
ளை
ளொ
ளோ
ளௌ
ழ
ழா
ழி
ழீ
ழு
ழூ
ழெ
ழே
ழை
ழொ
ழோ
ழௌ
வ
வா
வி
வீ
வு
வூ
வெ
வே
வை
வொ
வோ
வௌ
ஶ
ஶா
ஶி
ஶீ
ஶு
ஶூ
ஶெ
ஶே
ஶை
ஶொ
ஶோ
ஶௌ
ஷ
ஷா
ஷி
ஷீ
ஷு
ஷூ
ஷெ
ஷே
ஷை
ஷொ
ஷோ
ஷௌ
ஸ
ஸா
ஸி
ஸீ
ஸு
ஸூ
ஸெ
ஸே
ஸை
ஸொ
ஸோ
ஸௌ
ஹ
ஹா
ஹி
ஹீ
ஹு
ஹூ
ஹெ
ஹே
ஹை
ஹொ
ஹோ
ஹௌ


#Valid - Case of "A vowel'
அக்கம்
ஆற்றல்
இல்லம்
ஈகை
உலகம்
ஊர்
எண்ணம்
ஏர்
ஐராவதம்
ஒப்பம்
ஓடம்
ஔவையார்
எஸ்ஐ
#Valid - Case of "H: must be preceded by C"
கப்பல்
காவல்
கிடப்பு
குடம்
சல்லடை
சாப்பாடு
ஞாலம்
தவம்
பணம்
பங்கம்
மண்டபம்
தூவல்
புடைப்பு
யுவன்
ரீங்காரம்
ரூபாய்
லட்டு
வெள்ளம்
கற்பனை
கறிவேப்பிலை
கன்னம்
காட்சிகளில்
கூழ்
கொலம்பியா
தொடராது
நுனியில்
நுனிப்பகுதி
நிலத்துக்கு
தந்தனர்
துதித்து
துத்தநாக
நடித்திருந்தன
படிப்பகம்
மனம்
மீசை
மையல்
மோதிரம்
நேராக
நொய்யல்
நோய்
மௌரியர்
நைஜீரியா
ஞாயிறு
நொதித்தலின்
டம்ளர்
பிரித்தல்
பை
பவளம்
நொதித்தல்
நொதித்து
பட்டம்
பணம்
ஊதல்
கவனம்
சகலகலாவல்லவன்
சரித்திரம்
சாதனை
சல்லடை
சாக்குபோக்கு
உறக்கம்
உவமை
உள்ளம்
ஊர்வலம்
பட்டயம்
இவ்விதம்
இவ்வாறு
இங்ஙனம்
கௌரி
சௌந்தர்யா
பௌதீகம்
ஜனனம்
ஸரிகா
ஷாகிப்
ஸ்ரீலஷ்மி
காமாக்ஷி
கிடைக்கிற
கொண்டதும்
கொண்டனர்
கொத்துவகை
எங்ஙனம்
#Valid - Case of "M: must be preceded by C"
சுக்கு
சுக்ரவார
சுண்ணாம்பு
சுந்தர்
சொத்து
சொன்னது
சௌக்கியம்
சௌந்தர்யா
ஜாக்ஸன்
ஜீனியர்
ஜீன்ஸ்
ஜூன்
ஜோதிடம்
ஞாநியின்
ஞாநியும்
ஞானாதீஸ்வரர்
ஞானி
டாக்டர்கள்
டெக்னாலஜி
டெக்னிக்கல்
தாங்கவும்
தாங்கவே
தாங்காத
தாங்காது
தாங்காமல்
தாண்டும்
நாகேஷின்
நாடுகளின்
நிசாந்த்
நிசான்
நிதியத்திடம்
நீண்டது
நீதிக்காக
நீந்தும்
நுட்பங்களை
நுண்ணுயிர்
நெகிழ்வுடைய
பள்ளி
பட்டிதொட்டி
பண்ணையம்
பருத்தி
விட்டில்பூச்சி
பேச்சு
மத்தளம்
மாங்கல்யம்
மருத்தவர்
நன்னயம்
வாழ்க்கை
வார்த்தை
வாய்ப்பு
வீழ்ச்சி
பார்ப்பான்
காய்ச்சு
காய்த்தல்
கவிழ்ப்பு
கேட்ச்
இங்க்
பேங்க்
சென்ட்
தேங்க்ஸ்

#Valid - Case of "X can not be preceded by X" and "X: must only be followed by C1
அஃறிணை
அஃது
இஃது
கஃடீது
முஃடீது
ஃபாரின்

#Invalid - Case of  "H must be preceded by C" 
அ்ன்பு
இ்ல்லம்
ஆ்ற்றல்
எ்ட்டு
உ்ள்ளம்
ஊ்்ற்று
#Invalid - Case of  "M must be preceded by C"
கஆாற்று
பக்ுகவம்
பற்றுு
#Invalid Case of "X: Can not be preceded by X
கல்ஃஃமனம்
பணஃஃவயல்
தொல்லிஃஃயல்
#Invalid Case of X: must only be succeeded by any of the following consonants
தொல்லிஃ
கல்ஃந

#Invalid - Case of "Words containing characters outside the repertoire"
௧டல்
உ௫வம்
ச௩கம்
கௗம்
௨ரல்
௶னூல்
௷ர்
௹பாய்
௺ங்கள்
10
க௱ம்
௭ல்லோரும்
௴ண்டு


#Following labels produce within-script variants
கௌசல்யாதேவி
#generates the following blocked variant
கெளசல்யாதேவி

கௌடில்யரின்
#generates the following blocked variant
கெளடில்யரின்

கௌணஸ்நானம்
#generates the following blocked variant
கெளணஸ்நானம்


கௌண்டின்ய
#generates the following blocked variant
கெளண்டின்ய


கௌதமன்
#generates the following blocked variant
கெளதமன்


கௌதமாலாவிலிருந்து
#generates the following blocked variant
கெளதமாலாவிலிருந்து


கௌதம்
#generates the following blocked variant
கெளதம்


கௌபாய்
#generates the following blocked variant
கெளபாய்

கௌமாரம்
#generates the following blocked variant
கெளமாரம்


கௌமாரி
#generates the following blocked variant
கெளமாரி


கௌரபிட்டா
#generates the following blocked variant
கெளரபிட்டா


கௌரவத்தை
#generates the following blocked variant
கெளரவத்தை


கௌரி
#generates the following blocked variant
கெளரி


கௌஸ்துபமணி
#generates the following blocked variant
கெளஸ்துபமணி


கௌஹாத்திக்கு
#generates the following blocked variant
கெளஹாத்திக்கு


சௌகரியத்திற்காக
#generates the following blocked variant
செளகரியத்திற்காக


சௌகரியத்துக்கு
#generates the following blocked variant
செளகரியத்துக்கு


சௌகரியமானதாகவும்
#generates the following blocked variant
செளகரியமானதாகவும்


சௌக்கிய
#generates the following blocked variant
செளக்கிய


சௌக்கியம்
#generates the following blocked variant
செளக்கியம்


சௌத்ரி
#generates the following blocked variant
செளத்ரி


சௌந்தர்யா
#generates the following blocked variant
செளந்தர்யா


சௌசௌ
#generates the following blocked variant
செளசௌ
செளசெள
சௌசெள

சௌபாக்கியங்களும்
#generates the following blocked variant
செளபாக்கியங்களும்


சௌபாக்யத்தைத்
#generates the following blocked variant
செளபாக்யத்தைத்


சௌம்யா
#generates the following blocked variant
செளம்யா


சௌர
#generates the following blocked variant
செளர


சௌரப்
#generates the following blocked variant
செளரப்


சௌரமதம்
#generates the following blocked variant
செளரமதம்


சௌரம்
#generates the following blocked variant
செளரம்


சௌரம்சூரிய
#generates the following blocked variant
செளரம்சூரிய


சௌரவ்
#generates the following blocked variant
செளரவ்


சௌராஷ்டரம்
#generates the following blocked variant
செளராஷ்டரம்


சௌஸா
#generates the following blocked variant
செளஸா


பௌத்திரன்
#generates the following blocked variant
பெளத்திரன்


பௌத்திரி
#generates the following blocked variant
பெளத்திரி


பௌதீக
#generates the following blocked variant
பெளதீக


மௌனம்
#generates the following blocked variant
பெளனம்


மௌனி
#generates the following blocked variant
மெளனி


மௌனப்படம்
#generates the following blocked variant
மெளனப்படம்


மௌசு
#generates the following blocked variants
மெளசு


மௌடீகம்
#generates the following blocked variant
மெளடீகம்


ஔரங்காபாத்திலும்
#generates the following blocked variant
ஒளரங்காபாத்திலும்


ஔவை
#generates the following blocked variant
ஒளவை


ஔஷதம்
#generates the following blocked variant
ஒளஷதம்

#Following labels produce variants allocatable
ஸ்ரீதர்
#generates the following variants allocatable
ஶ்ரீதர்

ஹரினிஸ்ரீ
#generates the following variants allocatable
ஹரினிஶ்ரீ

ஸ்ரீ
#generates the following variants allocatable
ஶ்ரீ
#Following labels produce cross-script variants with Malayalam
ஜவமி
ஜஜ
ஜவ
ஜம
ஜவி
ஜிஜி
ஜிஜே
ஜிவி
ஜிமி
ஜெஜி
ஜெமி
ஜெவி
ஜேஜி
ஜேமி
ஜேவி
மம
மவ
மஜ
மிமி
மிவி
மஜி
மிஜி
மெவி
மேஜி
மேவி
வஜ
வம
வமி
விஜி
விமி
விவி
விவ
விஜ
விம
விவமி
வெமி
வேமி








-------------- next part --------------
A non-text attachment was scrubbed...
Name: LGR-Proposal_Tamil_20180809.docx
Type: application/vnd.openxmlformats-officedocument.wordprocessingml.document
Size: 358257 bytes
Desc: not available
URL: <http://mm.icann.org/pipermail/neobrahmigp/attachments/20180809/6127966d/LGR-Proposal_Tamil_20180809-0001.docx>
-------------- next part --------------
A non-text attachment was scrubbed...
Name: LGR-Proposal_Tamil_20180809.pdf
Type: application/pdf
Size: 2107180 bytes
Desc: not available
URL: <http://mm.icann.org/pipermail/neobrahmigp/attachments/20180809/6127966d/LGR-Proposal_Tamil_20180809-0001.pdf>
-------------- next part --------------
A non-text attachment was scrubbed...
Name: Proposal-LGR-Taml-20180809.xml
Type: text/xml
Size: 14338 bytes
Desc: not available
URL: <http://mm.icann.org/pipermail/neobrahmigp/attachments/20180809/6127966d/Proposal-LGR-Taml-20180809-0001.xml>
-------------- next part --------------
A non-text attachment was scrubbed...
Name: NBGP_Response_to_IP on Tamil 2nd version 2018-06-07-IP.docx
Type: application/vnd.openxmlformats-officedocument.wordprocessingml.document
Size: 36151 bytes
Desc: not available
URL: <http://mm.icann.org/pipermail/neobrahmigp/attachments/20180809/6127966d/NBGP_Response_to_IPonTamil2ndversion2018-06-07-IP-0001.docx>


More information about the Neobrahmigp mailing list