[Neobrahmigp] Tamil LGR Proposal

Dr. Shanmugam R. shanmugamr at cdac.in
Wed May 30 12:25:16 UTC 2018


Dear NBGP,
I have completed the Tamil Document. Thanking Pitinan and akshat for providing
the inputs and review.

list of Attachments :

1. A proposal file (.docx)
2. Test labels file (.txt)
3. Updated XML file(.xml)
4. NBGP response to IP's Feedback (.docx)
5. A proposal file (.PDF)


Thanks and regards,
Dr.Shanmugam R.

-------------------------------------------------------------------------------------------------------------------------------
[ C-DAC is on Social-Media too. Kindly follow us at:
Facebook: https://www.facebook.com/CDACINDIA & Twitter: @cdacindia ]

This e-mail is for the sole use of the intended recipient(s) and may
contain confidential and privileged information. If you are not the
intended recipient, please contact the sender by reply e-mail and destroy
all copies and the original message. Any unauthorized review, use,
disclosure, dissemination, forwarding, printing or copying of this email
is strictly prohibited and appropriate legal action will be taken.
-------------------------------------------------------------------------------------------------------------------------------

-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://mm.icann.org/pipermail/neobrahmigp/attachments/20180530/eaf9ae60/attachment-0001.html>
-------------- next part --------------
A non-text attachment was scrubbed...
Name: LGR-Proposal_Tamil_20180530.pdf
Type: application/pdf
Size: 2403859 bytes
Desc: not available
URL: <http://mm.icann.org/pipermail/neobrahmigp/attachments/20180530/eaf9ae60/LGR-Proposal_Tamil_20180530-0001.pdf>
-------------- next part --------------
A non-text attachment was scrubbed...
Name: LGR-Proposal_Tamil_20180530.docx
Type: application/vnd.openxmlformats-officedocument.wordprocessingml.document
Size: 298188 bytes
Desc: not available
URL: <http://mm.icann.org/pipermail/neobrahmigp/attachments/20180530/eaf9ae60/LGR-Proposal_Tamil_20180530-0001.docx>
-------------- next part --------------
A non-text attachment was scrubbed...
Name: Proposed-LGR-Taml-20180530.xml
Type: text/xml
Size: 14556 bytes
Desc: not available
URL: <http://mm.icann.org/pipermail/neobrahmigp/attachments/20180530/eaf9ae60/Proposed-LGR-Taml-20180530-0001.xml>
-------------- next part --------------
A non-text attachment was scrubbed...
Name: Response of NBGP_on-Tamil-20180302-v1_IP.docx
Type: application/vnd.openxmlformats-officedocument.wordprocessingml.document
Size: 43780 bytes
Desc: not available
URL: <http://mm.icann.org/pipermail/neobrahmigp/attachments/20180530/eaf9ae60/ResponseofNBGP_on-Tamil-20180302-v1_IP-0001.docx>
-------------- next part --------------
#This document lays down the examples to test the Label Generation Rule Set for Tamil script.
#It provides a list of valid and invalid labels as per the WLE rules.
#The labels have been tagged as valid and invalid under specific rules. 
#However, the categorization of invalid labels under specific rules is given as per the general understanding of the LGR Tool by the NBGP. During testing with LGR tool whether it gets flagged under the same rule or the different one is totally dependent on the internal implementation of the LGR Tool. In case of discrepancy among the same, the fact that it is an invalid label should only be considered.

#Document Version : 1.8
#LGR Tamil Version : 3.0 (LGR-Proposal_Tamil_20180412.docx)
#XML Name : Proposed-LGR-Tam-20180412..xml
#Valid - Case of "Vowels"
அ
ஆ
இ
ஈ
உ
ஊ
எ
ஏ
ஐ
ஒ
ஓ
ஔ
#Valid - Case of "CONSONANTS" and CONSONANT + MATRA combination
க
கா
கி
கீ
கு
கூ
கெ
கே
கை
கொ
கோ
கௌ
ங
ஙா
ஙி
ஙீ
ஙு
ஙூ
ஙெ
ஙே
ஙை
ஙொ
ஙோ
ஙௌ
ச
சா
சி
சீ
சு
சூ
செ
சே
சை
சொ
சோ
சௌ
ஜ
ஜா
ஜி
ஜீ
ஜு
ஜூ
ஜெ
ஜே
ஜை
ஜொ
ஜோ
ஜௌ
ஞ
ஞா
ஞி
ஞீ
ஞு
ஞூ
ஞெ
ஞே
ஞை
ஞொ
ஞோ
ஞௌ
ட
டா
டி
டீ
டு
டூ
டெ
டே
டை
டொ
டோ
டௌ
ண
ணா
ணி
ணீ
ணு
ணூ
ணெ
ணே
ணை
ணொ
ணோ
ணௌ
த
தா
தி
தீ
து
தூ
தெ
தே
தை
தொ
தோ
தௌ
ந
நா
நி
நீ
நு
நூ
நெ
நே
நை
நொ
நோ
நௌ
ன
னா
னி
னீ
னு
னூ
னெ
னே
னை
னொ
னோ
னௌ
ப
பா
பி
பீ
பு
பூ
பெ
பே
பை
பொ
போ
பௌ
ம
மா
மி
மீ
மு
மூ
மெ
மே
மை
மொ
மோ
மௌ
ய
யா
யி
யீ
யு
யூ
யெ
யே
யை
யொ
யோ
யௌ
ர
ரா
ரி
ரீ
ரு
ரூ
ரெ
ரே
ரை
ரொ
ரோ
ரௌ
ற
றா
றி
றீ
று
றூ
றெ
றே
றை
றொ
றோ
றௌ
ல
லா
லி
லீ
லு
லூ
லெ
லே
லை
லொ
லோ
லௌ
ள
ளா
ளி
ளீ
ளு
ளூ
ளெ
ளே
ளை
ளொ
ளோ
ளௌ
ழ
ழா
ழி
ழீ
ழு
ழூ
ழெ
ழே
ழை
ழொ
ழோ
ழௌ
வ
வா
வி
வீ
வு
வூ
வெ
வே
வை
வொ
வோ
வௌ
ஶ
ஶா
ஶி
ஶீ
ஶு
ஶூ
ஶெ
ஶே
ஶை
ஶொ
ஶோ
ஶௌ
ஷ
ஷா
ஷி
ஷீ
ஷு
ஷூ
ஷெ
ஷே
ஷை
ஷொ
ஷோ
ஷௌ
ஸ
ஸா
ஸி
ஸீ
ஸு
ஸூ
ஸெ
ஸே
ஸை
ஸொ
ஸோ
ஸௌ
ஹ
ஹா
ஹி
ஹீ
ஹு
ஹூ
ஹெ
ஹே
ஹை
ஹொ
ஹோ
ஹௌ
#Valid - Case of "X can not be preceded by X" and "X: must only be succeeded by any of the following consonants
அஃறிணை
அஃது
இஃது
கஃடீது
முஃடீது
ஃபாரின்

#Valid - Case of "A vowel'
அக்கம்
ஆற்றல்
இல்லம்
ஈகை
உலகம்
ஊர்
எண்ணம்
ஏர்
ஐராவதம்
ஒப்பம்
ஓடம்
ஔவையார்
எஸ்ஐ
#Valid - Case of "H: must be preceded by C"
கப்பல்
காவல்
கிடப்பு
குடம்
சல்லடை
சாப்பாடு
ஞாலம்
தவம்
பணம்
பங்கம்
மண்டபம்
தூவல்
புடைப்பு
யுவன்
ரீங்காரம்
ரூபாய்
லட்டு
வெள்ளம்
கற்பனை
கறிவேப்பிலை
கன்னம்
காட்சிகளில்
கூழ்
கொலம்பியா
தொடராது
நுனியில்
நுனிப்பகுதி
நிலத்துக்கு
தந்தனர்
துதித்து
துத்தநாக
நடித்திருந்தன
படிப்பகம்
மனம்
மீசை
மையல்
மோதிரம்
நேராக
நொய்யல்
நோய்
மௌரியர்
நைஜீரியா
ஞாயிறு
நொதித்தலின்
டம்ளர்
பிரித்தல்
பை
பவளம்
நொதித்தல்
நொதித்து
பட்டம்
பணம்
ஊதல்
கவனம்
சகலகலாவல்லவன்
சரித்திரம்
சாதனை
சல்லடை
சாக்குபோக்கு
உறக்கம்
உவமை
உள்ளம்
ஊர்வலம்
பட்டயம்
இவ்விதம்
இவ்வாறு
இங்ஙனம்
கௌரி
சௌந்தர்யா
பௌதீகம்
ஜனனம்
ஸரிகா
ஷாகிப்
ஸ்ரீலஷ்மி
காமாக்ஷி
கிடைக்கிற
கொண்டதும்
கொண்டனர்
கொத்துவகை
எங்ஙனம்
#Valid - Case of "M: must be preceded by C"
சுக்கு
சுக்ரவார
சுண்ணாம்பு
சுந்தர்
சொத்து
சொன்னது
சௌக்கியம்
சௌந்தர்யா
ஜாக்ஸன்
ஜீனியர்
ஜீன்ஸ்
ஜூன்
ஜோதிடம்
ஞாநியின்
ஞாநியும்
ஞானாதீஸ்வரர்
ஞானி
டாக்டர்கள்
டெக்னாலஜி
டெக்னிக்கல்
தாங்கவும்
தாங்கவே
தாங்காத
தாங்காது
தாங்காமல்
தாண்டும்
நாகேஷின்
நாடுகளின்
நிசாந்த்
நிசான்
நிதியத்திடம்
நீண்டது
நீதிக்காக
நீந்தும்
நுட்பங்களை
நுண்ணுயிர்
நெகிழ்வுடைய
பள்ளி
பட்டிதொட்டி
பண்ணையம்
பருத்தி
விட்டில்பூச்சி
பேச்சு
மத்தளம்
மாங்கல்யம்
மருத்தவர்
நன்னயம்
வாழ்க்கை
வார்த்தை
வாய்ப்பு
வீழ்ச்சி
பார்ப்பான்
காய்ச்சு
காய்த்தல்
கவிழ்ப்பு
கேட்ச்
இங்க்
பேங்க்
சென்ட்
தேங்க்ஸ்
#Invalid - Case of  "H must be preceded by C" 
அ்ன்பு
இ்ல்லம்
ஆ்ற்றல்
எ்ட்டு
உ்ள்ளம்
ஊ்்ற்று
#Invalid - Case of  "M must be preceded by C"
கஆாற்று
பக்ுகவம்
பற்றுு
#Invalid Case of	"X: Can not be preceded by X
கல்ஃஃமனம்
பணஃஃவயல்
தொல்லிஃஃயல்
#Invalid Case of	"X: Can not be preceded by X
கல்ஃஃமனம்
பணஃஃவயல்
தொல்லிஃஃயல்
#Invalid Case ofX: must only be succeeded by any of the following consonants
#Invalid - Case of "Words containing characters outside the repertoire"
௧டல்
உ௫வம்
ச௩கம்
கௗம்
௨ரல்
௶னூல்
௷ர்
௹பாய்
௺ங்கள்
10
க௱ம்
௭ல்லோரும்
௴ண்டு


#Following labels produce within-script variants
கௌசல்யாதேவி
#generates the following blocked variant
கெளசல்யாதேவி

கௌடில்யரின்
#generates the following blocked variant
கெளடில்யரின்

கௌணஸ்நானம்
#generates the following blocked variant
கெளணஸ்நானம்


கௌண்டின்ய
#generates the following blocked variant
கெளண்டின்ய


கௌதமன்
#generates the following blocked variant
கெளதமன்


கௌதமாலாவிலிருந்து
#generates the following blocked variant
கெளதமாலாவிலிருந்து


கௌதம்
#generates the following blocked variant
கெளதம்


கௌபாய்
#generates the following blocked variant
கெளபாய்

கௌமாரம்
#generates the following blocked variant
கெளமாரம்


கௌமாரி
#generates the following blocked variant
கெளமாரி


கௌரபிட்டா
#generates the following blocked variant
கெளரபிட்டா


கௌரவத்தை
#generates the following blocked variant
கெளரவத்தை


கௌரி
#generates the following blocked variant
கெளரி


கௌஸ்துபமணி
#generates the following blocked variant
கெளஸ்துபமணி


கௌஹாத்திக்கு
#generates the following blocked variant
கெளஹாத்திக்கு


சௌகரியத்திற்காக
#generates the following blocked variant
செளகரியத்திற்காக


சௌகரியத்துக்கு
#generates the following blocked variant
செளகரியத்துக்கு


சௌகரியமானதாகவும்
#generates the following blocked variant
செளகரியமானதாகவும்


சௌக்கிய
#generates the following blocked variant
செளக்கிய


சௌக்கியம்
#generates the following blocked variant
செளக்கியம்


சௌத்ரி
#generates the following blocked variant
செளத்ரி


சௌந்தர்யா
#generates the following blocked variant
செளந்தர்யா


சௌசௌ
#generates the following blocked variant
செளசௌ
செளசெள
சௌசெள

சௌபாக்கியங்களும்
#generates the following blocked variant
செளபாக்கியங்களும்


சௌபாக்யத்தைத்
#generates the following blocked variant
செளபாக்யத்தைத்


சௌம்யா
#generates the following blocked variant
செளம்யா


சௌர
#generates the following blocked variant
செளர


சௌரப்
#generates the following blocked variant
செளரப்


சௌரமதம்
#generates the following blocked variant
செளரமதம்


சௌரம்
#generates the following blocked variant
செளரம்


சௌரம்சூரிய
#generates the following blocked variant
செளரம்சூரிய


சௌரவ்
#generates the following blocked variant
செளரவ்


சௌராஷ்டரம்
#generates the following blocked variant
செளராஷ்டரம்


சௌஸா
#generates the following blocked variant
செளஸா


பௌத்திரன்
#generates the following blocked variant
பெளத்திரன்


பௌத்திரி
#generates the following blocked variant
பெளத்திரி


பௌதீக
#generates the following blocked variant
பெளதீக


மௌனம்
#generates the following blocked variant
பெளனம்


மௌனி
#generates the following blocked variant
மெளனி


மௌனப்படம்
#generates the following blocked variant
மெளனப்படம்


மௌசு
#generates the following blocked variants
மெளசு


மௌடீகம்
#generates the following blocked variant
மெளடீகம்


ஔரங்காபாத்திலும்
#generates the following blocked variant
ஒளரங்காபாத்திலும்


ஔவை
#generates the following blocked variant
ஒளவை


ஔஷதம்
#generates the following blocked variant
ஒளஷதம்

#Following labels produce variants allocatable
ஸ்ரீதர்
#generates the following blocked variant
ஶ்ரீதர்

ஹரினிஸ்ரீ
#generates the following blocked variant
ஹரினிஶ்ரீ

ஸ்ரீ
#generates the following blocked variant
ஶ்ரீ
#Following labels produce cross-script variants with Malayalam
ஜவமி
ஜஜ
ஜவ
ஜம
ஜவி
ஜிஜி
ஜிஜே
ஜிவி
ஜிமி
ஜெஜி
ஜெமி
ஜெவி
ஜேஜி
ஜேமி
ஜேவி
மம
மவ
மஜ
மிமி
மிவி
மஜி
மிஜி
மெவி
மேஜி
மேவி
வஜ
வம
வமி
விஜி
விமி
விவி
விவ
விஜ
விம
விவமி
வெமி
வேமி










More information about the Neobrahmigp mailing list