[Neobrahmigp] Please prepare test labels files for each script

Dr. Shanmugam R. shanmugamr at cdac.in
Fri Apr 20 11:34:04 UTC 2018


Dear NBGP,
I have completed the test label files and sending the same.

Thanks and regards,
Dr.Shanmugam R.


On March 23, 2018 at 2:40 PM Sarmad Hussain <sarmad.hussain at icann.org> wrote:

> 
>  Dear NBGP members,
> 
> 
> 
>  While the Integration Panel is reviewing the proposals from NBGP, we will
> also request you to develop a test case file.  Here is a brief description of
> what is expected in such a file.
> 
> 
> 
>     1. Have a list of labels
>           1. At least 50 valid labels, possibly more, also addressing the
> following:
> 
>                                                                  i.     Labels
> should cover all languages shortlisted for inclusion in the proposal for that
> script (EGIDS 1-4)
> 
>                                                                 ii.     Labels
> should cover all the code points in the repertoire
> 
>           1. A reasonable list of invalid labels containing some of the
> out-of-repertoire code points
>     1. Have a list of labels which have variant labels (if the script proposal
> has variants listed), following by a list of all within-script and
> cross-script variant labels for that label.  A reasonable coverage of variant
> code points is suggested
>     2. Have a few labels for each rule:
>           1. Have positive examples, creating valid labels
>           2. Have negative examples, with invalid labels as they should fail
> that specific rule – in some cases you may have to make us some nonsense
> labels just for that purpose
>           3. In case there are multiple ways a rule can fail, please suggest a
> few examples for each of those cases
> 
> 
> 
>  These should be listed in a simple text file with each section separated by a
> comment (which starts with a # sign).
> 
> 
> 
>  There must be only one label per line.
> 
> 
> 
>  For examples, see test files posted by other GPs at
> https://www.icann.org/resources/pages/lgr-proposals-2015-12-01-en
> <https://www.icann.org/resources/pages/lgr-proposals-2015-12-01-en> .
> 
> 
> 
>  Please let us know if you have any questions.
> 
> 
> 
>  Regards,
>  Sarmad
> 
> 
> 
> 
> 
>  From: Neobrahmigp [mailto:neobrahmigp-bounces at icann.org] On Behalf Of Sarmad
> Hussain
>  Sent: Saturday, March 17, 2018 4:41 PM
>  To: NeobrahmiGP at icann.org
>  Subject: Re: [Neobrahmigp] Update on status of NBGP proposals
> 
> 
> 
>  Dear All,
> 
> 
> 
>  Here is the updated status.  At this time 8 out of 9 proposals have been
> submitted to the IP for their (first or second) review.
> 
> 
> 
>  No.
> 
>  Script
> 
>  XML/ HTML
> 
>  Sent to IP?
> 
>  1
> 
>  Gujarati
> 
>  Done
> 
>  Yes; on 20180303
> 
>  2
> 
>  Gurmukhi
> 
>  Done
> 
>  Yes; on 20180305 (revised on 20180308)
> 
>  3
> 
>  Kannada
> 
>  Done
> 
>  Yes; on 20180303
> 
>  4
> 
>  Telugu
> 
>  Done
> 
>  Yes; on 20180314
> 
>  5
> 
>  Bengali
> 
> 
> 
>  Yes; on 20180303
> 
>  6
> 
>  Oriya
> 
>  Done
> 
>  Yes; on 20180305
> 
>  7
> 
>  Tamil
> 
>  Done
> 
>  Yes; on 20180305
> 
>  8
> 
>  Malayalam
> 
> 
> 
> 
> 
>  9
> 
>  Devanagari
> 
>  Done
> 
>  Yes; awaiting feedback from IP
> 
> 
> 
> 
> 
>  Regards,
>  Sarmad
> 
> 
> 
> 
> 
>  From: Neobrahmigp [mailto:neobrahmigp-bounces at icann.org
> <mailto:neobrahmigp-bounces at icann.org> ] On Behalf Of Sarmad Hussain
>  Sent: Monday, March 05, 2018 8:09 PM
>  To: NeobrahmiGP at icann.org <mailto:NeobrahmiGP at icann.org>
>  Subject: Re: [Neobrahmigp] Update on status of NBGP proposals
> 
> 
> 
>  Dear All,
> 
> 
> 
>  We are grateful to the extra-ordinary effort being put in the NBGP members
> toward developing the script proposals.
> 
> 
> 
>  Here is the updated status as of today!  At this time 7 out of 9 proposals
> have been submitted to the IP for their (first or second) review.
> 
> 
> 
>  No.
> 
>  Script
> 
>  XML/ HTML
> 
>  Feedback to authors
> 
>  (cc: to co-chairs)
> 
>  Sent to IP?
> 
>  1
> 
>  Gujarati
> 
>  Done
> 
> 
> 
>  Yes; on 20180303
> 
>  2
> 
>  Gurmukhi
> 
>  Done
> 
> 
> 
>  Yes; on 20180305
> 
>  3
> 
>  Kannada
> 
>  Done
> 
> 
> 
>  Yes; on 20180303
> 
>  4
> 
>  Telugu (awaiting revised proposal)
> 
> 
> 
> 
> 
> 
> 
>  5
> 
>  Bengali
> 
>  Awaiting update
> 
>  Yes, to Prof. Udaya
> 
>  Yes; on 20180303
> 
> 
> 
>  6
> 
>  Oriya
> 
>  Done
> 
> 
> 
>  Yes; on 20180305
> 
>  7
> 
>  Tamil
> 
>  Done
> 
> 
> 
>  Yes; on 20180305
> 
>  8
> 
>  Malayalam (awaiting proposal)
> 
> 
> 
> 
> 
> 
> 
>  9
> 
>  Devanagari (awaiting IP response)
> 
> 
> 
> 
> 
> 
> 
> 
> 
> 
> 
>  Regards,
>  Sarmad
> 
> 
> 
>  From: Sarmad Hussain
>  Sent: Saturday, March 03, 2018 8:33 PM
>  To: NeobrahmiGP at icann.org <mailto:NeobrahmiGP at icann.org>
>  Subject: Update on status of NBGP proposals
> 
> 
> 
>  Dear All,
> 
> 
> 
>  Following our call, here is the status of NBGP proposals:
> 
> 
> 
>  No.
> 
>  Script
> 
>  XML/HTML
> 
>  Feedback to authors
> 
>  (cc: to co-chairs)
> 
>  Sent to IP?
> 
>  1
> 
>  Gujarati (recently received)
> 
>  Done
> 
>  Yes
> 
>  Akshat
> 
>  Yes; on 20180303
> 
>  2
> 
>  Gurmukhi (recently received)
> 
>  Done
> 
>  Yes
> 
>  Lehal
> 
>  No
> 
>  (waiting for feedback from Lehal)
> 
>  3
> 
>  Kannada (recently received)
> 
>  Done
> 
>  None
> 
>  Yes; on 20180303
> 
>  4
> 
>  Telugu (awaiting revised proposal)
> 
> 
> 
> 
> 
> 
> 
>  5
> 
>  Bengali (recently received)
> 
>  Awaiting update
> 
>  Yes
> 
>  Prof. Udaya
> 
>  Yes; on 20180303
> 
> 
> 
>  6
> 
>  Oriya
> 
>  Done
> 
>  Yes
> 
>  Kuldeep
> 
>  No
> 
>  (waiting for feedback from Kuldeep)
> 
>  7
> 
>  Tamil
> 
>  Done
> 
>  Yes
> 
>  Shanmugam
> 
>  No
> 
>  (waiting for feedback from Shanmugam)
> 
> 
> 
>  IP is finalizing the feedback on the Devanagari LGR proposal and will be
> shared soon.
> 
> 
> 
>  Regards,
>  Sarmad
> 
  _______________________________________________
Neobrahmigp mailing list
Neobrahmigp at icann.org
https://mm.icann.org/mailman/listinfo/neobrahmigp
-------------------------------------------------------------------------------------------------------------------------------
[ C-DAC is on Social-Media too. Kindly follow us at:
Facebook: https://www.facebook.com/CDACINDIA & Twitter: @cdacindia ]

This e-mail is for the sole use of the intended recipient(s) and may
contain confidential and privileged information. If you are not the
intended recipient, please contact the sender by reply e-mail and destroy
all copies and the original message. Any unauthorized review, use,
disclosure, dissemination, forwarding, printing or copying of this email
is strictly prohibited and appropriate legal action will be taken.
-------------------------------------------------------------------------------------------------------------------------------

-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://mm.icann.org/pipermail/neobrahmigp/attachments/20180420/3b037b68/attachment-0001.html>
-------------- next part --------------
#This document lays down the examples to test the Label Generation Rule Set for Tamil script.
#It provides a list of valid and invalid labels as per the WLE rules.
#The labels have been tagged as valid and invalid under specific rules. 
#However, the categorization of invalid labels under specific rules is given as per the general understanding of the LGR Tool by the NBGP. During testing with LGR tool whether it gets flagged under the same rule or the different one is totally dependent on the internal implementation of the LGR Tool. In case of discrepancy among the same, the fact that it is an invalid label should only be considered.

#Document Version : 1.8
#LGR Tamil Version : 3.0 (LGR-Proposal_Tamil_20180412.docx)
#XML Name : Proposed-LGR-Tam-20180412..xml
#Valid - Case of "Vowels"
அ
ஆ
இ
ஈ
உ
ஊ
எ
ஏ
ஐ
ஒ
ஓ
ஔ
#Valid - Case of "CONSONANTS" and CONSONANT + MATRA combination
க
கா
கி
கீ
கு
கூ
கெ
கே
கை
கொ
கோ
கௌ
ங
ஙா
ஙி
ஙீ
ஙு
ஙூ
ஙெ
ஙே
ஙை
ஙொ
ஙோ
ஙௌ
ச
சா
சி
சீ
சு
சூ
செ
சே
சை
சொ
சோ
சௌ
ஜ
ஜா
ஜி
ஜீ
ஜு
ஜூ
ஜெ
ஜே
ஜை
ஜொ
ஜோ
ஜௌ
ஞ
ஞா
ஞி
ஞீ
ஞு
ஞூ
ஞெ
ஞே
ஞை
ஞொ
ஞோ
ஞௌ
ட
டா
டி
டீ
டு
டூ
டெ
டே
டை
டொ
டோ
டௌ
ண
ணா
ணி
ணீ
ணு
ணூ
ணெ
ணே
ணை
ணொ
ணோ
ணௌ
த
தா
தி
தீ
து
தூ
தெ
தே
தை
தொ
தோ
தௌ
ந
நா
நி
நீ
நு
நூ
நெ
நே
நை
நொ
நோ
நௌ
ன
னா
னி
னீ
னு
னூ
னெ
னே
னை
னொ
னோ
னௌ
ப
பா
பி
பீ
பு
பூ
பெ
பே
பை
பொ
போ
பௌ
ம
மா
மி
மீ
மு
மூ
மெ
மே
மை
மொ
மோ
மௌ
ய
யா
யி
யீ
யு
யூ
யெ
யே
யை
யொ
யோ
யௌ
ர
ரா
ரி
ரீ
ரு
ரூ
ரெ
ரே
ரை
ரொ
ரோ
ரௌ
ற
றா
றி
றீ
று
றூ
றெ
றே
றை
றொ
றோ
றௌ
ல
லா
லி
லீ
லு
லூ
லெ
லே
லை
லொ
லோ
லௌ
ள
ளா
ளி
ளீ
ளு
ளூ
ளெ
ளே
ளை
ளொ
ளோ
ளௌ
ழ
ழா
ழி
ழீ
ழு
ழூ
ழெ
ழே
ழை
ழொ
ழோ
ழௌ
வ
வா
வி
வீ
வு
வூ
வெ
வே
வை
வொ
வோ
வௌ
ஶ
ஶா
ஶி
ஶீ
ஶு
ஶூ
ஶெ
ஶே
ஶை
ஶொ
ஶோ
ஶௌ
ஷ
ஷா
ஷி
ஷீ
ஷு
ஷூ
ஷெ
ஷே
ஷை
ஷொ
ஷோ
ஷௌ
ஸ
ஸா
ஸி
ஸீ
ஸு
ஸூ
ஸெ
ஸே
ஸை
ஸொ
ஸோ
ஸௌ
ஹ
ஹா
ஹி
ஹீ
ஹு
ஹூ
ஹெ
ஹே
ஹை
ஹொ
ஹோ
ஹௌ
#Valid - Case of "X: must be preceded by either of V, C, or M"
அஃறிணை
அஃது
இஃது
கஃடீது
முஃடீது
#Valid - Case of "A vowel'
அக்கம்
ஆற்றல்
இல்லம்
ஈகை
உலகம்
ஊர்
எண்ணம்
ஏர்
ஐராவதம்
ஒப்பம்
ஓடம்
ஔவையார்
எஸ்ஐ
#Valid - Case of "H: must be preceded by C"
கப்பல்
காவல்
கிடப்பு
குடம்
சல்லடை
சாப்பாடு
ஞாலம்
தவம்
பணம்
பங்கம்
மண்டபம்
தூவல்
புடைப்பு
யுவன்
ரீங்காரம்
ரூபாய்
லட்டு
வெள்ளம்
கற்பனை
கறிவேப்பிலை
கன்னம்
காட்சிகளில்
கூழ்
கொலம்பியா
தொடராது
நுனியில்
நுனிப்பகுதி
நிலத்துக்கு
தந்தனர்
துதித்து
துத்தநாக
நடித்திருந்தன
படிப்பகம்
மனம்
மீசை
மையல்
மோதிரம்
நேராக
நொய்யல்
நோய்
மௌரியர்
நைஜீரியா
ஞாயிறு
நொதித்தலின்
டம்ளர்
பிரித்தல்
பை
பவளம்
நொதித்தல்
நொதித்து
பட்டம்
பணம்
ஊதல்
கவனம்
சகலகலாவல்லவன்
சரித்திரம்
சாதனை
சல்லடை
சாக்குபோக்கு
உறக்கம்
உவமை
உள்ளம்
ஊர்வலம்
பட்டயம்
இவ்விதம்
இவ்வாறு
இங்ஙனம்
கௌரி
சௌந்தர்யா
பௌதீகம்
ஜனனம்
ஸரிகா
ஷாகிப்
ஸ்ரீலஷ்மி
காமாக்ஷி
கிடைக்கிற
கொண்டதும்
கொண்டனர்
கொத்துவகை
எங்ஙனம்
#Valid - Case of "M: must be preceded by C"
சுக்கு
சுக்ரவார
சுண்ணாம்பு
சுந்தர்
சொத்து
சொன்னது
சௌக்கியம்
சௌந்தர்யா
ஜாக்ஸன்
ஜீனியர்
ஜீன்ஸ்
ஜூன்
ஜோதிடம்
ஞாநியின்
ஞாநியும்
ஞானாதீஸ்வரர்
ஞானி
டாக்டர்கள்
டெக்னாலஜி
டெக்னிக்கல்
தாங்கவும்
தாங்கவே
தாங்காத
தாங்காது
தாங்காமல்
தாண்டும்
நாகேஷின்
நாடுகளின்
நிசாந்த்
நிசான்
நிதியத்திடம்
நீண்டது
நீதிக்காக
நீந்தும்
நுட்பங்களை
நுண்ணுயிர்
நெகிழ்வுடைய
பள்ளி
பட்டிதொட்டி
பண்ணையம்
பருத்தி
விட்டில்பூச்சி
பேச்சு
மத்தளம்
மாங்கல்யம்
மருத்தவர்
நன்னயம்
வாழ்க்கை
வார்த்தை
வாய்ப்பு
வீழ்ச்சி
பார்ப்பான்
காய்ச்சு
காய்த்தல்
கவிழ்ப்பு
கேட்ச்
இங்க்
பேங்க்
சென்ட்
தேங்க்ஸ்
#Invalid - Case of  "H must be preceded by C" 
அ்ன்பு
இ்ல்லம்
ஆ்ற்றல்
எ்ட்டு
உ்ள்ளம்
ஊ்்ற்று
#Invalid - Case of  "M must be preceded by C"
கஆாற்று
பக்ுகவம்
பற்றுு
#Invalid Case of	"X: must be preceded by either of V, C, or M
கல்ஃமனம்
பணஃவயல்
தொல்லிஃயல்
#Invalid - Case of "Words containing characters outside the repertoire"
௧டல்
உ௫வம்
ச௩கம்
கௗம்
௨ரல்
௶னூல்
௷ர்
௹பாய்
௺ங்கள்
10
க௱ம்
௭ல்லோரும்
௴ண்டு









-------------- next part --------------
#Following labels produce within-script variants
கௌசல்யாதேவி
#generates the following blocked variant
கெளசல்யாதேவி

கௌடில்யரின்
#generates the following blocked variant
கெளடில்யரின்

கௌணஸ்நானம்
#generates the following blocked variant
கெளணஸ்நானம்


கௌண்டின்ய
#generates the following blocked variant
கெளண்டின்ய


கௌதமன்
#generates the following blocked variant
கெளதமன்


கௌதமாலாவிலிருந்து
#generates the following blocked variant
கெளதமாலாவிலிருந்து


கௌதம்
#generates the following blocked variant
கெளதம்


கௌபாய்
#generates the following blocked variant
கெளபாய்

கௌமாரம்
#generates the following blocked variant
கெளமாரம்


கௌமாரி
#generates the following blocked variant
கெளமாரி


கௌரபிட்டா
#generates the following blocked variant
கெளரபிட்டா


கௌரவத்தை
#generates the following blocked variant
கெளரவத்தை


கௌரி
#generates the following blocked variant
கெளரி


கௌஸ்துபமணி
#generates the following blocked variant
கெளஸ்துபமணி


கௌஹாத்திக்கு
#generates the following blocked variant
கெளஹாத்திக்கு


சௌகரியத்திற்காக
#generates the following blocked variant
செளகரியத்திற்காக


சௌகரியத்துக்கு
#generates the following blocked variant
செளகரியத்துக்கு


சௌகரியமானதாகவும்
#generates the following blocked variant
செளகரியமானதாகவும்


சௌக்கிய
#generates the following blocked variant
செளக்கிய


சௌக்கியம்
#generates the following blocked variant
செளக்கியம்


சௌத்ரி
#generates the following blocked variant
செளத்ரி


சௌந்தர்யா
#generates the following blocked variant
செளந்தர்யா


சௌசௌ
#generates the following blocked variant
செளசௌ
செளசெள
சௌசெள

சௌபாக்கியங்களும்
#generates the following blocked variant
செளபாக்கியங்களும்


சௌபாக்யத்தைத்
#generates the following blocked variant
செளபாக்யத்தைத்


சௌம்யா
#generates the following blocked variant
செளம்யா


சௌர
#generates the following blocked variant
செளர


சௌரப்
#generates the following blocked variant
செளரப்


சௌரமதம்
#generates the following blocked variant
செளரமதம்


சௌரம்
#generates the following blocked variant
செளரம்


சௌரம்சூரிய
#generates the following blocked variant
செளரம்சூரிய


சௌரவ்
#generates the following blocked variant
செளரவ்


சௌராஷ்டரம்
#generates the following blocked variant
செளராஷ்டரம்


சௌஸா
#generates the following blocked variant
செளஸா


பௌத்திரன்
#generates the following blocked variant
பெளத்திரன்


பௌத்திரி
#generates the following blocked variant
பெளத்திரி


பௌதீக
#generates the following blocked variant
பெளதீக


மௌனம்
#generates the following blocked variant
பெளனம்


மௌனி
#generates the following blocked variant
மெளனி


மௌனப்படம்
#generates the following blocked variant
மெளனப்படம்


மௌசு
#generates the following blocked variants
மெளசு


மௌடீகம்
#generates the following blocked variant
மெளடீகம்


ஔரங்காபாத்திலும்
#generates the following blocked variant
ஒளரங்காபாத்திலும்


ஔவை
#generates the following blocked variant
ஒளவை


ஔஷதம்
#generates the following blocked variant
ஒளஷதம்

ஸ்ரீதர்
#generates the following blocked variant
ஶ்ரீதர்

ஹரினிஸ்ரீ
#generates the following blocked variant
ஹரினிஶ்ரீ

ஸ்ரீ
#generates the following blocked variant
ஶ்ரீ
#Following labels produce cross-script variants with Malayalam
ஜவமி
ஜஜ
ஜவ
ஜம
ஜவி
ஜிஜி
ஜிஜே
ஜிவி
ஜிமி
ஜெஜி
ஜெமி
ஜெவி
ஜேஜி
ஜேமி
ஜேவி
மம
மவ
மஜ
மிமி
மிவி
மஜி
மிஜி
மெவி
மேஜி
மேவி
வஜ
வம
வமி
விஜி
விமி
விவி
விவ
விஜ
விம
விவமி
வெமி
வேமி

















More information about the Neobrahmigp mailing list