<div dir="ltr">Thank you! I have gone through the invalids and they are indeed caused by the joiner characters and the split matras being used. <div><br></div><div>Historically, ZWJ was used to render chillu in certain fonts but later Unicode included chillu characters as standalone codepoints and MSR-3 also includes these standalone chillu characters. So, I think ZWJ need not be added in IDN. </div><div><br></div><div>ZWNJ, is used to prevent the formation of conjunct ligatures and it is required to avoid spelling mistakes and unnecessary conjuncts. For example, in a 2 word label, the first word ending in virama can form conjunct with the second word starting in a consonant. This causes a spelling mistake.</div><div><br></div><div>I request the other Malayalam panel members to go through the same and make suggestions. </div><div><br></div><div>Regards,</div></div><div class="gmail_extra"><br clear="all"><div><div class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div><div style="font-size:small;font-family:tahoma,sans-serif;color:rgb(51,51,153)"><br></div><div style="font-size:small"><div dir="ltr"><div style="font-size:13px"><br><font face="georgia, serif"><b>Veena Solomon</b></font></div><div style="font-family:arial,sans-serif;font-size:13px"><br></div><div style="font-family:arial,sans-serif;font-size:13px"><a href="http://www.twitter.com/vinazol" style="color:rgb(17,85,204)" target="_blank"><img src="http://icons.iconarchive.com/icons/danleech/simple/16/twitter-icon.png" alt="Twitter icon"></a> <a href="http://www.pinterest.com/vinazol" style="color:rgb(17,85,204)" target="_blank"><img src="http://icons.iconarchive.com/icons/danleech/simple/16/pinterest-icon.png" alt="Pinterest icon"></a> <a href="http://www.facebook.com/vinazol" style="color:rgb(17,85,204)" target="_blank"><img src="http://icons.iconarchive.com/icons/danleech/simple/16/facebook-icon.png" alt="Facebook icon"></a> <a href="http://www.quora.com/Veena-Solomon" style="color:rgb(17,85,204)" target="_blank"><img src="http://icons.iconarchive.com/icons/danleech/simple/16/quora-icon.png" alt="Quora icon"></a> <a href="http://foursquare.com/user/7402337" style="color:rgb(17,85,204)" target="_blank"><img src="http://icons.iconarchive.com/icons/danleech/simple/16/foursquare-icon.png" alt="Foursquare icon"></a> <a href="https://plus.google.com/u/0/105213014676403488949/" style="color:rgb(17,85,204)" target="_blank"><img src="http://icons.iconarchive.com/icons/danleech/simple/16/google-plus-icon.png" alt="Google-plus icon"></a></div><div style="font-family:arial,sans-serif;font-size:13px"><br></div><div style="font-family:arial,sans-serif;font-size:13px">  <br></div></div></div></div><div><div style="font-family:arial;font-size:small"><div dir="ltr"><div style="font-family:tahoma,sans-serif;color:rgb(51,51,153)"><br></div></div></div><span style="font-family:arial;font-size:small;background-color:rgb(255,255,128)"></span></div><div><font face="'courier new', monospace" size="1" color="#330033"><span style="letter-spacing:2px;text-transform:capitalize"></span></font></div></div></div></div>
<br><div class="gmail_quote">On Sun, May 13, 2018 at 12:08 AM, Sarmad Hussain <span dir="ltr"><<a href="mailto:sarmad.hussain@icann.org" target="_blank">sarmad.hussain@icann.org</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div bgcolor="white" lang="EN-US" link="blue" vlink="purple"><div class="m_5958894166188644935WordSection1"><p class="MsoNormal"> Dear All,<u></u><u></u></p><p class="MsoNormal"><u></u> <u></u></p><p class="MsoNormal">Please find attached the Malayalam XML/HTML based on the proposal version: <u></u><u></u></p><p class="MsoNormal"><a href="https://docs.google.com/document/d/1KTmiGSuxsyrEdzkAVqA8coIqc4_eNAYygOUEl0ZcA7U/edit#heading=h.o9uxhnnsmlal" target="_blank">https://docs.google.com/<wbr>document/d/<wbr>1KTmiGSuxsyrEdzkAVqA8coIqc4_<wbr>eNAYygOUEl0ZcA7U/edit#heading=<wbr>h.o9uxhnnsmlal</a>.<u></u><u></u></p><p class="MsoNormal"><u></u> <u></u></p><p class="MsoNormal">The test results are also attached for your review, based on a Malayalam corpus available online.  There are 17k labels which are rejected out of 130k labels.  Kindly review and see if the XML/HTML are as per the proposal.  The rejections may be because the Chillu characters are represented by their earlier forms using the joiner characters.  <u></u><u></u></p><p class="MsoNormal"><u></u> <u></u></p><p class="MsoNormal">Kindly let us know if you have any feedback.  <u></u><u></u></p><p class="MsoNormal"><u></u> <u></u></p><p class="MsoNormal">We will share these with the IP.<u></u><u></u></p><p class="MsoNormal"><u></u> <u></u></p><p class="MsoNormal">Regards,<br>Sarmad<u></u><u></u></p></div></div></blockquote></div><br></div>