<div style="font-family: arial, helvetica, sans-serif; font-size: 10pt">In the southamerica data file we have several Latin-1 encoded non-ASCII characters.<div><br></div><div>The other data files are 100% ASCII</div><div><br>
</div><div>Here they are:</div><div><br></div><div><div>$ grep -nP &quot;[\\x80-\\xff]&quot; *</div><div>southamerica:384:# There&#39;s also a note in only one of the major national papers (La Naci�n) at</div><div>southamerica:390:#  (...) anunci� que el pr�ximo domingo a las 00:00 los puntanos deber�n</div>
<div>southamerica:393:# A partir de entonces, San Luis establecer� el huso horario propio de</div><div>southamerica:395:# 2009, el cambio horario quedar� comprendido entre las 00:00 del tercer</div><div>southamerica:396:# domingo de marzo y las 24:00 del segundo s�bado de octubre.</div>
<div>southamerica:815:# I just send a e-mail to Zulmira Brand�o at</div></div><div><br></div><div>I think it&#39;s fine to allow non-ASCII in comments, but would strongly request that the files be UTF-8 encoded. Anything else leads to immense confusion over what charset is in use.</div>
<div><br></div><div>  -- Andy</div><div><br></div></div>