<html>
<head>
<style><!--
.hmmessage P
{
margin:0px;
padding:0px
}
body.hmmessage
{
font-size: 12pt;
font-family:Calibri
}
--></style></head>
<body class='hmmessage'><div dir='ltr'>Guys, please don't forget that zic is not the only usage of the tzdata. &nbsp;Countless platforms, languages, libraries, and applications use TZ identifiers. &nbsp;Putting a non-ASCII character in a time zone name is likely going to break many things.<div><br></div><div>For example, if I have an app that asks the user for their time zone, I might save that time zone into a SQL database varchar column. &nbsp;One could argue that nvarchar is better, but surely we don't want to require folks to update their application database schemas just to stay current with the latest time zone updates. &nbsp; I'm sure there are many other scenarios that would be affected as well.</div><div><br></div><div>-Matt<br><br><div>&gt; From: guy@alum.mit.edu<br>&gt; Date: Wed, 25 Jun 2014 12:39:02 -0700<br>&gt; To: eggert@cs.ucla.edu<br>&gt; CC: tz@iana.org<br>&gt; Subject: Re: [tz] Non-ASCII outside comments?<br>&gt; <br>&gt; <br>&gt; On Jun 25, 2014, at 12:17 PM, Paul Eggert &lt;eggert@cs.ucla.edu&gt; wrote:<br>&gt; <br>&gt; &gt; Arthur David Olson wrote:<br>&gt; &gt;&gt; Should zic permit non-ASCII characters in zone names? In time zone<br>&gt; &gt;&gt; abbreviations?<br>&gt; &gt;&gt; If they are permitted, should zic warn about them?<br>&gt; &gt; <br>&gt; &gt; Currently zic allows non-ASCII characters in both places, no?  Or more precisely, zic allows any byte except for ", newline, and the null byte.  So the question is whether zic should stop allowing nearly-arbitrary byte strings, even byte strings that are not properly encoded characters.<br>&gt; &gt; <br>&gt; &gt; The simplest thing to do is to leave zic alone.  I don't see much harm in that, though perhaps I'm missing something.<br>&gt; <br>&gt; +1<br>&gt; <br>&gt; But perhaps the documentation should indicate that:<br>&gt; <br>&gt;         the byte strings for zone names will be used, as is, in OS calls to create files, and we don't guarantee what effect that will have (for example, on at least one UNIX(R), with the default file system - regardless of whether it's running case-sensitive or case-insensitive - some amount of processing is done on file names to convert them to UTF-16 on disk);<br>&gt; <br>&gt;         the byte strings for abbreviations will be copied over to the file, without interpretation;<br>&gt; <br>&gt; and that you use non-ASCII characters at your own risk.<br></div></div>                                               </div></body>
</html>