<div dir="ltr">On 8 April 2013 19:06, Jacob Carlborg <span dir="ltr"><<a href="mailto:doob@me.com" target="_blank">doob@me.com</a>></span> wrote:<br><div class="gmail_extra"><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div class="im">On 2013-04-08 10:15, Manu wrote:<br>
<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
... I don't think that's actually true. Can you suggest such a character<br>
in any language? I think they take that sort of thing into careful<br>
consideration when designing the codepoints for a character set.<br>
But if that is the case, then a function called toUpperInPlace is flawed<br>
by design, because it would be incapable of doing what it says it does.<br>
I'm not convinced that's true though.<br>
</blockquote>
<br></div>
The German double "s" (ß) in uppercase form should be "SS". That consists of two characters. There's also something similar with the Turkic "I" with a dot.<br>
<br>
Here's the full list of special casings:<br>
<br>
<a href="http://www.unicode.org/Public/UNIDATA/SpecialCasing.txt" target="_blank">http://www.unicode.org/Public/<u></u>UNIDATA/SpecialCasing.txt</a><br>
<br>
You should also read this:<br>
<br>
<a href="http://forum.dlang.org/thread/kcppa1$30b9$1@digitalmars.com" target="_blank">http://forum.dlang.org/thread/<u></u>kcppa1$30b9$1@digitalmars.com</a><br>
<br>
Shows some nasty corner cases with Unicode.<br>
<br>
Short summary: encodings are PITA.</blockquote><div><br></div><div style>... bugger! :/</div><div style>Well I guess that function just needs to be amended to not-upper-case-ify those troublesome letters? Shame.</div></div>
</div></div>