Unicode 4.1 / revised UCA
最近Unicodeまわりのタスクをやっているわけですが、ちょうどこの前Unicode 4.1の仕様が出て、そのついでにcollation algorithmも改訂版が出るそうですね。MSのMichael Kaplanが「Unicode committeの連中がおれらに意見を聞いてきたってことは、こっちがUCAよりまともなモノを持っているって事じゃないか?」と言っていたのが、反映されているということかもしれません。
とは言っても、一〇〇と一〇〇〇〇の区別が付かないような照合は勘弁してほしいのですが。
using System;
using System.Globalization;public class Test {
public static void Main () {
CultureInfo ci = new CultureInfo ("ja-JP");
Console.WriteLine (ci.CompareInfo.Compare (
"一", "一〇〇〇〇"));
}
}
import java.text.Collator;
import java.util.Locale;public class testClass {
public static void main (String [] args)
{
Collator coll = Collator.getInstance (Locale.JAPANESE);
System.out.println (coll.compare (
"一", "一〇〇〇〇"));
}
}