2005-06-03から1日間の記事一覧
Windows上では、一と㆒と㊀は絶対に同一視できないらしい。何でCJK ideograph領域を完全なCodepoint順にしなかったんだか。 互換字ならdiacritical weightあるいはspecial weightで調整することで、より柔軟な文字列比較も可能になったはずだし(special wei…
少なくともバイナリ互換性を維持する限りは。Windowsのsortkeyでは、CJK統合漢字のコードポイント4E00-9FA5にあたる膨大なマップを、sortkeyの9E 02 01 01 01 01からF0 B4 01 01 01 01に割り当て、続けてF900から始まるCJK互換漢字のマップをF0 B5 01 01 01 …
ワロタ