ものがたり(旧)

atsushieno.hatenablog.com に続く

2005-05-10から1日間の記事一覧

CJK character order

漢字のソート順序まわりは面白いというかややこしいというか。UnicodeでCJK統合漢字領域(0x4E00-0x9FFF)にあたる文字は(たぶん)ほぼ全て意味のある文字*1なので、それぞれ1文字ごとにSortKeyをdumpすると、それがそのまま文字の順序を決めていると考えて問…