2005-05-10から1日間の記事一覧
漢字のソート順序まわりは面白いというかややこしいというか。UnicodeでCJK統合漢字領域(0x4E00-0x9FFF)にあたる文字は(たぶん)ほぼ全て意味のある文字*1なので、それぞれ1文字ごとにSortKeyをdumpすると、それがそのまま文字の順序を決めていると考えて問…
漢字のソート順序まわりは面白いというかややこしいというか。UnicodeでCJK統合漢字領域(0x4E00-0x9FFF)にあたる文字は(たぶん)ほぼ全て意味のある文字*1なので、それぞれ1文字ごとにSortKeyをdumpすると、それがそのまま文字の順序を決めていると考えて問…