ものがたり(旧)

atsushieno.hatenablog.com に続く

2005-04-15から1日間の記事一覧

Unicode Normalizationはかな文字を正しく正規化するか?

激しく疑問である。UAX#15によると、compatibility decompositionを適用した結果、全角濁点(0x309b)は、半角スペース(0x20)+半角濁点(0x3099)に置き換えられる。だから、たとえば「タ゛」(0x30bf 0x309b)は0x30bf 0x20 0x3099となる。これって既に「ダ」(0x…