ものがたり(旧)

atsushieno.hatenablog.com に続く

ちびりますと

id:Gimiteさんがまたやってくれました。lingrで動いてる自動翻訳ボットのDeborahにLingua::LanguageGuesserを組み込んで、原文の言語を推測できるようになったのです。つまり文末に「>中文」とか付けなくても良くなったわけですね。

記念撮影: http://f.hatena.ne.jp/atsushieno/20070227120127

しかしLanguageGuesserとはまたずいぶん面白いものがあるなあ。もしUCSベースであれば、CJKまわりの(というかC vs. J/K。というかCJKに限らず)高精度な判別がルールベースで出来そうなんだけど(↑の通り、現状では楽しいことになってくれる)。