2004年4月21日アーカイブ

Windowsを使ったり、FreeBSDを使ったり、javaを使ったり、DBMSを使ったり、WEBを使ったりしていると、いつも文字化けに悩まされる。
今まで主に悩まされていたのは、WindowsのMS932とShift_JISの違い(とそれぞれのUnicodeへの変換テーブルへの違い)だったのだが、今回他の文字化けもあることを知った。
きっかけは、「埈」や「鏞」を含むメールが来た事だ。(書いてるけど、読めないかも知れない・・・)
私は、FreeBSDでX上でemacsのWanderlustと言うメーラでメールを読んでいる。
上の文字を含むメールが、ここで見事に文字化けしてくれたのだ。
いろいろ調べてみた結果、「NEC特選IBM拡張文字」と言う領域の文字であることがわかった。
日本語 EUC ・シフト JIS 間コード変換仕様とコード系実態調査によると、他にも「NEC特殊文字」、「IBM拡張漢字」とか言うものがあるらしい。NEC特殊文字は、いわゆる○1とかで、以前から微妙に知ってはいたのだが、こんな危険領域があったとは・・・。
とりあえず、化ける原因まではわかったのだが、Windowsのメーラでこれらの文字が見れてしまう以上、Unixのメーラでも見れるようにできないものだろうか・・・。
2004年4月
        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30  

このアーカイブについて

このページには、2004年4月に書かれたブログ記事が新しい順に公開されています。

前のアーカイブは2004年4月18日です。

次のアーカイブは2004年4月22日です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

Powered by Movable Type 6.1.1