Windowsを使ったり、FreeBSDを使ったり、javaを使ったり、DBMSを使ったり、WEBを使ったりしていると、いつも文字化けに悩まされる。
今まで主に悩まされていたのは、WindowsのMS932とShift_JISの違い(とそれぞれのUnicodeへの変換テーブルへの違い)だったのだが、今回他の文字化けもあることを知った。
きっかけは、「埈」や「鏞」を含むメールが来た事だ。(書いてるけど、読めないかも知れない・・・)
私は、FreeBSDでX上でemacsのWanderlustと言うメーラでメールを読んでいる。
上の文字を含むメールが、ここで見事に文字化けしてくれたのだ。
いろいろ調べてみた結果、「NEC特選IBM拡張文字」と言う領域の文字であることがわかった。
日本語 EUC ・シフト JIS 間コード変換仕様とコード系実態調査によると、他にも「NEC特殊文字」、「IBM拡張漢字」とか言うものがあるらしい。NEC特殊文字は、いわゆる○1とかで、以前から微妙に知ってはいたのだが、こんな危険領域があったとは・・・。
とりあえず、化ける原因まではわかったのだが、Windowsのメーラでこれらの文字が見れてしまう以上、Unixのメーラでも見れるようにできないものだろうか・・・。

カテゴリ

トラックバック(0)

このブログ記事を参照しているブログ一覧: 文字コードの海

このブログ記事に対するトラックバックURL: https://www.wizard-limit.net/cgi-bin/mt/mt-tb.cgi/560

コメントする

このブログ記事について

このページは、falseが2004年4月21日 17:52に書いたブログ記事です。

ひとつ前のブログ記事は「acidが動かない」です。

次のブログ記事は「Bフレッツ工事」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

広告

Powered by Movable Type 6.1.1