前回インストールしたZimbraのメールの文字コードについて眺めてみる。
Zimbraを使って適当なメールを送って、そのデータを調べてみることにする。
ヘッダーは以下の通り。
From: =?UTF-8?B?〜=
中略
Subject: =?utf-8?Q?Re:_=E6=97=A5=E6=9C=AC=E8=AA=9E=3F?=
MIME-Version: 1.0
Content-Type: text/plain; charset=utf-8
Content-Transfer-Encoing: quoted-printable
メール送信者、受信者、はutf-8のBエンコーディング。サブジェクトはutf-8のQエンコーディング。
、本文はutf-8のMIMEエンコード(quoted-printable)で送信されているように見える。
本文さ、utf-8で一文字あたり3〜4バイトになっている上にquoted-printableかけてあるから、漢字一文字あたり9〜12バイト!も使ってるの!?本来の2バイトコードから比べると6倍…
Zimbraのメインターゲットは北米だろうからさ、7bit文字を優遇する気持ちはわからないでもないんだけど、utf-8で50〜100%増し、quoted-printableで3倍はなかろうて。
しかもためしに本文をASCIIコードだけで書いてみると
Content-Type: text/plain; charset=utf-8
Content-Transfer-Encoding: 7bit
quoted-printable使ってない…そらあねえだろ…
だったら2バイトコードをquoted-printableでエンコードする必要無いじゃん…
1バイトコードを送るときは7bitなのに2バイトコードを送るときには12バイトっていうのはあまりにもひどいので、せめてBase64に変えてくれとDeveloper Forumへ書き込んでみよう。
参考サイト Web&Mail&Mac講座:エンコード・コレクション (メール、テキスト関連)
Related posts: