トップページへのリンク(タイトル:Webpage innovation)

文字コードセット

文字化けしないページにするために、文字コードセットを把握する必要があります。文字コードセットを指定しておけば、ページが文字化けせずに済みます。

文字コードセットを指定するには、HTMLで<head>〜</head>間に

<meta http-equiv="Content-Type" content="text/html; charset=文字コード名">

とします。例えば、Shift_JIS(WindowsやMacで標準で利用されている形式)では、次のようになります。

<meta http-equiv="Content-Type" content="text/html; charset=shift_jis">

指定する文字コードセットの種類は次の通りです。

Shift_JIS

マイクロソフト社がJIS規格を拡張して作った文字コードセットです。Windows9xやMacintoshでの標準文字コードセットです。メモ帳などで作成した場合などに使います。

Shift_JISが正式名になる前のブラウザ(NN2.0など)では「x-sjis」と指定しました(その名残で最新のブラウザでもx-sjisと指定されるときちんとShift-JISで表示されますが、推奨されません)。

<meta http-equiv="Content-Type" content="text/html; charset=Shift_JIS">

ページを作成する環境はほとんどShift-JISですが、UNIXが主に使われているサーバーでは、UNIX標準のコードであるEUC-JPに変換されることがあります。例えば無料ホームページのYahoo!GeoCitiesのファイルマネージャ(ブラウザから直接HTMLを編集する機能)を使う場合などです。この場合は、あらかじめEUC-JPに指定しておくか、文字コードの指定をしない方がかえって文字化けしません。

EUC-JP(EUC)

UNIXでの標準文字コードセットです。

<meta http-equiv="Content-Type" content="text/html; charset=EUC-JP">

EUC-JPが正式名になる前のブラウザ(NN2.0など)では「x-euc-jp」と指定しました(これも非推奨ですね)。

ISO-2022-JP(JIS規格)

ISO(国際標準化機構)規格を元にJIS(日本工業規格)が定めた文字コードセットです。Eメールでの標準となっています。

<meta http-equiv="Content-Type" content="text/html; charset=ISO-2022-JP">

UTF-8(Unicode)

世界中の言語を一つのコード体系で表そうとしたものです。

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">

今後、文字コードセットはUnicodeに統一されていきますが、現時点ではまだ、Windows標準であるShift_JISが使われる機会が多いでしょう。