文字コードを指定して保存する

HTMLソースを保存する際、適切な文字コードで保存する必要があります。

■ UTF-8の文字コードを指定する

まずはメモ帳の4行目に文字コードを指定します。この指定が無くてもHPは表示されますが何の文字コードのファイルか判別しやすいため記述します。

HTMLソース

<!DOCTYPE html>
<html lang="ja">
<head>
<meta charset="UTF-8">
<title>HPのタイトル</title>
・
・
・

■ UTF-8でファイルを保存する

メモ帳の左上から「ファイル」→「名前を付けて保存」を選択します。するとメモ帳はtxt形式のファイルなのでファイル名の欄には *.txtと表示されており同様の形式のファイルが一覧に表示されてます。

ファイル名を入力しファイルの種類をテキスト文書で選択し保存するとテキストファイルとして保存されます。
ファイルの種類を「すべてのファイル」で選択すれば図の例ではドキュメント内のすべての種類のファイルが表示されます。

■ 文字コードの種類

文字コードとは文字に番号を割り当てたものです。
世界共通の文字コード規格のことを Unicode（ユニコード）といいます。
ファイル保存時、文字コードの種類には以下のものがあります。
通常はUTF-8形式を選択し保存します。

文字コード選択

文字コードの種類	説明
ANSI	シフトJISと同じ意味で日本語用の文字コードのこと
UTF-16 LE	LEはリトルエンディアンの略でユニコードの文字を別の形式のデータに変換すること 16進コードで「あ」　という文字は3042でUTF-16 LEではU+4230と前2つ、後ろ2つの数字の順番を入れ替えたデータで表します。
UTF-16 BE	BEはビッグエンディアンの略でユニコードの文字を別の形式のデータに変換すること 16進コードで「あ」　という文字は0x3042でUTF-16 BEではU+3042とそのままの順番でデータで表します。
UTF-8	ユニコード用の符号化方式の1つ。符号化方式とは文字集合（コンピュータ上で表示する文字や数字等の文字の集合）を符号化してコンピュータで使えるようにする変換方式です。メモ帳でのHPを作成する際はこの文字コードを選択するのが標準です。
UTF-8（BOM付き）	BOMとはバイトオーダーマークの略で先頭に0xEF 0xBB 0xBFの三バイトのデータが付いており「このファイルがUTF-8形式である」ことを識別するためのものです。上のUTF-8は（BOM無し）ということになります。

■ 文字化け

メタタグで指定した文字コードと保存時に選択した文字コードが一致しない場合図のような文字化けが起こるので注意が必要です。「こんにちは」と表示される筈が左の例はメモ帳でANSIを選択し保存してますがHTMLソースでUTF-8を指定しているためはてなマークが表示されてしまっています。
右の例はそれとは逆のパターンでの間違い例で漢字やカタカナに文字化けを起こしてしまっています。

ANSI (Shift_JIS)で保存	UTF-8で保存

<!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>日記</title> </head> <body> こんにちは </body> </html>	<!DOCTYPE html> <html> <head> <meta charset="Shift_JIS"> <title>日記</title> </head> <body> こんにちは </body> </html>

HTMLタグ一覧

Follow @hp_master_2003