UTF-8へのコード変換

コードを変換(UTF-8へ)

ubuntu(bash)において、拡張子が .html のファイルのエンコードをEUCからUTF-8へ変換する。

find -name "*.html" | xargs nkf --overwrite -w

文字コード

  • -j : ISO-2022-JP
  • -s : Shify-JIS
  • -e : EUC-JP
  • -w : UTF-8

(注)nkfのインストール方法は次の通り。

sudo apt-get install nkf

「charset=euc-jp」を含む行の削除

# 3行目を削除し上書き保存する
sed -i -e "3d" *.html

# 複数行を削除する場合の例
# 5~10行目を削除し上書き保存する
sed -i -e "5,10d" *.html

「charset=”UTF-8″」を追加

# 3行目に追加する
sed -i -e '3i <meta charset="utf-8">' *.html

# PHPのDOMを使用する場合は次のようにする
sed -i -e '3i <meta http-equiv="content-type" content="text/html; charset=utf-8" />' *.html

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA


This blog is kept spam free by WP-SpamFree.