文字コードはUTF-8Nだ!

UTFにはUTF-8とUTF-8Nとがあるが、
UTF-8の方にはファイルの頭にBOMと呼ばれる
コード認識用のコードがついているらしい。


このせいで、csvファイルをテキストで読み込み、カンマで
splitすると、一番最初の要素は他に比べて2バイトくらい
大きかったりする。


マジやっかい。
ホントやられた。


コードを書くとき、データを扱うときは必ずUTF-8Nで!


UTF-8とUTF-8Nの違い - m o t d .
http://d.hatena.ne.jp/nack-jin/20071027/1193502112