[前][次][番号順一覧][スレッド一覧]

ruby-reference-manual:3795

From: "okkez (okkez _)" <redmine@r...>
Date: Mon, 2 Sep 2013 18:09:10 +0900
Subject: [ruby-reference-manual:3795] [るりまプロジェクト - Bug #4972][Closed] BOM 付き UTF-8 の CSV の扱い


Issue #4972 has been updated by okkez (okkez _).

Status changed from Open to Closed
% Done changed from 0 to 100

CSV.open のところに書いておきました。

----------------------------------------
Bug #4972: BOM 付き UTF-8 の CSV の扱い
https://bugs.ruby-lang.org/issues/4972#change-41537

Author: 5.5 (5 5)
Status: Closed
Priority: Low
Assignee: 
Category: doc
Target version: 
reporter: 
ruby_version: 


Ruby 1.8 と Ruby 1.9 とでは,csv ライブラリが UTF-8 の CSV ファイルを読み込むときにバイト順マークをどう扱うかが違っているので,それをどこかに書く必要があると思います。

Ruby 1.8 では,CSV の先頭のバイト列 EF BB BF(U+FEFF)は無視します(そういうコードになっている)。

一方,Ruby 1.9 ではこれを特別扱いしないため,第1行第1列の値の先頭に U+FEFF が付いた状態で読み込まれます。
また,たとえば空文字列だけからなる 1 行 1 列の BOM 付き CSV データを表す EF BB BF 22 22 というバイト列を読み込むと,同様の理由で Illegal quoting on line 1. という例外が発生します。
原因が見つけにくいエラーです。


-- 
http://bugs.ruby-lang.org/

--
ML: ruby-reference-manual@m...
Info: http://QuickML.com/

[前][次][番号順一覧][スレッド一覧]

      2752 2011-07-04 09:35 [redmine@r...        ] [るりまプロジェクト - Bug #4972][Open] BOM 付き UTF-8 の CSV の扱い
      3762 2013-06-19 15:18 ┣[redmine@r...        ] [るりまプロジェクト - Bug #4972] BOM 付き UTF-8 の CSV の扱い
->    3795 2013-09-02 11:09 ┗[redmine@r...        ] [るりまプロジェクト - Bug #4972][Closed] BOM 付き UTF-8 の CSV の扱い