wizzard: (Default)
wizzard ([personal profile] wizzard) wrote2009-09-20 05:18 pm

the hell of CSV

эта пиздец. есть хороший legacy формат CSV (таблица в форме значений, разделенных запятыми)
все просто и красиво.

только вот она бывает в произвольной кодировке, числа бывают с "." и с ",", элементы строки разделяются "," или ";" или “\r”, строки запихиваются в ' или " или вообще не запихиваются в кавычки, кавычки внутри строк превращаются в ", "", \" или кавычки-елочку, числа кстати тоже иногда пихаются в кавычки, а еще переводы строк бывают \r \n \r\n и unicode LS\PS.

вот так-то.

[identity profile] lionet.livejournal.com 2009-09-20 02:25 pm (UTC)(link)
RFC4180 адресует часть указанных проблем.