Оглавление
Значения, разделенные запятыми
-
Определение и использование CSV
- CSV (Comma Separated Values) – формат данных с разделителями, где поля разделены запятой, а строки – символами новой строки.
- Не требует определенной кодировки, порядка байтов или формата окончания строки.
- Записи должны содержать одинаковое количество полей и данные интерпретируются как символы, а не биты или байты.
-
Структура и правила CSV
- Поля могут быть заключены в двойные кавычки, если содержат запятые или двойные кавычки.
- Встроенные символы двойной кавычки должны быть представлены парой символов.
- Поля со встроенными переносами строк также должны быть заключены в кавычки.
- Начальные и конечные пробелы и табуляции могут быть обрезаны, что запрещено RFC 4180.
- Обработка двойными кавычками требуется только для полей, начинающихся с двойных кавычек, но не допускается в полях без кавычек.
-
Поддержка приложений и ограничения
- CSV используется многими приложениями для обмена данными и как внутренний формат.
- Электронные таблицы и системы управления базами данных поддерживают экспорт и импорт CSV.
- Некоторые реляционные базы данных позволяют сохранять результаты запросов в CSV-файл.
- Программное обеспечение в стиле Unix может обрабатывать простые CSV-файлы, но не корректно обрабатывает запятые и новые строки в строках в кавычках.
-
Ограничения программного обеспечения
- Microsoft Excel, Apple Numbers, Google Таблицы и другие программы имеют ограничения на количество строк и ячеек в CSV-файлах.
-
Рекомендации
- Для дальнейшего чтения предлагается описание файлов в формате ASCII с разделителями и без разделителей для передачи данных.
Полный текст статьи: