Конвертер PDF в CSV
Извлеките таблицу из PDF в CSV: с превью таблицы на странице, разделитель — запятая, кодировка UTF-8 с BOM для корректной работы в Excel
PDF в CSV онлайн — извлечь таблицу из пдф бесплатно
Бесплатный онлайн-инструмент извлекает таблицы из PDF в формат CSV (Comma Separated Values). CSV — это универсальный формат для табличных данных, который открывается в Microsoft Excel, Google Sheets, Apple Numbers, LibreOffice Calc, импортируется в CRM (Bitrix24, amoCRM), 1С, базы данных PostgreSQL/MySQL, Python pandas и Power BI. Превью таблицы видно прямо на странице — сразу понятно, корректно ли распарсены колонки.
Под капотом — двухшаговый процесс. Сначала Poppler (pdftotext с флагом -layout) извлекает текст из PDF, сохраняя положение колонок через пробелы. Затем парсер делит каждую строку на ячейки по последовательностям из 2+ пробелов и формирует CSV с правильным экранированием — запятые внутри ячеек заворачиваются в двойные кавычки. Кодировка UTF-8 с BOM — Excel корректно покажет кириллицу.
- Превью таблицы прямо на странице — видно, как распарсились колонки
- Поддержка PDF до 50 МБ — банковские выписки, прайсы, отчёты, табели, сметы
- Кодировка UTF-8 с BOM — Microsoft Excel правильно показывает русский без «кракозябр»
- Разделитель — запятая со стандартным экранированием (RFC 4180)
- Файлы автоматически удаляются с сервера через 15 минут
- Без регистрации, без водяных знаков, без ограничения количества файлов в день
Когда нужно перевести пдф в csv
Самый частый сценарий — импорт банковской выписки. Банки выгружают выписки в PDF, но чтобы загрузить в 1С, в личный кабинет налоговой или в учётную систему — нужен CSV или Excel. CSV — универсальнее: его принимают абсолютно все системы, тогда как XLSX поддерживается не везде. Конвертация pdf в csv за пару секунд превращает «закрытый» документ в открытые табличные данные.
Второй сценарий — импорт прайс-листов в CRM или интернет-магазин. Поставщики часто присылают цены в PDF, а вашей системе нужно получать данные через CSV-импорт. Конвертер pdf в csv стал стандартом workflow «обновление каталога»: PDF → CSV → импорт в админку.
Третий сценарий — анализ данных в Python/R. Pandas, NumPy и стандартные библиотеки прекрасно работают с CSV (`pd.read_csv()`), но не с PDF напрямую. Когда вам нужно построить дашборд, посчитать статистику или загрузить в Google BigQuery — данные должны быть в CSV. Перевод pdf в csv — первый шаг.
Четвёртый сценарий — миграция между системами. Старая CRM выгружает контрагентов в PDF-отчёт, новая принимает только CSV-импорт. Конвертация решает проблему за минуту вместо ручной перепечатки сотен записей.
Что важно знать про конвертацию PDF в CSV
Качество результата зависит от того, как сделан исходный PDF. Если в PDF есть «настоящие» таблицы (выгрузка из 1С, экспорт из Excel или базы данных), конвертация работает почти идеально — колонки и строки переносятся в .csv с правильной структурой. Цифры остаются цифрами, текст — текстом, разделители — запятыми.
Если в PDF таблицы свёрстаны как картинки (скриншот таблицы или отсканированный документ) — обычный конвертер pdf в csv не сможет извлечь данные. Текст внутри картинки нужно сначала распознать через OCR. Для сканов используйте отдельный инструмент распознавания, а уже потом — конвертацию в CSV.
Сложная вёрстка с объединёнными ячейками, многоуровневыми заголовками и вложенными таблицами может конвертироваться неточно — это ограничение всех простых конвертеров pdf to csv. Простые таблицы (банковская выписка, прайс, отчёт по продажам, табель, контрагенты) — переводятся стабильно и аккуратно.
Кодировка UTF-8 с BOM. В отличие от обычного UTF-8, версия с BOM (Byte Order Mark — невидимый префикс в начале файла) корректно распознаётся Microsoft Excel при двойном клике. Без BOM Excel может показать русский язык как «кракозябры». Наш инструмент добавляет BOM при скачивании — никаких настроек не нужно, просто открываете в Excel и работаете.
История Лилии: каталог поставщика в Bitrix24
Лилия — менеджер интернет-магазина детских товаров. Каждые две недели поставщик присылает обновлённый прайс на 1500 позиций — в PDF. Импорт в Bitrix24 принимает только CSV или Excel. Раньше Лилия копировала из PDF в Excel вручную — это 3 часа на каждое обновление прайса.
Открыла toolfox.ru/tools/pdf-to-csv
Перетащила PDF прайса (4,7 МБ, 28 страниц)
Через 2 секунды увидела превью таблицы — все колонки распарсились корректно (артикул, название, цена опт, цена розница, остатки)
Скачала CSV, открыла в Excel — текст был корректный (BOM сработал)
Загрузила CSV в Bitrix24 через стандартный импорт каталога — 1500 товаров обновились за минуту
Раньше — 3 часа ручной работы каждые 2 недели (78 часов в год). Теперь — 5 минут (13 часов в год). Сэкономила 65 часов рабочего времени и больше нет человеческих ошибок при копировании цен.
Знаете ли вы?
Формат CSV изобретён в 1972 году в IBM — компьютеры тогда работали с текстом построчно, и запятая стала естественным разделителем колонок. Это один из самых старых форматов данных, которые активно используются и сегодня.
Стандарт RFC 4180 (2005) формально описывает CSV: запятая как разделитель, двойные кавычки для экранирования, перенос строки между записями. Но в России и Германии часто используется точка с запятой — потому что запятая там — десятичный разделитель.
Знаменитая «проблема CSV в Excel»: если открыть файл двойным кликом, Excel определяет кодировку по системным настройкам, и UTF-8 без BOM показывается как «кракозябры». Решение — добавить BOM в начало файла. Наш конвертер делает это автоматически.
Pandas в Python загружает CSV в DataFrame буквально одной строкой: `pd.read_csv("file.csv")`. Это превратило CSV в стандартный формат для научных вычислений и машинного обучения.
Excel или CSV — что выбрать?
CSV — простой текст с запятыми, открывается везде: Excel, Google Sheets, Numbers, Python, базы данных, 1С, любая CRM. Подходит для импорта данных и обмена между системами. Excel (XLSX) — формат Microsoft с поддержкой формул, графиков, нескольких листов и форматирования. Подходит для непосредственной работы с данными в Excel/Calc. Если нужна универсальность — берите CSV. Если хотите сразу формулы и оформление — Excel. У нас есть оба инструмента: PDF→Excel и PDF→CSV.
Как извлечь таблицу из PDF в CSV — пошаговая инструкция
Загрузите PDF
Перетащите PDF в зону загрузки или нажмите на неё и выберите файл с компьютера. Принимаем документы до 50 МБ.
Нажмите «Конвертировать в CSV»
PDF загрузится на сервер и обработается в два шага: pdftotext извлечёт текст с сохранением колонок, парсер разделит на ячейки по 2+ пробелам и сформирует CSV. На один документ уходит 1–3 секунды.
Проверьте превью таблицы
CSV отображается на странице как таблица — сразу видно, правильно ли распарсились колонки. Если строки разъехались, можно вручную поправить в Excel после скачивания.
Скачайте или скопируйте
«Скачать CSV» сохраняет .csv с BOM — открывается в Excel без проблем. «Скопировать всё» кладёт CSV-текст в буфер обмена — можно сразу вставить в Google Sheets или код-редактор.
Примеры использования конвертера PDF в CSV
Импорт банковской выписки в 1С
Банк прислал месячную выписку в PDF. 1С принимает только CSV или специальные форматы. Конвертировали pdf в csv, импортировали в раздел «Банк и касса». Все 250 транзакций распознались автоматически с привязкой к контрагентам.
Обновление прайса в магазине
Поставщик прислал новый прайс на 2000 позиций в PDF. Перевели pdf в csv, проверили превью таблицы, импортировали в админку магазина (Битрикс/InSales/Tilda). Цены обновились за 5 минут вместо ручной правки.
Анализ данных в Python
Получили отчёт по продажам в PDF. Преобразовали pdf в csv, в Python: `pd.read_csv("sales.csv")`, построили графики через matplotlib, посчитали статистику. С PDF напрямую такое сделать сложнее — pandas с PDF не работает.
Миграция контактов в новую CRM
Старая CRM выгрузила базу клиентов в PDF на 50 страниц. Новая принимает только CSV-импорт. Конвертировали pdf в csv, проверили колонки в превью, импортировали 800 контактов одним файлом — миграция за 10 минут.
Часто задаваемые вопросы про конвертер PDF в CSV
Как извлечь таблицу из pdf в csv бесплатно?
Корректно ли откроется CSV в Microsoft Excel?
Какой разделитель используется?
Можно ли извлечь таблицу из сканированного PDF?
Сохранится ли структура таблиц со сложной вёрсткой?
Какой максимальный размер PDF можно загрузить?
Безопасно ли загружать сюда мои документы?
В чём разница между pdf-в-csv и pdf-в-excel?
Полезная информация
🔒 Конфиденциальность. Файл удаляется с сервера через 15 минут после загрузки. Ни один сотрудник не открывает ваши документы вручную — обработку делает программа автоматически.
📋 Совет. Если в превью видно что строки разъехались (типичная проблема со сложной вёрсткой PDF) — скачайте CSV и поправьте вручную в Excel. Обычно нужно 2–3 минуты на «причёсывание» 100 строк.
✅ Excel совместимость. Мы добавляем BOM в начало файла — Excel правильно покажет русский язык при двойном клике без «кракозябр».
⚡ Скорость. Документы до 50 страниц с таблицами конвертируются за 1–3 секунды. Большие отчёты (200+ страниц) — до 10 секунд.
Комментарии (1)
📋Похожие инструменты
Конвертер PDF в SVG
Конвертируйте PDF в векторный SVG-файл: масштабируется без потери качества, идеально для дизайнеров, веб-разработчиков и печати
Конвертер PDF в TIFF
Конвертируйте PDF в TIFF — стандарт для архивации документов и типографской печати. Качество 150/200/300 DPI
Конвертер PDF в BMP
Конвертируйте PDF в BMP — Windows-формат картинки без сжатия для старых программ, плоттеров и встраиваемых систем
Объединить PDF
Объединяйте несколько PDF-файлов в один документ: задайте порядок страниц стрелками, до 20 файлов за раз, без регистрации
Сжать PDF
Уменьшайте размер PDF-файла в 2–10 раз без потери читаемости: 3 уровня сжатия, до 100 МБ, без регистрации
Разделить PDF
Разбивайте PDF на отдельные страницы или извлекайте конкретный диапазон: каждая страница — отдельный файл, ZIP-архив на выходе
Повернуть PDF
Поворачивайте страницы PDF на 90°, 180° или 270°: повернуть весь документ или только определённые страницы
Удалить страницы PDF
Удаляйте ненужные страницы из PDF: укажите номера или диапазоны (1-3, 5, 7-10), получите PDF без них