📋

Конвертер PDF в CSV

Извлеките таблицу из PDF в CSV: с превью таблицы на странице, разделитель — запятая, кодировка UTF-8 с BOM для корректной работы в Excel

Загрузка инструмента...

PDF в CSV онлайн — извлечь таблицу из пдф бесплатно

Бесплатный онлайн-инструмент извлекает таблицы из PDF в формат CSV (Comma Separated Values). CSV — это универсальный формат для табличных данных, который открывается в Microsoft Excel, Google Sheets, Apple Numbers, LibreOffice Calc, импортируется в CRM (Bitrix24, amoCRM), 1С, базы данных PostgreSQL/MySQL, Python pandas и Power BI. Превью таблицы видно прямо на странице — сразу понятно, корректно ли распарсены колонки.

Под капотом — двухшаговый процесс. Сначала Poppler (pdftotext с флагом -layout) извлекает текст из PDF, сохраняя положение колонок через пробелы. Затем парсер делит каждую строку на ячейки по последовательностям из 2+ пробелов и формирует CSV с правильным экранированием — запятые внутри ячеек заворачиваются в двойные кавычки. Кодировка UTF-8 с BOM — Excel корректно покажет кириллицу.

  • Превью таблицы прямо на странице — видно, как распарсились колонки
  • Поддержка PDF до 50 МБ — банковские выписки, прайсы, отчёты, табели, сметы
  • Кодировка UTF-8 с BOM — Microsoft Excel правильно показывает русский без «кракозябр»
  • Разделитель — запятая со стандартным экранированием (RFC 4180)
  • Файлы автоматически удаляются с сервера через 15 минут
  • Без регистрации, без водяных знаков, без ограничения количества файлов в день

Когда нужно перевести пдф в csv

Самый частый сценарий — импорт банковской выписки. Банки выгружают выписки в PDF, но чтобы загрузить в 1С, в личный кабинет налоговой или в учётную систему — нужен CSV или Excel. CSV — универсальнее: его принимают абсолютно все системы, тогда как XLSX поддерживается не везде. Конвертация pdf в csv за пару секунд превращает «закрытый» документ в открытые табличные данные.

Второй сценарий — импорт прайс-листов в CRM или интернет-магазин. Поставщики часто присылают цены в PDF, а вашей системе нужно получать данные через CSV-импорт. Конвертер pdf в csv стал стандартом workflow «обновление каталога»: PDF → CSV → импорт в админку.

Третий сценарий — анализ данных в Python/R. Pandas, NumPy и стандартные библиотеки прекрасно работают с CSV (`pd.read_csv()`), но не с PDF напрямую. Когда вам нужно построить дашборд, посчитать статистику или загрузить в Google BigQuery — данные должны быть в CSV. Перевод pdf в csv — первый шаг.

Четвёртый сценарий — миграция между системами. Старая CRM выгружает контрагентов в PDF-отчёт, новая принимает только CSV-импорт. Конвертация решает проблему за минуту вместо ручной перепечатки сотен записей.

    Что важно знать про конвертацию PDF в CSV

    Качество результата зависит от того, как сделан исходный PDF. Если в PDF есть «настоящие» таблицы (выгрузка из 1С, экспорт из Excel или базы данных), конвертация работает почти идеально — колонки и строки переносятся в .csv с правильной структурой. Цифры остаются цифрами, текст — текстом, разделители — запятыми.

    Если в PDF таблицы свёрстаны как картинки (скриншот таблицы или отсканированный документ) — обычный конвертер pdf в csv не сможет извлечь данные. Текст внутри картинки нужно сначала распознать через OCR. Для сканов используйте отдельный инструмент распознавания, а уже потом — конвертацию в CSV.

    Сложная вёрстка с объединёнными ячейками, многоуровневыми заголовками и вложенными таблицами может конвертироваться неточно — это ограничение всех простых конвертеров pdf to csv. Простые таблицы (банковская выписка, прайс, отчёт по продажам, табель, контрагенты) — переводятся стабильно и аккуратно.

    Кодировка UTF-8 с BOM. В отличие от обычного UTF-8, версия с BOM (Byte Order Mark — невидимый префикс в начале файла) корректно распознаётся Microsoft Excel при двойном клике. Без BOM Excel может показать русский язык как «кракозябры». Наш инструмент добавляет BOM при скачивании — никаких настроек не нужно, просто открываете в Excel и работаете.

      📋

      История Лилии: каталог поставщика в Bitrix24

      Лилия — менеджер интернет-магазина детских товаров. Каждые две недели поставщик присылает обновлённый прайс на 1500 позиций — в PDF. Импорт в Bitrix24 принимает только CSV или Excel. Раньше Лилия копировала из PDF в Excel вручную — это 3 часа на каждое обновление прайса.

      1

      Открыла toolfox.ru/tools/pdf-to-csv

      2

      Перетащила PDF прайса (4,7 МБ, 28 страниц)

      3

      Через 2 секунды увидела превью таблицы — все колонки распарсились корректно (артикул, название, цена опт, цена розница, остатки)

      4

      Скачала CSV, открыла в Excel — текст был корректный (BOM сработал)

      5

      Загрузила CSV в Bitrix24 через стандартный импорт каталога — 1500 товаров обновились за минуту

      Раньше — 3 часа ручной работы каждые 2 недели (78 часов в год). Теперь — 5 минут (13 часов в год). Сэкономила 65 часов рабочего времени и больше нет человеческих ошибок при копировании цен.

      🧠

      Знаете ли вы?

      📅

      Формат CSV изобретён в 1972 году в IBM — компьютеры тогда работали с текстом построчно, и запятая стала естественным разделителем колонок. Это один из самых старых форматов данных, которые активно используются и сегодня.

      🔬

      Стандарт RFC 4180 (2005) формально описывает CSV: запятая как разделитель, двойные кавычки для экранирования, перенос строки между записями. Но в России и Германии часто используется точка с запятой — потому что запятая там — десятичный разделитель.

      📊

      Знаменитая «проблема CSV в Excel»: если открыть файл двойным кликом, Excel определяет кодировку по системным настройкам, и UTF-8 без BOM показывается как «кракозябры». Решение — добавить BOM в начало файла. Наш конвертер делает это автоматически.

      ⚙️

      Pandas в Python загружает CSV в DataFrame буквально одной строкой: `pd.read_csv("file.csv")`. Это превратило CSV в стандартный формат для научных вычислений и машинного обучения.

      💡

      Excel или CSV — что выбрать?

      CSV — простой текст с запятыми, открывается везде: Excel, Google Sheets, Numbers, Python, базы данных, 1С, любая CRM. Подходит для импорта данных и обмена между системами. Excel (XLSX) — формат Microsoft с поддержкой формул, графиков, нескольких листов и форматирования. Подходит для непосредственной работы с данными в Excel/Calc. Если нужна универсальность — берите CSV. Если хотите сразу формулы и оформление — Excel. У нас есть оба инструмента: PDF→Excel и PDF→CSV.

      Как извлечь таблицу из PDF в CSV — пошаговая инструкция

      1

      Загрузите PDF

      Перетащите PDF в зону загрузки или нажмите на неё и выберите файл с компьютера. Принимаем документы до 50 МБ.

      2

      Нажмите «Конвертировать в CSV»

      PDF загрузится на сервер и обработается в два шага: pdftotext извлечёт текст с сохранением колонок, парсер разделит на ячейки по 2+ пробелам и сформирует CSV. На один документ уходит 1–3 секунды.

      3

      Проверьте превью таблицы

      CSV отображается на странице как таблица — сразу видно, правильно ли распарсились колонки. Если строки разъехались, можно вручную поправить в Excel после скачивания.

      4

      Скачайте или скопируйте

      «Скачать CSV» сохраняет .csv с BOM — открывается в Excel без проблем. «Скопировать всё» кладёт CSV-текст в буфер обмена — можно сразу вставить в Google Sheets или код-редактор.

      Примеры использования конвертера PDF в CSV

      Импорт банковской выписки в 1С

      Банк прислал месячную выписку в PDF. 1С принимает только CSV или специальные форматы. Конвертировали pdf в csv, импортировали в раздел «Банк и касса». Все 250 транзакций распознались автоматически с привязкой к контрагентам.

      Обновление прайса в магазине

      Поставщик прислал новый прайс на 2000 позиций в PDF. Перевели pdf в csv, проверили превью таблицы, импортировали в админку магазина (Битрикс/InSales/Tilda). Цены обновились за 5 минут вместо ручной правки.

      Анализ данных в Python

      Получили отчёт по продажам в PDF. Преобразовали pdf в csv, в Python: `pd.read_csv("sales.csv")`, построили графики через matplotlib, посчитали статистику. С PDF напрямую такое сделать сложнее — pandas с PDF не работает.

      Миграция контактов в новую CRM

      Старая CRM выгрузила базу клиентов в PDF на 50 страниц. Новая принимает только CSV-импорт. Конвертировали pdf в csv, проверили колонки в превью, импортировали 800 контактов одним файлом — миграция за 10 минут.

      Часто задаваемые вопросы про конвертер PDF в CSV

      Как извлечь таблицу из pdf в csv бесплатно?
      Перетащите PDF-файл в окно загрузки или нажмите на него и выберите файл с компьютера. Затем нажмите «Конвертировать в CSV» — через секунду получите готовую таблицу с превью прямо на странице. Можете сразу скопировать в буфер или скачать как .csv. Бесплатно, без регистрации.
      Корректно ли откроется CSV в Microsoft Excel?
      Да. Мы добавляем BOM (Byte Order Mark) в начало файла — это специальный невидимый префикс, который Excel использует для определения кодировки UTF-8. Без BOM Excel показывает русский язык как «кракозябры» (é, ©). С BOM — открывается правильно при двойном клике, никаких настроек не нужно.
      Какой разделитель используется?
      Запятая (стандарт RFC 4180). Если в значении ячейки встречается запятая или перенос строки — ячейка автоматически заворачивается в двойные кавычки, а кавычки внутри значения экранируются удвоением (`""`). Это стандарт CSV, который понимают Excel, Google Sheets, Numbers, Python pandas, R, импорт в БД.
      Можно ли извлечь таблицу из сканированного PDF?
      Если PDF — это скан или фотография таблицы, текст хранится как картинка. Обычный конвертер pdf в csv не сможет извлечь данные — он видит «картинку», а не «цифры». Для сканов нужен OCR (распознавание текста). У нас есть отдельный инструмент распознавания: сначала прогоните скан через OCR, потом — через конвертер в CSV.
      Сохранится ли структура таблиц со сложной вёрсткой?
      Простые таблицы с одним уровнем заголовков и без объединённых ячеек переводятся почти идеально. Сложные таблицы (объединённые ячейки, многоуровневые заголовки, вложенные таблицы) могут конвертироваться неточно — может потребоваться немного причесать результат вручную в Excel или Google Sheets. Чем «прямее» таблица — тем точнее результат.
      Какой максимальный размер PDF можно загрузить?
      До 50 МБ. Этого хватает на банковскую выписку за несколько лет, на каталог из тысяч товаров, на крупный отчёт. Если файл больше — попробуйте сжать его инструментом «Сжать PDF» или разделить на части.
      Безопасно ли загружать сюда мои документы?
      Файл загружается на сервер, конвертируется и через 15 минут автоматически удаляется. Доступ к загруженным файлам имеет только сервис конвертации, никому не передаётся. Если документ содержит конфиденциальные данные (банковские реквизиты, паспортные данные) — рекомендуем использовать офлайн-инструменты вроде Excel 365 (он умеет получать данные из PDF через «Получить данные → Из файла → Из PDF»).
      В чём разница между pdf-в-csv и pdf-в-excel?
      Excel (XLSX) — формат Microsoft с поддержкой формул, форматирования, нескольких листов, графиков. CSV — простой текстовый формат, только данные без формул и оформления. CSV универсальнее (его понимают все системы), Excel — мощнее. Если нужно сразу работать с цифрами в Excel — выбирайте PDF→Excel. Если нужно импортировать данные в CRM, БД, Python, Google Sheets — выбирайте PDF→CSV.

      Полезная информация

      🔒 Конфиденциальность. Файл удаляется с сервера через 15 минут после загрузки. Ни один сотрудник не открывает ваши документы вручную — обработку делает программа автоматически.

      📋 Совет. Если в превью видно что строки разъехались (типичная проблема со сложной вёрсткой PDF) — скачайте CSV и поправьте вручную в Excel. Обычно нужно 2–3 минуты на «причёсывание» 100 строк.

      ✅ Excel совместимость. Мы добавляем BOM в начало файла — Excel правильно покажет русский язык при двойном клике без «кракозябр».

      ⚡ Скорость. Документы до 50 страниц с таблицами конвертируются за 1–3 секунды. Большие отчёты (200+ страниц) — до 10 секунд.

      Комментарии (1)

      Был ли полезен этот инструмент?
      Руслан Авдеев (автор проекта)1 янв. 2024 г., 00:00
      🎉 Спасибо, что используете наши инструменты! Все инструменты на ToolFox полностью бесплатны и постоянно улучшаются. 📝 Пожалуйста, оставляйте комментарии: - Если инструмент работает некорректно - Если есть идеи по улучшению - Поделитесь своим опытом использования 👍 Ставьте лайки/дизлайки - это помогает мне понять, какие инструменты нуждаются в доработке. Я обновляю сайт каждую неделю на основе вашей обратной связи. ⭐ Если вам нравится ToolFox — буду благодарен за отзыв о сайте в Яндекс.Браузере (нажмите на ⋮ → «Оценить сайт» в панели браузера). Это помогает другим людям находить наши инструменты! 😊 Также вы можете написать мне напрямую в Telegram: @avdeevrus Все доработки и улучшения по вашим пожеланиям делаю бесплатно! Благодарю за доверие и использование ToolFox! 🚀

      📋Похожие инструменты

      🔷

      Конвертер PDF в SVG

      Конвертируйте PDF в векторный SVG-файл: масштабируется без потери качества, идеально для дизайнеров, веб-разработчиков и печати

      Перейти к инструменту →
      🗄️

      Конвертер PDF в TIFF

      Конвертируйте PDF в TIFF — стандарт для архивации документов и типографской печати. Качество 150/200/300 DPI

      Перейти к инструменту →
      🖌️

      Конвертер PDF в BMP

      Конвертируйте PDF в BMP — Windows-формат картинки без сжатия для старых программ, плоттеров и встраиваемых систем

      Перейти к инструменту →
      🔗

      Объединить PDF

      Объединяйте несколько PDF-файлов в один документ: задайте порядок страниц стрелками, до 20 файлов за раз, без регистрации

      Перейти к инструменту →
      📉

      Сжать PDF

      Уменьшайте размер PDF-файла в 2–10 раз без потери читаемости: 3 уровня сжатия, до 100 МБ, без регистрации

      Перейти к инструменту →
      ✂️

      Разделить PDF

      Разбивайте PDF на отдельные страницы или извлекайте конкретный диапазон: каждая страница — отдельный файл, ZIP-архив на выходе

      Перейти к инструменту →
      🔄

      Повернуть PDF

      Поворачивайте страницы PDF на 90°, 180° или 270°: повернуть весь документ или только определённые страницы

      Перейти к инструменту →
      🗑️

      Удалить страницы PDF

      Удаляйте ненужные страницы из PDF: укажите номера или диапазоны (1-3, 5, 7-10), получите PDF без них

      Перейти к инструменту →