Чем прочесть из С# pdf - файл?

Fofa

Как прочесть таблицу, начерченную в pdf-файле?
Первое, что приходит в голову — это преобразовать pdf в txt, а затем считывать, но есть проблемы с пустыми полями в таблицах. Например, есть таблица 4 на 4, там элемент, принадлежащий 2-ой строке и 3-му столбцу не прописан, при преобразовании в txt этого не видно. Как устранить проблему?
Желательно помочь примером кода.

kokoc88

Как прочесть таблицу, начерченную в pdf-файле?
Зависит от того, как она там начерчена. Попробуй http://itextpdf.com

Fofa

А пример кода есть какой-нибудь?

kokoc88

А пример кода есть какой-нибудь?
На сайте есть.

PooH

для начала определить стандарт для таблицы - т.е. правила расположения информации в ней (как выглядят пустые ячейки, как непустые, как раздаются строки и ячейки)
потом написать правила парсинга
это сильно зависит от структуры таблицы, соот-но какие-то общие методы тут сложно указать
Оставить комментарий
Имя или ник:
Комментарий: