Поиск рекомендаций на проблеме OCR - табличные числовые данные

У меня есть 20 страниц измерительных данных эксперимента, которые я должен оцифровать. Результаты находятся в табличной форме, просканированной в разрешении на 600 точек на дюйм, и насколько сканирования идут, они подошли довольно чистые и читаемые.

Вот пример того, как это смотрит:

enter image description here

... и мне нужен в законченный ко дню воскресенья (:-o) <-смайлик в состоянии паники

(затем, почему Вы не запустили раньше?)... да, да... Я знаю..., но, это подошло поздно, и я не думал, что собирался нуждаться в этих данных также.

Так, я ищу рекомендации. Я не имею большого опыта с программами OCR, сохраняю сканирование страницы или двух из чистого текста, но только упомянуть, у меня нет желания также для проверения каждой программы OCR там. Таким образом, это не "имя Ваш фаворит OCR".

То, что я смотрю, является советом от кого-то, кто сделал что-то как этот и его/ее опыт в том, что было бы лучшим способом предпринять.

Мне нужны данные в форме txt, но так как это должно будет быть проверено (путем рисования его и просто наблюдения, "выскакивают" ли некоторые точки), я буду, вероятно, вводить его в Excel сначала.

2
задан 21.08.2011, 10:17

1 ответ

Я использовал обе страницы Omnipage и Finereader в прошлом ограниченно. По данным CNET:

"OmniPage Pro 12 Office успешно справился преобразования данных таблицы, не только закрепив содержание, но также и воспроизведя правильные шрифты и форматирование. С длинными фрагментами текста это совершило замечательно немного ошибок распознавания - гораздо меньше, чем ABBYY FineReader".

Примечание, OmniPage в версии 17 теперь, таким образом, я не знаю, какой между этими двумя лучше, но я предполагаю, что OmniPage сделал бы то, в чем Вы нуждаетесь.

1
ответ дан 12.12.2019, 00:29

Теги

Похожие вопросы