У меня есть 20 страниц измерительных данных эксперимента, которые я должен оцифровать. Результаты находятся в табличной форме, просканированной в разрешении на 600 точек на дюйм, и насколько сканирования идут, они подошли довольно чистые и читаемые.
Вот пример того, как это смотрит:
... и мне нужен в законченный ко дню воскресенья (:-o) <-смайлик в состоянии паники
(затем, почему Вы не запустили раньше?)... да, да... Я знаю..., но, это подошло поздно, и я не думал, что собирался нуждаться в этих данных также.
Так, я ищу рекомендации. Я не имею большого опыта с программами OCR, сохраняю сканирование страницы или двух из чистого текста, но только упомянуть, у меня нет желания также для проверения каждой программы OCR там. Таким образом, это не "имя Ваш фаворит OCR".
То, что я смотрю, является советом от кого-то, кто сделал что-то как этот и его/ее опыт в том, что было бы лучшим способом предпринять.
Мне нужны данные в форме txt, но так как это должно будет быть проверено (путем рисования его и просто наблюдения, "выскакивают" ли некоторые точки), я буду, вероятно, вводить его в Excel сначала.
Я использовал обе страницы Omnipage и Finereader в прошлом ограниченно. По данным CNET:
"OmniPage Pro 12 Office успешно справился преобразования данных таблицы, не только закрепив содержание, но также и воспроизведя правильные шрифты и форматирование. С длинными фрагментами текста это совершило замечательно немного ошибок распознавания - гораздо меньше, чем ABBYY FineReader".
Примечание, OmniPage в версии 17 теперь, таким образом, я не знаю, какой между этими двумя лучше, но я предполагаю, что OmniPage сделал бы то, в чем Вы нуждаетесь.