Существует ли открытое sourc/коммерческое программное обеспечение, которое может выполнить автоматический контент-анализ (для создания желательных сводок) в большом количестве документов PDF, которые отметили метаданные для легкой классификации? То, что использует технологический Google, должно проанализировать размещенный сетью PDF и оценить их?
Я не уверен, что использует Google, но возможно считать и создать серверную сторону документов в формате PDF с компонентом программного обеспечения, таким как ABCpdf.NET. Это требует некоторого знания программирования в ASP или ASP.NET (Активные Страницы Сервера) для серверов Microsoft IIS или PHP для веб-серверов Apache.