экранный скребок обрабатывает по шаблону для различных веб-сайтов

Я ищу именно удобный способ локально заархивировать сообщения от этого и других подобных сайтов. Я хотел бы разделить сам вопрос от ответов, или возможно обрезать вопрос и сохранить его, сохраняя название страницы. Очевидно, я не должен хранить меню или различный другой хром интерфейса сайта.

Лучший способ сделать это, казалось бы, было бы для соединения шаблона XSLT с соответствием на URL и использовании, которые обрабатывают по шаблону, чтобы вытянуть различную соответствующую информацию и отформатировать их.

Мой вопрос с двумя частями:

  • Существует ли инструмент, конкретно созданный для этой задачи? Т.Е. что-то, что берет URL и проверяет его по карте соответствующих пути выражений к шаблонам, и производит результат применения шаблона к тому ресурсу?

    xmlto, кажется, большая часть пути там и мог, вероятно, просто быть назван из сценария, который делает сопоставление с образцом, но что-то уже интегрировалось, будет более удобным.

  • Действительно ли такая карта URL_pattern-to-XSLT_template общедоступна где-нибудь?

Вопрос 2.5: действительно ли законно сделать это с сайтами как этот, которые имеют общедоступные лицензии на их содержании?

1
задан 21.07.2010, 23:00

1 ответ

Ответьте для опроса 2.5:

Законно, если Вы не распределяете или публикуете его всегда. И если Вы делаете, необходимо обратиться к исходной странице. Большая часть сайта поддерживает лицензию на основе пользовательских вкладов, лицензируемых при cc-wiki с требуемой атрибуцией.

0
ответ дан 24.11.2019, 01:47

Теги

Похожие вопросы