Источники списка слов

Я ищу источник существительных, наречий, прилагательных и глаголов на нескольких языках.

Я хотел бы, чтобы списки уже были разделены независимо и не имел бы для прохождения через OED (и неанглийские эквиваленты) рукой, воссоздающей, сказал списки.

Я действительно не забочусь об определениях, и я понимаю, что некоторые слова могут быть несколькими частями речи - это прекрасно - слова как "многие" могли быть существительным или прилагательным, и могут появиться в обоих списках.

Кто-либо здесь знает о таком источнике? В противном случае кто-то мог бы смочь указать на меня в правильном направлении?

Я соглашаюсь с форматом, являющимся любым из следующих (или подобный, если у людей есть идеи):

  • csv: <word>, noun (y/n), verb (y/n), adverb (y/n), adjective (y/n)
  • файлы простого текста как "существительные", "глаголы", и т.д.
  • mysql таблица
  • и т.д.
11
задан 13.12.2015, 14:57

3 ответа

Я использовал WordNet из Принстонского университета для некоторых проектов. Это - лексическая база данных на английском языке. Глобальный WordNet является расширением проекта, пытающегося сделать то же для всех языков.

Вы могли бы также интересоваться связанными проектами по http://wordnet.princeton.edu/wordnet/related-projects/

8
ответ дан 07.12.2019, 12:23

Это не может помочь вообще, я не знаю. Но MediaWiki имеет API для списка всех страниц, принадлежащих определенной категории. Вы могли попытаться использовать его на Wiktionary.org.

Примечания:

  • Каждый запрос только возвращает 500 результатов. Однако в конце, это также указывает параметр для использования в другом запросе для получения следующих 500 результатов.
  • Это включает все в указанную категорию, даже другие подкатегории.
  • Результаты, кажется, в алфавитном порядке, хотя все запускающееся с прописной буквы прибывает перед чем-либо в нижний регистр.

Примеры:

Надежда, которой это помогает, это - то, что я мог придумать.

4
ответ дан 07.12.2019, 12:23

Я буду предложение второго @teknikqa wordnet, но я предложил бы, чтобы Вы проверили их API;

STORYTIME: у Меня был курс AI, который имел аналитическую часть языка; я привык жемчуг wordnet API для автоматически поиска лучшие три типа определения, и классифицируйте формулировку от этого в КОНЦЕ псевдореального времени STORYTIME

Существует API там для большого количества языков

К вашему сведению: проект добрался +

1
ответ дан 07.12.2019, 12:23

Теги

Похожие вопросы