Я ищу источник существительных, наречий, прилагательных и глаголов на нескольких языках.
Я хотел бы, чтобы списки уже были разделены независимо и не имел бы для прохождения через OED (и неанглийские эквиваленты) рукой, воссоздающей, сказал списки.
Я действительно не забочусь об определениях, и я понимаю, что некоторые слова могут быть несколькими частями речи - это прекрасно - слова как "многие" могли быть существительным или прилагательным, и могут появиться в обоих списках.
Кто-либо здесь знает о таком источнике? В противном случае кто-то мог бы смочь указать на меня в правильном направлении?
Я соглашаюсь с форматом, являющимся любым из следующих (или подобный, если у людей есть идеи):
<word>, noun (y/n), verb (y/n), adverb (y/n), adjective (y/n)
Я использовал WordNet из Принстонского университета для некоторых проектов. Это - лексическая база данных на английском языке. Глобальный WordNet является расширением проекта, пытающегося сделать то же для всех языков.
Вы могли бы также интересоваться связанными проектами по http://wordnet.princeton.edu/wordnet/related-projects/
Это не может помочь вообще, я не знаю. Но MediaWiki имеет API для списка всех страниц, принадлежащих определенной категории. Вы могли попытаться использовать его на Wiktionary.org.
Примечания:
Примеры:
Надежда, которой это помогает, это - то, что я мог придумать.
Я буду предложение второго @teknikqa wordnet, но я предложил бы, чтобы Вы проверили их API;
STORYTIME: у Меня был курс AI, который имел аналитическую часть языка; я привык жемчуг wordnet API для автоматически поиска лучшие три типа определения, и классифицируйте формулировку от этого в КОНЦЕ псевдореального времени STORYTIME
Существует API там для большого количества языков
К вашему сведению: проект добрался +