Я хочу получить список всех слов из aspell словаря. Я загрузил aspell и словарь полировки aspell, затем разархивировал его использование:
preunzip pl.cwl
Я добрался pl.wl
:
...
hippie
hippies
hippiesowski/bXxYc
hippika/MNn
hippis/NOqsT
hippisiara/MnN
hippiska/mMN
hippisowski/bXxYc
...
но они появляются с суффиксом как /bXxYc
или /MNn
. Эти суффиксы определяются в pl_affix.dat
, который похож
...
SFX n Y 5
SFX n a 0 [^ij]a
SFX n ja yj [^aeijoóuy]ja
SFX n a 0 [aeijoóuy]ja
SFX n ia ij [^drt]ia
SFX n ia yj [drt]ia
...
Это подключено к наклону и спряжению. Как я могу добавить к первому списку все формы (со всеми соответствующими суффиксами, как определено в .dat
файл)?
BTW: Мне нужен этот список к программе проверки правописания jazzy
.
Дайте этому попытку:
aspell -d pl dump master | aspell -l pl expand > my.dict
Отредактированный для соответствия исправлениям в комментарии.