Где взять список слов языка (например, немецкого)?
Нужно перебрать все словосочетания языка. Идеально бы мне для этого иметьвсе реально возможные словосочетания, или просто пары слов?
во втором случае достаточно словаря с морфологией ( пример в первом — большого корпуса текстов (библиотека гутенберга для английского, lib.ru для русского). Либо http://ngrams.googlelabs.com/ .
ну погугли. в dictd наверное есть такие. может еще проще способы существуют.
гугель как-то выкладывал в свободный доступ список n-грамм по всем языкам, поищи, там и униграммы есть
словарь ожегова? короче тебе пойдёт любой орфографический словарь. потом выберешь оттуда слова целиком в нижнем регистре.
Слов в языке-то бесконечность, и абсолютное большинство словосочетаний некорректно или ни разу за пару миллиардов лет не встретится.
ЗЫ
Если чо, у меня где-то валялся разбитый на слова корпус Reuters.
гугель как-то выкладывал в свободный доступ список n-грамм по всем языкам, поищи, там и униграммы естьhttp://ngrams.googlelabs.com/datasets
спасибо, не видел.
На самом деле, мне таки-надо тысяч по 10 самых употребимых слов с каждого языка. Униграммы Гугла не осилю. Годятся и форматированные списки пословиц-поговорок-устойчивых словосочетаний.
Цель — составление числовых ребусов. Типа такого:
реши+если=силен.
Гуглограммы как раз то, что тебе надо.
Еще можешь тут чего-нибудь поискать.
Правда я че-то не могу понять, причем тут ребусы.
Оставить комментарий
Yzzi
Нужно перебрать все словосочетания языка. Идеально бы мне для этого иметь файл со списком всех слов через разделитель. Есть подобное воплощение в жизни?Языки — немецкий, французский, испанский, итальянский, английский, ... да вообще все человеческие интересны
UPD. По-немецки такое нашел.