[Я пиарюсь] Универсальная on-line проверка грамматики с помощью google

SCIF32

Я на хабре на главной, http://habrahabr.ru/blogs/i_am_advertising/77772/
Обычно я проверяю английскую грамматику, вбивая в Google куски фраз, и смотрю, что получится.
Если найдено много вариантов, то фраза правильная, если не очень много — то неправильная.

Вот, написал сервис
www.grammcheck.org,
который отсылает запросы в Google, а сам подсвечивает, «правильно», или «неправильно» написаны куски предложения, и местами даже подсказывает — какое слово можно поставить на то, или иное место в предложении.
Еще он показывает в каком именно контексте найдено слово.
Замечательно то, что ему все равно, какой язык вы проверяете.
Вы вводите фразу в текстовое поле, и проверка начинается автоматически. Проверяемая фраза отображается ниже поля ввода, а для некоторых слов предлагаются варианты. Красным подсвечиваются неподходящие слова.
Логика проверки правильности проста. Фраза разбивается на покрывающие ее кусочки, которые а далее проверяется. Например из фразы «маша очень любит сашу» мы получим в том числе кусочек «очень любит сашу». Для него будет два проверяющих запроса: «очень любит *» и «очень любит сашу». И если запрос «очень любит *» дает в тысячу раз больше ответов, чем «очень любит сашу», то значит, что «саша» тут не подходит, и надо выбрать какой-нибудь другой вариант.
При наведении на вариант, показывается контекст, в котором он встречается. Если на вариант кликнуть, то он заменит соответствующее слово в предложении. При наведении на слово в самой фразе показывается статистика по слову: сколько документов найдено по звездочке, а сколько по точному совпадению.

Моей серверной части вообще нету, то есть страничка написана исключительно на html+javascript.
Понятно, что грамматику она проверяет далеко не идеально, а иногда вообще не проверяет. Зато можно увидеть, хорошо или плохо сочетаются слова, удобным образом посмотреть статистику, обратить внимание на возможные нестыковки, найти другие сочетающиеся слова, или использовать еще для чего-нибудь.
P.S.
Еще у меня осталось несколько вопросов, касательно лицензионного соглашения google search api. (Читал английскую версию, т.к. русская чуть ли не google translate-ом написана)
1. обязательно ли ставить ссылку на сайт, на котором был найден контент (ровно таких строк не нашел, хотя ссылку и поставил)?
2. каковы ограничения по количеству (официально их нет, но очевидно, что должны быть. На каждую фразу из n слов у меня отслыается 2n+4 запросов. Кеширование в течении одной загрузки страницы у меня есть (правда пока нет сброса кеша, когда долго сидишь:) но это не спасет в целом.)
Изначально в сервисе не предполагалась возможность заходить на сайты с которых взят контент. Но по-моему такую возможность надо давать, поскольку чужие материалы все-таки используются, хоть и косвенно.
Пока что реализовать эту возможность так, чтобы она не портила интерфейс, мне не удалось.
Так что ссылки сделал, но кроме как с помощью tab-а, на них попасть нельзя :).

yroslavasako

http://grammcheck.org/#%E8%E7%E2%E5%ED%E8%F2%E5
у меня пустая ссылка. Сайт занёс в белый список noscript и request policy

sergey_m

Да, походу ссылку на него нельзя дать. Хотя сайт в строке броузера генерит ссылки при вводе слов.

SCIF32

вроде у меня работало - ссылки передавались
видимо форум что-то перекодировал,
 а что там за текст был?

SCIF32

test

lilia13

У меня передается.

yroslavasako

твой у меня передаётся. Но в общем случае - нет

sergey_m

Попробуем так ... У меня не передаётся. firefox.

yroslavasako

Попробуем так ... У меня не передаётся. firefox.
аналогично

vall

у тебя урл не в юникоде

lilia13

firefox
все ссылки треда - без проблем

SCIF32

колись, что там должно быть написано на русском? :)

sergey_m

"извените" :p

SCIF32

хм, в общем когда браузер пытается декодировать uri твоей ссылки, то вываливается с эксепшеном malformed uri sequence,
судя по всему, что действительно, у тебя uri кодируется не в unicode, и кодируется браузером.
попробую кодировать его самим js-om, чтобы получалась нормальная кодировка.
и наверное try-catch не decodeпоставлю...
спасибо

sergey_m

Я вообще хотел не это забагрепортить, а "извените" :)

SCIF32

ну оно начинает делать вид, что работает только с трех слов.
да и даже если что-то подсвечивает синим и красным - это ничего не значит, если по-честному.
просто можно обратить внимание на косяк в предложении :)

sergey_m

Ещё будет косяк из-за схожих языков с разной грамматикой. Например на украинском языке пресловутый мягкий знак в глаголах с частицей "ся" пишется не так, как в русском.

stm6695895

Обычно я проверяю английскую грамматику, вбивая в Google куски фраз, и смотрю, что получится.
Если найдено много вариантов, то фраза правильная, если не очень много — то неправильная.
Я тоже так делаю :)
Респект, хорошая задумка, думаю, сервис полезным будет (мне по кр мере

dangerr

Объясните мне, почему это надо делать в виде веб-приложения, а не в виде модуля для aspell/myspell например?

tamusyav

Потому что браузер есть у всех, кто читает форум :)

dangerr

и что?
Ну погляжу я на это поделие, впечатлюсь идеей...
Но не буду же я туда заходить как только мне понадобится проверить правописание.

Marinavo_0507

не работает в Mozilla/5.0 (X11; U; Linux i686 (x86_64); en-US; rv:1.8.1.19) Gecko/20081202
Firefox 2 то есть
набираю слово, и ничего не происходит
в опере работает

SCIF32

я никому ничего не навязываю :)
я вот сам пользуюсь гуглом для проверки, мне так удобно,
и знаю многих других таких людей, им наверное тоже удобно будет

SCIF32

Firefox 2 то есть
...
надо будет проверить под ним, да

vova213

С японским не работает.
Не получается ничего ввести - строка ввода сбрасывается почти сразу.
Если скопировать в строку ввода набранный в блокноте текст, то выдает фигню какую-то.
Это в гугль хроме так, в IE вводить получается, но ищет лажу.

Andbar

ваши хромы и ослы - гавно, в файрфоксе всё работает... правда с кандзи, похоже, не дружит.

dangerr

Причём здесь навязывание. Просто идея хорошая, но реализация - неудобная.

SCIF32

с японским проблема в том, что у меня не прописан для него диапазон utf8
я пытался сегодня найти, но не осилил,
еще мне давали ссылку на диапазон из стандарта unicode но я не осилил, как его перевести именно в utf8 (числа из диапазона явно больше)
времени, конечно на это много не тратил, может завтра сделаю

SCIF32

не в виде сайта это можно сделать только если иметь стационарный индекс частотности выражений.
его у меня нет и в ближайшем будущем не предвидится )

dangerr

А чём проблема при исправлении слова в тексте автоматически вести запрос к гуглу на частоту употребления?

doublemother

Лажает-с)

vall

такие слова в приличном интернете не употребляют

zloDEY

для орфографии есть грамота.ру
а вот постороение фразы хорошо подсказывает, удобно

vladi1

Я особо не тестил, но работоспособность проверил - вроде рабочая тема, зачот!

elenangel

к вопросу об именно построении фразы, а не грамматике
http://grammcheck.org/#all%20your%20base%20are%20belong%20to...

rotor89

Отличная штука, супер.
Классика :)
Оставить комментарий
Имя или ник:
Комментарий: