yandex: "запчасти от вазы" и "щас спаяю"

SCIF32

Как известно, лажи в поисковиках встречаются довольно часто, но именно эта преследует меня уже где-то год и на протяжении этого времени ситуация никак не изменилась.
щас спаяю
запчасти от вазы
Как вы уже догадались, дело даже не в том, что на такие дурацкие запросы яндекс все же дает какие-то ответы, предполагая что
в первом случае имеется ввиду ВАЗ, а во втором глагол "петь". Проблема в том, что обработка некоторых слов, которые пишутся похоже (но все же по-разному но имеют при этом абсолютно разный смысл, осуществляется некорректно.
И если мы попробуем поискать просто вазу, то опять же наткнемся на кучу сайтов с автомобилями, хотя слово "ваза" в смысле автомобиль не употребляется вовсе. (вдумайтесь в смысл словосочетания "тюнинг ваз")
Слово спаять в смысле "спеть" в принципе не употребляется. Конечно, "спаять" вообще несколько странное и часто не используется, но если мы попробуем найти что-нибудь вроде спаять микрофон,
то опять же получим страницы про то, как кто-то поет.

pitrik2

кажись это в раздел девелопмент
чтобы там народ придумал алгоритм и потом этот алгоритм продать яндексу :)

SCIF32

Чтобы конкретную проблему пофиксить, думаю ничего прогать не надо.
Скорее всего у них есть словари, отвечающие за морфологический анализ и т.п.,
которые надо поправить в соответствующих местах.
Эти словари видимо частично заполнялись автоматически и не проверялись в последствии экспертами, хотя следовало бы.
Мне просто интересно, может кто еще чего замечал необычного в поисковиках - о чем пока еще нигде не писали? :)

bestpilot8

Как хорошо юзать Нигму. Видишь, что яндекс тупит - отключаешь его нах. :)
"Щас спаяю" хорошо ищет гугл (т.е. находит фразу "щас спаяю"). На "запчастях от вазы", помимо яндекса, тупит рамблер. Остальные просто ничего не находят. :)

geja_03

У гугла вроде нет русской морфологии

kruzer25

тюнинг ваз
Тут не только яндекс, тут и человек не поймёт без дополнительных данных, вазы или ВАЗ имеется в виду. Точнее, человек решит, что в виду имеется именно ВАЗ (тюнинг автомобиля - это нормально, а тюнинг вазы - херня ккая-то).

bestpilot8

И правда, нету. :(

slonishka

Чтобы конкретную проблему пофиксить, думаю ничего прогать не надо.
Скорее всего у них есть словари, отвечающие за морфологический анализ и т.п.,которые надо поправить в соответствующих местах.Эти словари видимо частично заполнялись автоматически и не проверялись в последствии экспертами, хотя следовало бы.
честно говоря, я тут проблемы особой не вижу. "запчасти от вазы" — вполне корректный поисковый запрос, касающийся не только ваз, но и ВАЗов. а морфология — вообще штука тупая, в большинстве случаев, если оба слова есть в словаре, будут выданы обе начальные формы (ВАЗ и ваза а дальше уже алгоритм подсчета релевантности, который хз, как устроен.

slonishka

конечно, можно понять, посмотрев на структуру словосочетания и проверив падежи,
что в этом запросе имелись в виду вазы, а не ВАЗы. только я бы не сказал, что это просто.

nas1234

предлоги афаик почти не ищутся
во тебе пример
http://www.yandex.ru/yandsearch?text=%22%E7%E0%EF%F7%E0%F1%F...

SCIF32

про "запчасти от ваз" это так, ради шутки было :)
еще один баг в том, что фирмы платят за рекламу по объявлениям "ВАЗ",
а эта реклама показывается при вводе запросов про "хрустальные вазы"
конечно процент таких запросов не велик, но все равно - нехорошо получается.

SCIF32

как это нету?
http://www.google.ru/search?complete=1&hl=ru&q=%D0%B...
скорее всего просто приоритет точного совпадения больше

SCIF32

ну с "вазы" все понятно было и так,
а вот "ВАЗа" - это к примеру родительный падеж от "ВАЗ" :crazy:
так что тут действительно не все так просто...
да, получается у меня только один хороший пример - про щас спаяю

slonishka

еще один баг в том, что фирмы платят за рекламу по объявлениям "ВАЗ",а эта реклама показывается при вводе запросов про "хрустальные вазы" конечно процент таких запросов не велик, но все равно - нехорошо получается.
этот баг лечится, например, учетом тематики (которая засчет других слов в документе выходит). =)
кстати, пример еще более страшной пары слов: "вена/Вена". тут даже падежи не помогут, только тематики.
ну и еще дофига придумать можно, если со словарем посидеть.

juliuzz

punto.ru справляется немного лучше
[url=http://punto.ru/meta.php?engine=0&search_type=0&text=щас спаяю]щас спаяю[/url]
а вот с запчастями такая же ботва

bestpilot8

Собственно, из-за этих багов поиск в Нигме мне нравится куда больше любых других. %)
Они ещё недавно интерфейсик чуток исправили в сторону большей очевидности и функциональности.

ermsoft

!ваза
щас !спаяю
Учите синтаксис запросов, это сильно помогает жить :) Применительно к гуглю тоже, кстати.

SCIF32

и как нигма избавляетот проблем с поиском по запросу "магазин ваз" ?
багов с рекламой там понятно нет, т.к. и контекстной рекламы в ней нету.
А тот баг, что с рекламой в яндексе, судя по всему проблема тех, кто заказывает рекламу: им приходится платить не только за показ рекламы в нужном контексте. К пользователям поиска он мало какое отношение имеет.

SCIF32

да, согласен, это помогает жить.
но разве проблема была в этом?

apl13

!ваза
А теперь посмотри на рекламу в правой колонке. :lol:

bestpilot8

Магазины я в ней ни разу не искал ещё. :)
У неё кластеризация клёвая. Куда удобнее, чем в синтаксисе копаться-разбираться.

igorpopkoff

Помимо рекламы, 4 ссылки из 10 по запросу "!ваза" - всё равно на ВАЗ, хотя, конечно, 5 всё же на вазы.

Helga87

У гугла вроде нет русской морфологии
Полтора года как есть. клац Причем, она лучше, чем у Яндекса — реже включается, когда не нужно

kruzer25

И что, если ввёл в строку "обоями" - то рекламу не выводить вообще?

SCIF32

только гемора больно много с таким подходом.
ты выставил в запросах определенные словоформы, в общем случае неплохо было бы перечислить все возможные формы, в которых могут встречаться слова "ваза" и "спаяю".
При этом запрос получится ой как не маленький.
В реальности эту работу делает яндекс (на сколько мне известно один из этапов обработки запроса, это его перезапись в примерно такую же форму только делает он это не всегда так как хотелось бы.
Писать такой запрос вручную для каждого раза, когда результат выдается левый, просто не реально - проще сходить на гугл или куда еще.

SCIF32

Помимо рекламы, 4 ссылки из 10 по запросу "!ваза" - всё равно на ВАЗ, хотя, конечно, 5 всё же на вазы.
ну так "купить свечи для ВАЗа" или что-нибудь в этом духе

SCIF32

У неё кластеризация клёвая. Куда удобнее, чем в синтаксисе копаться-разбираться.
да, это действительно хорошая штука )
Оставить комментарий
Имя или ник:
Комментарий: