yandex: "запчасти от вазы" и "щас спаяю"
чтобы там народ придумал алгоритм и потом этот алгоритм продать яндексу
Скорее всего у них есть словари, отвечающие за морфологический анализ и т.п.,
которые надо поправить в соответствующих местах.
Эти словари видимо частично заполнялись автоматически и не проверялись в последствии экспертами, хотя следовало бы.
Мне просто интересно, может кто еще чего замечал необычного в поисковиках - о чем пока еще нигде не писали?
"Щас спаяю" хорошо ищет гугл (т.е. находит фразу "щас спаяю"). На "запчастях от вазы", помимо яндекса, тупит рамблер. Остальные просто ничего не находят.
У гугла вроде нет русской морфологии
тюнинг вазТут не только яндекс, тут и человек не поймёт без дополнительных данных, вазы или ВАЗ имеется в виду. Точнее, человек решит, что в виду имеется именно ВАЗ (тюнинг автомобиля - это нормально, а тюнинг вазы - херня ккая-то).
И правда, нету.
Чтобы конкретную проблему пофиксить, думаю ничего прогать не надо.честно говоря, я тут проблемы особой не вижу. "запчасти от вазы" — вполне корректный поисковый запрос, касающийся не только ваз, но и ВАЗов. а морфология — вообще штука тупая, в большинстве случаев, если оба слова есть в словаре, будут выданы обе начальные формы (ВАЗ и ваза а дальше уже алгоритм подсчета релевантности, который хз, как устроен.
Скорее всего у них есть словари, отвечающие за морфологический анализ и т.п.,которые надо поправить в соответствующих местах.Эти словари видимо частично заполнялись автоматически и не проверялись в последствии экспертами, хотя следовало бы.
что в этом запросе имелись в виду вазы, а не ВАЗы. только я бы не сказал, что это просто.
еще один баг в том, что фирмы платят за рекламу по объявлениям "ВАЗ",
а эта реклама показывается при вводе запросов про "хрустальные вазы"
конечно процент таких запросов не велик, но все равно - нехорошо получается.
http://www.google.ru/search?complete=1&hl=ru&q=%D0%B...
скорее всего просто приоритет точного совпадения больше
а вот "ВАЗа" - это к примеру родительный падеж от "ВАЗ"
так что тут действительно не все так просто...
да, получается у меня только один хороший пример - про щас спаяю
еще один баг в том, что фирмы платят за рекламу по объявлениям "ВАЗ",а эта реклама показывается при вводе запросов про "хрустальные вазы" конечно процент таких запросов не велик, но все равно - нехорошо получается.этот баг лечится, например, учетом тематики (которая засчет других слов в документе выходит). =)
кстати, пример еще более страшной пары слов: "вена/Вена". тут даже падежи не помогут, только тематики.
ну и еще дофига придумать можно, если со словарем посидеть.
[url=http://punto.ru/meta.php?engine=0&search_type=0&text=щас спаяю]щас спаяю[/url]
а вот с запчастями такая же ботва
Они ещё недавно интерфейсик чуток исправили в сторону большей очевидности и функциональности.
!ваза
щас !спаяю
Учите синтаксис запросов, это сильно помогает жить Применительно к гуглю тоже, кстати.
щас !спаяю
Учите синтаксис запросов, это сильно помогает жить Применительно к гуглю тоже, кстати.
багов с рекламой там понятно нет, т.к. и контекстной рекламы в ней нету.
А тот баг, что с рекламой в яндексе, судя по всему проблема тех, кто заказывает рекламу: им приходится платить не только за показ рекламы в нужном контексте. К пользователям поиска он мало какое отношение имеет.
но разве проблема была в этом?
!вазаА теперь посмотри на рекламу в правой колонке.
У неё кластеризация клёвая. Куда удобнее, чем в синтаксисе копаться-разбираться.
Помимо рекламы, 4 ссылки из 10 по запросу "!ваза" - всё равно на ВАЗ, хотя, конечно, 5 всё же на вазы.
У гугла вроде нет русской морфологииПолтора года как есть. клац Причем, она лучше, чем у Яндекса — реже включается, когда не нужно
И что, если ввёл в строку "обоями" - то рекламу не выводить вообще?
ты выставил в запросах определенные словоформы, в общем случае неплохо было бы перечислить все возможные формы, в которых могут встречаться слова "ваза" и "спаяю".
При этом запрос получится ой как не маленький.
В реальности эту работу делает яндекс (на сколько мне известно один из этапов обработки запроса, это его перезапись в примерно такую же форму только делает он это не всегда так как хотелось бы.
Писать такой запрос вручную для каждого раза, когда результат выдается левый, просто не реально - проще сходить на гугл или куда еще.
Помимо рекламы, 4 ссылки из 10 по запросу "!ваза" - всё равно на ВАЗ, хотя, конечно, 5 всё же на вазы.ну так "купить свечи для ВАЗа" или что-нибудь в этом духе
У неё кластеризация клёвая. Куда удобнее, чем в синтаксисе копаться-разбираться.да, это действительно хорошая штука )
Оставить комментарий
SCIF32
Как известно, лажи в поисковиках встречаются довольно часто, но именно эта преследует меня уже где-то год и на протяжении этого времени ситуация никак не изменилась.щас спаяю
запчасти от вазы
Как вы уже догадались, дело даже не в том, что на такие дурацкие запросы яндекс все же дает какие-то ответы, предполагая что
в первом случае имеется ввиду ВАЗ, а во втором глагол "петь". Проблема в том, что обработка некоторых слов, которые пишутся похоже (но все же по-разному но имеют при этом абсолютно разный смысл, осуществляется некорректно.
И если мы попробуем поискать просто вазу, то опять же наткнемся на кучу сайтов с автомобилями, хотя слово "ваза" в смысле автомобиль не употребляется вовсе. (вдумайтесь в смысл словосочетания "тюнинг ваз")
Слово спаять в смысле "спеть" в принципе не употребляется. Конечно, "спаять" вообще несколько странное и часто не используется, но если мы попробуем найти что-нибудь вроде спаять микрофон,
то опять же получим страницы про то, как кто-то поет.