yandex: "запчасти от вазы" и "щас спаяю"
кажись это в раздел девелопмент
чтобы там народ придумал алгоритм и потом этот алгоритм продать яндексу
чтобы там народ придумал алгоритм и потом этот алгоритм продать яндексу

Чтобы конкретную проблему пофиксить, думаю ничего прогать не надо.
Скорее всего у них есть словари, отвечающие за морфологический анализ и т.п.,
которые надо поправить в соответствующих местах.
Эти словари видимо частично заполнялись автоматически и не проверялись в последствии экспертами, хотя следовало бы.
Мне просто интересно, может кто еще чего замечал необычного в поисковиках - о чем пока еще нигде не писали?
Скорее всего у них есть словари, отвечающие за морфологический анализ и т.п.,
которые надо поправить в соответствующих местах.
Эти словари видимо частично заполнялись автоматически и не проверялись в последствии экспертами, хотя следовало бы.
Мне просто интересно, может кто еще чего замечал необычного в поисковиках - о чем пока еще нигде не писали?

Как хорошо юзать Нигму. Видишь, что яндекс тупит - отключаешь его нах. 
"Щас спаяю" хорошо ищет гугл (т.е. находит фразу "щас спаяю"). На "запчастях от вазы", помимо яндекса, тупит рамблер. Остальные просто ничего не находят.

"Щас спаяю" хорошо ищет гугл (т.е. находит фразу "щас спаяю"). На "запчастях от вазы", помимо яндекса, тупит рамблер. Остальные просто ничего не находят.

У гугла вроде нет русской морфологии
тюнинг вазТут не только яндекс, тут и человек не поймёт без дополнительных данных, вазы или ВАЗ имеется в виду. Точнее, человек решит, что в виду имеется именно ВАЗ (тюнинг автомобиля - это нормально, а тюнинг вазы - херня ккая-то).
И правда, нету. 

Чтобы конкретную проблему пофиксить, думаю ничего прогать не надо.честно говоря, я тут проблемы особой не вижу. "запчасти от вазы" — вполне корректный поисковый запрос, касающийся не только ваз, но и ВАЗов. а морфология — вообще штука тупая, в большинстве случаев, если оба слова есть в словаре, будут выданы обе начальные формы (ВАЗ и ваза а дальше уже алгоритм подсчета релевантности, который хз, как устроен.
Скорее всего у них есть словари, отвечающие за морфологический анализ и т.п.,которые надо поправить в соответствующих местах.Эти словари видимо частично заполнялись автоматически и не проверялись в последствии экспертами, хотя следовало бы.
конечно, можно понять, посмотрев на структуру словосочетания и проверив падежи,
что в этом запросе имелись в виду вазы, а не ВАЗы. только я бы не сказал, что это просто.
что в этом запросе имелись в виду вазы, а не ВАЗы. только я бы не сказал, что это просто.
предлоги афаик почти не ищутся
во тебе пример
http://www.yandex.ru/yandsearch?text=%22%E7%E0%EF%F7%E0%F1%F...
во тебе пример
http://www.yandex.ru/yandsearch?text=%22%E7%E0%EF%F7%E0%F1%F...
про "запчасти от ваз" это так, ради шутки было 
еще один баг в том, что фирмы платят за рекламу по объявлениям "ВАЗ",
а эта реклама показывается при вводе запросов про "хрустальные вазы"
конечно процент таких запросов не велик, но все равно - нехорошо получается.

еще один баг в том, что фирмы платят за рекламу по объявлениям "ВАЗ",
а эта реклама показывается при вводе запросов про "хрустальные вазы"
конечно процент таких запросов не велик, но все равно - нехорошо получается.
как это нету?
http://www.google.ru/search?complete=1&hl=ru&q=%D0%B...
скорее всего просто приоритет точного совпадения больше
http://www.google.ru/search?complete=1&hl=ru&q=%D0%B...
скорее всего просто приоритет точного совпадения больше
ну с "вазы" все понятно было и так,
а вот "ВАЗа" - это к примеру родительный падеж от "ВАЗ"
так что тут действительно не все так просто...
да, получается у меня только один хороший пример - про щас спаяю
а вот "ВАЗа" - это к примеру родительный падеж от "ВАЗ"
так что тут действительно не все так просто...
да, получается у меня только один хороший пример - про щас спаяю
еще один баг в том, что фирмы платят за рекламу по объявлениям "ВАЗ",а эта реклама показывается при вводе запросов про "хрустальные вазы" конечно процент таких запросов не велик, но все равно - нехорошо получается.этот баг лечится, например, учетом тематики (которая засчет других слов в документе выходит). =)
кстати, пример еще более страшной пары слов: "вена/Вена". тут даже падежи не помогут, только тематики.
ну и еще дофига придумать можно, если со словарем посидеть.
punto.ru справляется немного лучше
[url=http://punto.ru/meta.php?engine=0&search_type=0&text=щас спаяю]щас спаяю[/url]
а вот с запчастями такая же ботва
[url=http://punto.ru/meta.php?engine=0&search_type=0&text=щас спаяю]щас спаяю[/url]
а вот с запчастями такая же ботва
Собственно, из-за этих багов поиск в Нигме мне нравится куда больше любых других. %)
Они ещё недавно интерфейсик чуток исправили в сторону большей очевидности и функциональности.
Они ещё недавно интерфейсик чуток исправили в сторону большей очевидности и функциональности.
!ваза
щас !спаяю
Учите синтаксис запросов, это сильно помогает жить
Применительно к гуглю тоже, кстати.
щас !спаяю
Учите синтаксис запросов, это сильно помогает жить
Применительно к гуглю тоже, кстати.и как нигма избавляетот проблем с поиском по запросу "магазин ваз" ?
багов с рекламой там понятно нет, т.к. и контекстной рекламы в ней нету.
А тот баг, что с рекламой в яндексе, судя по всему проблема тех, кто заказывает рекламу: им приходится платить не только за показ рекламы в нужном контексте. К пользователям поиска он мало какое отношение имеет.
багов с рекламой там понятно нет, т.к. и контекстной рекламы в ней нету.
А тот баг, что с рекламой в яндексе, судя по всему проблема тех, кто заказывает рекламу: им приходится платить не только за показ рекламы в нужном контексте. К пользователям поиска он мало какое отношение имеет.
да, согласен, это помогает жить.
но разве проблема была в этом?
но разве проблема была в этом?
!вазаА теперь посмотри на рекламу в правой колонке.

Магазины я в ней ни разу не искал ещё. 
У неё кластеризация клёвая. Куда удобнее, чем в синтаксисе копаться-разбираться.

У неё кластеризация клёвая. Куда удобнее, чем в синтаксисе копаться-разбираться.
Помимо рекламы, 4 ссылки из 10 по запросу "!ваза" - всё равно на ВАЗ, хотя, конечно, 5 всё же на вазы.
У гугла вроде нет русской морфологииПолтора года как есть. клац Причем, она лучше, чем у Яндекса — реже включается, когда не нужно
И что, если ввёл в строку "обоями" - то рекламу не выводить вообще?
только гемора больно много с таким подходом.
ты выставил в запросах определенные словоформы, в общем случае неплохо было бы перечислить все возможные формы, в которых могут встречаться слова "ваза" и "спаяю".
При этом запрос получится ой как не маленький.
В реальности эту работу делает яндекс (на сколько мне известно один из этапов обработки запроса, это его перезапись в примерно такую же форму только делает он это не всегда так как хотелось бы.
Писать такой запрос вручную для каждого раза, когда результат выдается левый, просто не реально - проще сходить на гугл или куда еще.
ты выставил в запросах определенные словоформы, в общем случае неплохо было бы перечислить все возможные формы, в которых могут встречаться слова "ваза" и "спаяю".
При этом запрос получится ой как не маленький.
В реальности эту работу делает яндекс (на сколько мне известно один из этапов обработки запроса, это его перезапись в примерно такую же форму только делает он это не всегда так как хотелось бы.
Писать такой запрос вручную для каждого раза, когда результат выдается левый, просто не реально - проще сходить на гугл или куда еще.
Помимо рекламы, 4 ссылки из 10 по запросу "!ваза" - всё равно на ВАЗ, хотя, конечно, 5 всё же на вазы.ну так "купить свечи для ВАЗа" или что-нибудь в этом духе
У неё кластеризация клёвая. Куда удобнее, чем в синтаксисе копаться-разбираться.да, это действительно хорошая штука )
Оставить комментарий
SCIF32
Как известно, лажи в поисковиках встречаются довольно часто, но именно эта преследует меня уже где-то год и на протяжении этого времени ситуация никак не изменилась.щас спаяю
запчасти от вазы
Как вы уже догадались, дело даже не в том, что на такие дурацкие запросы яндекс все же дает какие-то ответы, предполагая что
в первом случае имеется ввиду ВАЗ, а во втором глагол "петь". Проблема в том, что обработка некоторых слов, которые пишутся похоже (но все же по-разному но имеют при этом абсолютно разный смысл, осуществляется некорректно.
И если мы попробуем поискать просто вазу, то опять же наткнемся на кучу сайтов с автомобилями, хотя слово "ваза" в смысле автомобиль не употребляется вовсе. (вдумайтесь в смысл словосочетания "тюнинг ваз")
Слово спаять в смысле "спеть" в принципе не употребляется. Конечно, "спаять" вообще несколько странное и часто не используется, но если мы попробуем найти что-нибудь вроде спаять микрофон,
то опять же получим страницы про то, как кто-то поет.