| ||||||
Начало Сервисы платные Сервисы бесплатные временно Информационное Архивные - отключенные возможности
RSS апдейтов: cp1251, utf8 Поддержка: Евгений Трофименко email facebook vk анкоры партнерская программа реклама на сайте |
Контрастности слов ("веса")Архив, собранный через XML в 2010Веса - что это? Веса - это т.н. "контрастность" термина по корпусу документов. Веса нужны для того, чтобы при поиске давать приоритет относительно редким словам и слабее учитывать частотные слова. Веса в классическом виде есть отношение общего числа словоформ (документов) в базе к числу словоформ (документов), содержащих искомое слово (в этом разница между ICF и IDF). Откуда дровишки? Летом-осенью 2010 в Яндекс-XML существовала ошибка, связанная с обработкой опечаток. В результате этой ошибки был виден тот поисковый запрос, который работает в Яндексе вместо введенного (содержит дополнительные слова и веса слов). Была специально подготовлена и проиндексирована база и скачаны 1.3 млн наиболее популярных запросов. После доклада в 2011 эволюция алгоритмов Яндекса и методов исследований: новые возможности анализа эту возможность нашли и закрыли. См. также доклад Переформулировки поисковых запросов в Яндексе. вот для примера несколько весов:
|
|||||
tools.promosite.ru
Поиск в основном сделан на Яндекс.XML Поддержка: Евгений Трофименко |