| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Начало Сервисы платные Сервисы бесплатные временно Информационное Архивные - отключенные возможности
RSS апдейтов: cp1251, utf8 Поддержка: Евгений Трофименко email facebook vk анкоры партнерская программа реклама на сайте |
Поиск аффилированных сайтовАрхив, собранный через XML в 2010 (по выборке ~20% хостов Яндекса)Аффилированные сайты - что это? аффилированные сайты - это сайты, которые Яндекс по разным причинам считает принадлежащими одной компании. Это в основном делается ручками - с учетом контактов на сайте и т.п. Это борьба Яндекса с "забиванием" топа сайтами, может быть и разными, но принадлежащими одной конторе. Основной результат состоит в том, что по одному запросу может находиться только один аффилиат из группы (самый релевантный). Остальные (менее релевантные) вычищаются из выдачи. Причем из группы аффилированных сайтов по разным запросам будет находиться то один, то другой, но не оба вместе. Попробуйте, например, поискать лавпланет - тут еще представлена малая доля клонов.
* они, аффилиаты, на то и аффилиаты, что по одному запросу показаться может только один аффилиат из группы. Поэтому логично, что все стопроцентов = полный список аффилиатов никто не определит. Т.е., есть случаи, когда я точно знаю, что аффилиаты есть, но какие именно - не знаю. Потому, что остальные аффилиаты случайно не попали в выборку. А выборка та большая - примерно 2 млн. доменов (20% от всего яндекса по хостам), найденных по 42 тыс. поисковых запросов (топ 1000), когда был во второй раз открыт показ клонов, гео, и релевантности в цифрах. Первый раз был тут и был давно отменен. Я скоро сделаю определялку аффилиатов на открытых данных, но тогда очень полезно будет ввести список запросов, по которым сайт продвигается. И это будет платный сервис. Откуда дровишки? Данные из скачанных что-то около 2 млн доменов по 42 тыс запросов по тестовому XML Яндекса, когда были открыты разные интересные данные, как-то: география, аффилиаты, и, конечно, цифра релевантности )) Каким образом подтвердить аффилированность? Яндекс, похоже, борется с возможностями определения аффилиатов. В древние незапамятные времена определить аффилированность было просто: задаем запрос типа host:domain1.ru | host:domain2.ru, и если в результатах видим только один домен из двух (при этом каждый из хостов отдельно находится нормально) - перед вами аффилиаты. Т.е., по одному запросу второй аффилированный сайт вычищается из выдачи. Но сейчас стало посложнее. Яндекс решил, что нужно разгруппировывать домены при поиске host: rhost: и тому подобное. И если раньше и в обычной выдаче можно было увидеть только один домен из двух, то теперь мы вынуждены копаться в страницах внутри домена. Да, это чуток менее удобно, чем смотреть сразу сгруппированные данные. Но, кстати, если у вас есть Яндекс-ХМЛ, то в нем все фишки с группировкой остались прежними. И вот тот запрос выше "пруфлинк" можно задать в яндекс-ХМЛ и волшебным образом увидеть один результат из двух аффилированных. А если вам лениво лазить в ХМЛ - можно просмотреть все разгруппированные страницы обоих сайтов в обычной выдаче. И операторы host, rhost, url не спасают. И, что забавно: при задании оператора url: через "или" по аффилиатам находятся оба аффилиата. Это настолько они борются с определением клонов, ага )) Для подтверждения клонов можно было использовать оператор domain. Но сейчас его кастировали. Сейчас я использую ту фичу, что по запросу вида domain.ru всегда первым выдается сайт domain.ru, и то же самое при перечислении нескольких через "или" - сайты сверху. В выдаче по запросу domain1.ru | domain2.ru на первых двух будут эти сайты, если они не аффилированы. Если они аффилированы - на 1-2 местах останется только один сайт из двух. Перед использованием не мешает проверить нахождение двух доменов по отдельности.
вот для примера топ клонов. Число num = число клонов с одинаковым ID аффилиата:
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
tools.promosite.ru
Поиск в основном сделан на Яндекс.XML Поддержка: Евгений Трофименко |