Как Google обходится с взломанными сайтами.
SEO 05.12.2006“4 декабря 2006 2:40
Если Вы никогда не читали мой блог, прежде всего, рад вас поприветствовать. Я – руководитель webspam команды в Google. И у меня есть блог, который я веду каждый из дней таких же, как этот.
Хорошо, сначала Вы должны и прочесть этот пост. Автор статьи “Me Against Google (Я против Гугл)” расстроен, ведь его ресурс talkorigins.org не мог быть найден в Google в течение последних 5-6 дней. После этого поста, пойдите, почитайте этот пост на Slashdot, названный “Google De-indexes Talk.Origins, Won’t Say Why UPDATED”. К тому времени, когда Вы прочитали оба материала, ваш пульс должен зашкаливать. Черт, Вы должны быть сердитыми. Проклятый и злой Google делает все для того, чтобы не общаться с вебмастерами! Или как Уэсли выразился у себя на блоге:
“Вы могли бы подумать, что компания, которая гордится передовым текстовым анализом и автоматизированными алгоритмами принятия решения, могла бы обеспечить полезные сообщения предупреждения к вебмастерам относительно проблем, найденных у них на сайтах. Вы были бы неправы.”
Хорошо, готовы послушать рассказ, который расскажу Вам я? Вот – последовательность событий:
- talkorigins.org был взломан 18-ого ноября. Я знаю это, потому что Уэсли говорит так в своем посте на блоге.
- К 27-ому ноября, Google обнаружил спамерские ссылки и текст на talkorigins.org.
В случае если у Вас появились вопросы вот - то, что добавил взломщик-спамер:
script>document.write(String.fromCharCod(60,100,105,118,32,115,116,121,108,101,61,39,100,
105,115,112,108,97,121,58,110,111,110,101,39,62)) /script>a href=”http://vvu.edu.gh/images/?i=animal-porn” mce_href=”http://vvu.edu.gh/images/?i=animal-porn” >animal porn,
a href=”http://vvu.edu.gh/images/?i=animal-sex” mce_href=”http://vvu.edu.gh/images/?i=animal-sex” >animal sex,
a href=”http://vvu.edu.gh/images/?i=beastiality” mce_href=”http://vvu.edu.gh/images/?i=beastiality” >beastiality,
a href=”http://vvu.edu.gh/images/?i=rape-sex” mce_href=”http://vvu.edu.gh/images/?i=rape-sex” >rape sex,
a href=”http://vvu.edu.gh/images/?i=sleeping-sex” mce_href=”http://vvu.edu.gh/images/?i=sleeping-sex” >sleeping sex,
a href=”http://deepx.com/images/?i=animal-porn” mce_href=”http://deepx.com/images/?i=animal-porn” >animal porn,
a href=”http://deepx.com/images/?i=beastiality” mce_href=”http://deepx.com/images/?i=beastiality” >beastiality,
a href=”http://deepx.com/images/?i=dog-porn” mce_href=”http://deepx.com/images/?i=dog-porn” >dog porn,
a href=”http://deepx.com/images/?i=horse-porn” mce_href=”http://deepx.com/images/?i=horse-porn” >horse porn,
a href=”http://deepx.com/images/?i=rape-sex” mce_href=”http://deepx.com/images/?i=rape-sex” >rape sex, a href=”http://deepx.com/images/?i=sleeping-sex” mce_href=”http://deepx.com/images/?i=sleeping-sex” >sleeping sex,
a href=”http://theoi.com/image/?i=animal-porn” mce_href=”http://theoi.com/image/?i=animal-porn” >animal porn,
a href=”http://theoi.com/image/?i=animal-sex” mce_href=”http://theoi.com/image/?i=animal-sex” >animal sex,
a href=”http://theoi.com/image/?i=beastiality” mce_href=”http://theoi.com/image/?i=beastiality” >beastiality,
a href=”http://ugobe.com/media/?i=dvd-covers” mce_href=”http://ugobe.com/media/?i=dvd-covers” >dvd covers,
a href=”http://ugobe.com/media/?i=dvd-ripper” mce_href=”http://ugobe.com/media/?i=dvd-ripper” >dvd ripper,
a href=”http://ugobe.com/media/?i=psp-downloads” mce_href=”http://ugobe.com/media/?i=psp-downloads” >psp downloads,
a href=”http://ugobe.com/media/?i=psp-games” mce_href=”http://ugobe.com/media/?i=psp-games” >psp games,
a href=”http://ugobe.com/media/?i=psp-movies” mce_href=”http://ugobe.com/media/?i=psp-movies” >psp movies
Не симпатичные ссылки на сайты, содержащие насилие и порно с животными. В случае, если Вы задаетесь вопросом, что JavaScript делает в начале страницы - “d iv style=’display:none’>”? Он делает всю секцию спама скрытой. Таким образом, talkorigins.org имеет эти слова о порно и спамерские ссылки, и это все скрыто через жалкий JavaScript.
Мы имеем довольно серьезные основания, чтобы полагать, что этот сайт был взломан, что вызывает проблемы непосредственно у посетителей сайта, таким образом, Google должен был принимать меры. Вот - то, что мы сделали:
- К 27-ому ноября, сайт был классифицирован как взломанный и спамерский. Мы прекратили показывать его среди первых, в результатах выдачи поисковой системы.
- К 27-ому ноября, сайт получил пенальти, подробнее о санкциях поисковой системы описывается в Google webmasters.
Я полагаю, что Гугл - единственная поисковая машина, которая подтвердит вебмастерам, что их сайт действительно получил пенальти. Нет, мы не подтверждаем штрафы, если мы думаем, что это могло бы навести нас на спамерские сети, чтобы их поймать. Но да, мы действительно пробуем подтвердить штрафы, если мы думаем, что с сайтом все в порядке или он был взломан. Вы можете прочитать больше о том, как мы подтверждаем штрафы в предыдущем посте.
Я полагаю, что многие спросят:
“Хорошо, что я могу подписаться на Google webmasters, где меня утешат и позволят узнать, что Гугл оштрафовал мой сайт. Но Разве Гугл, не мог сделать больше?”
Хорошо, оказывается, что мы действительно делали больше:
- К 28-ому ноября, мы послали по электронной почте письма с разъяснениями в talkorigins.org, чтобы сообщить им точно, что случилось. Согласно записям, мы пробовали послать письма по адресам contact[at]talkorigins.org, info[at]talkorigins.org, support[at]talkorigins.org, и webmaster[at]talkorigins.org с указанного времени 2006-11-28 14:24:15.
Вот - выдержка из письма, которое мы послали:
Дорогой владелец сайта или вебмастер talkorigins.org, В то время как мы вносили ваши страницы в индексную базу, мы обнаружили, что часть из ваших страниц использовали методы, которые противоречат нашим принципам качества, которыми мы руководствуемся. Которые вы можете найти здесь: http: // www.google.com/webmasters/guidelines.html
Чтобы сохранять качество работы нашей поисковой машины, мы имеем право, временно удалять некоторые сайты из наших результатов поиска. В настоящее время страницы от talkorigins.org, как намечается, будут удалены в течение, по крайней мере, 60 дней.
Определенно, мы обнаружили следующие методы нарушения на вашем сайте:
* Следующий скрытый текст на talkorigins.org:
e.g.
animal porn, animal sex, beastiality, rape sex, sleeping sex, animal porn, beastiality, dog porn, horse porn, rape sex, sleeping sex, animal porn, animal sex, beastiality, dvd covers, dvd ripper, psp downloads, psp games, psp movies
…Мы хотели бы иметь ваши страницы в индексе Гугл. Если Вы желаете чтобы ваши страницы были повторно включены в индекс, пожалуйста, исправьте или удалите все страницы, которые противоречат нашим принципам качества. Когда Вы будете готовы, пожалуйста, посетите:
https: // www.google.com/webmasters/sitemaps/reinclusion? hl=en
исправьте ошибки, и сделайте запрос на пере включение.
…Вы можете прочитать больше о том, как мы пробуем информировать по электронной почте вебмастеров о проблемах, связанных с их сайтами в этом посте.
Согласно его посту, Уэсли сделал запрос на пере включения недавно, и я подтвердил, что запрос пере включения был одобрен, таким образом я ожидаю, что talkorigins.org вернется в Гугл в течение 24-48 часов.
Но давайте взглянем немного назад. Этот сайт был взломан и наполнен связкой скрытых ссылок содержащих слова порно. Гугл обнаружил спам меньше чем через 10 дней; это быстрее, чем владелец сайта заметил это. Мы временно удалили сайт из нашего индекса так, чтобы пользователи не прошли по спамерским ссылкам на порно сайты, в ответ на запросы в поисковике. Мы позволили вебмастеру проверить, что его сайт был оштрафован. Тогда мы послали по электронной почте фрагмент сайта, с точной страницей и точным текстом, который вызывал проблемы. Мы дали ссылку для владельца сайта, где он может попросить переиндексацию. Мы также сделали пенальти на относительно короткое время (60 дней), так, чтобы, если бы вебмастер устранил проблему, но не связывался с Гугл, то у него было бы все в порядке уже после нескольких недель.
В конечном счете, каждый владелец сайта сам ответственен за то, чтобы удостовериться, что его сайт не является спамом. Если Вы выбирали плохого оптимизатора под поисковые машины (SEO), и он делает тонну доррвеев на вашем сайте, Гугл должен принимать меры. Взломанные сайты плохо выглядят: для примера, множество взломанных спамерских сайтов будут пытаться установить malware на компьютеры пользователей. Если ваш сайт взломан и занимается спамом, Гугл, возможно, должен удалить ваш сайт, но мы будем также пробовать поставить Вас в известность через нашу программу Google webmasters и даже, посылая предупреждения по электронной почте Вам, чтобы сообщить то, что случилось. Насколько я знаю, никакая другая поисковая машина не подтверждает никакие штрафы сайтам, они не делают ничего, они не посылают письма владельцам сайтов.
Уэсли и кто - либо еще, кто имеет отношение к talkorigins.org, я сожалею, что это было неприятным опытом для Вас. Гугл мог сделать свою работу лучше? Абсолютно, и мы будем продолжать усовершенствоваться и развивать взаимодействие. Например, возможно мы будем показывать более определенные сообщения для взломанных сайтов в интерфейсе для вебмастеров. Гугл мог также попробовать солидаризироваться с определёнными адресами электронной почты, при письме, чтобы оповестить владельцев. Например, для talkorigins.org, есть адреса электронной почты, типа “archive@” и “submissions@”, которые мы, возможно, использовали бы вместо этого, которые, возможно, достигли бы правильного человека. Я открыт для других предложений также. Но, пожалуйста, дайте Гуглу немного доверия, потому что я действительно думаю, что мы делаем больше, чтобы подготовить вебмастеров к проблемам, чем любая другая поисковая машина.”
Это вольный перевод статьи взятой с блога Мэтта Каттса
Читайте так же:

05.12.2006 в 23:48
По моему хороший пример взаимодействия поисковой машины и вебмастера…
Надеюсь для других поисковиков это станет заразительным примером в частности для яндекса ; )
07.07.2007 в 22:31
Всё и все хороши!!!
Есть один сайт на котором демонстрируют фото детей, юных девочек и другой разврат (гнилую клубничку) его надо уничтожить!!! Подскажите как я сам всё сделаю ……….
23.08.2007 в 11:45
Отличная статья, спасибо! На самом деле гугл становится все лучше и лучше, и это не может не радовать. Но пока, к сожалению, выдача сайтов на русском языке не очень релевантна. То, что не находит гугл, может найти яндекс. Над этим стоит немножко поработать. Зато google более стабильный (по крайней мере я не замечал сильных глюков).