«Яндекс» обвиняют в том, что результаты поиска в сервисе «Яндекс.Картинки» подвергаются цензуре по целому ряду запросов, особенно на политические и государственные темы. Так, пользователи приводят в пример запросы «милиция» или «партия жуликов и воров плакат», результаты поиска картинок по которым сильно отличаются в сервисах «Яндекса» и компании Google. В частности, по запросу «милиция» «Яндекс» находит меньше изображений, так или иначе компрометирующих правоохранительные органы.
Представители «Яндекса» объясняют это обновлением базы картинок в сервисе, из-за которого на данный момент «Яндекс.Картинки» не ищут по всем изображениям, появившимся в Сети после 13 февраля. «Никакой цензуры, исключительно технологические проблемы, которые мы решим в ближайшее время», - подчеркивают в «Яндексе».
Поиск по картинкам был запущен компанией летом 2002 г., и база изображений сервиса тогда насчитывала около 12 млн картинок. К декабрю 2010 г. их количество увеличилось до 1,8 млрд. При этом, сервис преимущественно индексировал картинки, размещенные на русскоязычных ресурсах, отбирая в зарубежном интернете только самые популярные картинки.
В декабре прошлого года команда сервиса начала масштабную индексацию картинок в мировом интернете, поставив цель увеличить количество зарубежных изображений в 5 раз. «К сожалению, при таком резком расширении индекса случилась болезнь роста. Создание уменьшенных копий, склейка дубликатов и прочие процессы формирования базы стали занимать существенно больше времени. Мы надеялись, что вот-вот справимся и выложим новую базу картинок, но недооценили масштаб происходящего. Мы слишком резко надавили на педаль газа, но забыли пристегнуть ремни. В результате накопился большой разрыв между датой, когда наш робот скачал картинку, и датой ее появления в поиске», - объясняет Дмитрий Беляев, руководитель мультимедийных поисков «Яндекса».
По его словам, сейчас разрыв в результатах поиска составляет 6 недель, то есть самая свежая картинка в базе датируется 13 февраля. Именно этим объясняется невозможность нахождения с помощью «Яндекс.Картинок» целого ряда изображений, в частности, фото последствий землетрясения в Японии, которое произошло 11 марта, и конкурса плакатов в блоге Алексея Навального.
Во вторник, 29 марта, должно состояться крупнейшее обновление зарубежной части базы в истории поисковика по картинкам «Яндекса». Как отмечают разработчики, общий объем базы составит 3,9 млрд изображений, что более чем в 2 раза больше декабрьских показателей. В этой базе будут изображения, которые появились в интернете до 27 февраля.
«Таким образом, отставание сократится с 6 недель до 4, что все равно неприемлемо. Но уже через неделю, когда произойдет следующее увеличение базы, мы сократим этот разрыв до 2 недель», - обещают представители «Яндекса».
Отметим, что случаи цензуры результатов поиска наиболее характерны для сервисов, работающих в Китае. К примеру, Google фильтровал выдачу в соответствии с требованиями властей, ограничивающих доступ пользователей к неугодным им материалам. В начале прошлого года в Google заявили о намерении отключить фильтрацию результатов поиска. 22 марта Google закрыл китайский сайт и включил автоматическую переадресацию посетителей на гонконгский портал, на котором цензуры нет.