"Журнал "Компьютерра" №768" - читать интересную книгу автора (Компьютерра)

АНАЛИЗЫ: Google великий и ужасный

Автор: Киви Берд

Создатели голливудских фильмов очень любят сюжеты о том, как некая корпорация пытается захватить власть во всем мире. Средоточие зла при этом обычно занимается чем-нибудь таким биомедицинским или генноинженерным - в общем, тем, что ассоциируется в массовом сознании с передним краем науки. Не исключено, что в ближайшее время сценаристы с режиссерами слегка пересмотрят акценты: с некоторых пор в обществе все более заметна обеспокоенность по поводу постоянно возрастающего влияния интернет-компаний. Начинавшие деятельность как простые поисковые сервисы или каталоги, ныне эти универсальные информационные порталы замыкают на себя существенную часть повседневной жизни многих людей. Кто лишь в отдельно взятой стране, а кто и во всем мире, как, например, главный интернет-тяжеловес Google.

Когда известного профессора-правоведа и интернет-эксперта Лоуренса Лессига попросили поделиться точкой зрения на эту проблему, он сформулировал суть складывающейся ситуации так. Во времена расцвета Microsoft многие люди боялись, что хозяева операционной системы воспользуются своей монополией для насаждения собственных продуктов и вытеснения конкурентов (и нечто подобное действительно происходило). Однако у Google сейчас, считает Лессиг, возможности контроля над мировой информацией куда шире.

Понятно, что тот, кто контролирует информацию, способен контролировать и все остальное. И если при этом суть игры, в которую вы играете, сводится к увеличению вашей рыночной доли, то, подчеркивает Лессиг, очень трудно творить добро и собирать данные такими способами, которые не поднимали бы вопросов, с одной стороны, о вторжении в приватность граждан или, с другой стороны, о помощи репрессивным режимам в блокировании контента.

Наглядные иллюстрации тому, насколько серьезные масштабы обрели отмеченные Лессигом проблемы, предоставляют две большие аналитические публикации, вышедшие в конце прошедшего года. Одна - это статья quot;Сторожа из Googlequot; в журнале New York Times Magazine[quot;Google’s Gatekeepersquot; by Jeffrey Rosen, The NYT Magazine, November 28, 2008.], другая - книга под названием, которое можно перевести как quot;Загугленная безопасность: как много Google о вас знаетquot;[quot;Googling Security: How Much Does Google Know About You?quot; by Gregory Conti, Addison-Wesley Professional, 2008.]. Со второй работы мы и начнем.

Гуглимая безопасность

Если верить аннотации издательства Addison-Wesley, выпустившего quot;Загугленную безопасностьquot;, это первая в истории книга, подробно раскрывающая, каким образом гигантские массивы информации, собираемой Google, могут быть использованы против конкретного человека или компании.

Первая это книга подобного рода или нет, наверняка сказать трудно. Но что отличает ее от всех подобных, так это высокий профессиональный статус автора. В настоящее время Грег Конти является профессором компьютерной науки и информационных войн в Вест-Пойнте, главной военной академии США, а до начала преподавательской работы он много лет занимался проблемами компьютерной безопасности в составе разведывательных и армейских структур страны. Проведенное Конти исследование тех массивов информации, которые пользователи Интернета явно или неявно, но в любом случае абсолютно добровольно предоставляют компании Google, в значительной степени основано на результатах прежних аналитических работ того же автора, посвященных визуализации данных о безопасности и раскрытиям информации в вебе.

Конти скрупулезно перечисляет все сервисы, предоставляемые Google помимо собственно поиска по ключевым словам: почта Gmail, геоинформационный сервис Google Maps, служба оповещений Google Alerts, Google Talk, Google Groups, новые мобильные приложения и многое другое. Автор описывает, насколько все эти сервисы неотразимы и привлекательны для пользователей, а затем отмечает, какую информацию раскрывают их потребители. Причем раскрывают даже тогда, когда сервисы используются непреднамеренно - например, когда вы просто посылаете электронное письмо кому-то, кто пользуется почтовым ящиком Gmail.

Конти демонстрирует, каким образом базы данных Google могут быть использованы кем-то с отнюдь не лучшими намерениями, даже если сама корпорация продолжает придерживаться своего знаменитого девиза quot;Не быть зломquot; (Don’t be evil). В частности, показано, что информационные quot;хлебные крошкиquot;, которые оставляет всякий пользователь при обращении к поисковым сервисам, дают широкие возможности для составления всеобъемлющего профиля на человека. Или что почта Gmail может быть использована для отслеживания персональной сети друзей и знакомых. А, скажем, карты Google Maps и инструменты определения местоположения могут раскрывать адрес вашего дома, работодателя, семьи и друзей, планы поездок и прочие намерения. Рекламные сервисы Google AdSense и DoubleClick помогают отслеживать ваши перемещения по вебу. Наконец, массивы информации, накапливаемой в Google и других онлайновых компаниях, могут подвергаться утечкам, теряться или изыматься по предписанию суда, а впоследствии использоваться для кражи личности или даже шантажа.

Неторопливыми и подробными штрихами Конти рисует общую картину, показывающую, что обычные для людей беспечность и самодовольство, привлекательность хорошо продуманных сервисов Google, а также техническая неадекватность браузеров и других сетевых инструментов во всем, что касается предупреждений о потенциальных раскрытиях информации, порождают в совокупности весьма опасную ситуацию. В итоге у Google и подобных ей компаний-гигантов оказывается настораживающе много информации о нас, о наших предпочтениях, передвижениях, финансах, здоровье, работе и кругах общения.

Все объяснения у Конти изложены на удивление доступным языком, причем даже в тех случаях, когда разбираются довольно сложные и, как говорится, контринтуитивные технические предметы вроде тонкостей применения cookies. Не менее ценно, что столь же доступны для понимания и его рекомендации о том, как перекрывать обильные потоки персональной информации, что текут из вашего компьютера в онлайновые базы данных.

Наконец, в книге особо отмечено, что даже людям, quot;которым нечего скрыватьquot;, имеет смысл побеспокоиться. Грубоватый, но доходчивый пример: приблизительные размеры и особенности частей тела, которые традиционно находятся у человека под прикрытием одежды, не являются никаким секретом. Однако даже в жару люди не ходят голыми в публичных местах и скорее всего возмутятся, если кто-то попытается принудить их к полному раздеванию. Секреты и приватность - далеко не одно и то же.

Умножая познания, умножаешь скорбь

Большинство интернет-пользователей полагает, будто их поисковые запросы нигде не фиксируются и представляют собой мимолетный и сугубо приватный обмен данными. Сколь глубоко они заблуждаются, было хорошо продемонстрировано в августе 2006 года, когда компания AOL случайно сделала доступным для массовой публики большой массив накопленных данных о поисковых запросах своих клиентов - около 20 миллионов поисков от 658 тысяч интернет-абонентов.

Этот инцидент лишь подтвердил то, о чем специалисты по безопасности давно подозревали и предупреждали общество. А именно, что массивы информации об использовании веб-инструментов, сохраняемые интернет-компаниями, представляют весьма существенную проблему с точки зрения приватности. Хотя 20 миллионов поисковых запросов были опубликованы без пользовательских имен AOL-абонентов и без их IP-адресов, в этом массиве каждому имени пользователя был сопоставлен уникальный цифровой идентификатор. Используя лишь этот quot;обезличенныйquot; идентификатор и связанные с ним поиски информации, журналисты газеты New York Times Майкл Барбаро и Том Зеллер (Michael Barbaro, Tom Zeller) показали, как легко и просто можно вычислять реальных людей, отправлявших запросы в Сеть.

Более того, вскоре появились сайты вроде aolstalker.com и aolpsycho.com, которые существенно усовершенствовали процесс подобного вычисления, позволяя посетителям совместно анализировать, помечать и в ряде случаев явно идентифицировать конкретных людей по данным из массива запросов AOL. На доске объявлений сайта AOL Stalker, к примеру, посетители могли выбрать для ознакомления наиболее quot;занятныхquot; персонажей, вроде, скажем, quot;клиента #672368quot; - точнее, явно клиентки, интересующейся проблемами религии, беременности, шопинга и клиник-абортариев в одном из городов Северной Каролины…

Инцидент с раскрытием базы данных AOL и появление сайтов, эксплуатирующих этот промах компании, породили поток статей и бурные дискуссии в блогосфере о щекотливых проблемах приватности. Но, как ни парадоксально, эта история привлекла внимание только профессионалов-специалистов да небольшой части общества, интересующейся подобными вопросами. Для массовой же публики - с точки зрения долгосрочного воздействия на сознание - она прошла почти незамеченной. Проведенное через полгода в США социологическое онлайн-исследование показало, что лишь около 15% опрошенных могли хоть что-то припомнить о недавнем скандале с базой данных AOL.

Сторожа из Гугла

Другим не менее важным аспектом проблем вокруг контроля за накапливаемыми в Сети данными, является возрастающая власть интернет-компаний над тем, какую информацию пользователям выдавать можно, а какую нельзя. Многие по сию пору наивно считают, что Интернет является чем-то вроде заповедника свободы слова - коль скоро любой пользователь с сетевым доступом обретает потенциал для общения с глобальной аудиторией. По крайней мере, теоретически. Реальность же выглядит иначе. По мере того как все больше коммуникаций и выступлений перемещаются в онлайн, в блоги, форумы и сайты социальных сетей, окончательная власть в решениях о том, кто именно получает возможность быть услышанным и что именно они могут говорить, по нарастающей ложится на провайдеров, поисковые сервисы и другие влиятельные интернет-компании.

На сегодняшний день лидером среди всех этих quot;интернет-сторожейquot; является корпорация Google. Обслуживая 63% поисковых запросов на планете, а также крупнейшую в мире базу видеофайлов YouTube (плюс огромный блог-ресурс Blogger, плюс сайт обмена фотографиями Picasa, плюс сайт социальных сетей Orkut и т. д.), Google имеет колоссальное влияние на то, кто и как может находить аудиторию в Сети.

В руководстве корпорации, естественно, прекрасно понимают, сколь мощными рычагами владеют. Поэтому на вершине пирамиды Google с некоторых пор постоянно работает команда юристов, обладающая экстраординарной властью во всем, что касается решений о доступе пользователей к сетевому контенту. А именно, какие материалы можно оставить в свободном доступе, а какие надлежит немедля убрать или спрятать поглубже в недрах поисковых результатов. Учитывая гигантские масштабы Интернета, подобная затея с контролем узкой группой лиц может показаться заведомо обреченной на провал. Однако, по данным автора вышеупомянутой статьи в New York Times Magazine американского правоведа Джефри Розена, все обстоит именно так.

В частности, Розен рассказывает, как команда quot;решателейquot; во главе с Николь Вонг (Nicole Wong), замом генерального юрисконсульта Google, вынуждена то и дело заниматься судьбой множества острых видеороликов, постоянно выкладываемых пользователями на YouTube. Подобные видеоматериалы регулярно порождают претензии государств, обычно не самых демократичных, которые считают эти ролики противозаконными и требуют убрать их из Сети (или хотя бы сделать недоступными для своего населения).

К примеру, правительство Турции потребовало полностью запретить доступ своим гражданам к YouTube из-за нескольких видеоклипов, оскорбляющих quot;отца нацииquot; Мустафу Кемаля Ататюрка намеками на его нетрадиционную сексуальную ориентацию. Вот и пришлось Google собственными силами выявлять и убирать из YouTube все видеофайлы, так или иначе оскорбляющие Ататюрка (что по турецким законам расценивается как преступление).

Подобные демарши нередки. А спецкоманде quot;быстрого реагированияquot; Google приходится принимать решения, касающиеся и прочих сервисов компании - блогов, фотослужбы, социальной сети и, конечно же, поиска по ключевым словам. В статье Розена, правда, лишь вскользь отмечается, что Николь Вонг и ее коллегам приходится также надзирать за поисковой машиной Google. Именно они решают, что из спорных материалов может quot;светитьсяquot;, а что появляться не должно - как на центральном сайте Google.com, так и в местных поисковых сервисах, которые Google поддерживает во многих странах мира. (Подробности на сей счет можно найти во врезке quot;Аномалии поискаquot;.)

По мнению автора статьи, сложившуюся ситуацию можно воспринимать как контроль очень небольшой группы людей из элиты Google над онлайновой свободой слова в ее самом общем виде. И Розен крайне обеспокоен тем, что столь огромная власть концентрируется в руках узкой группы компаний (а по сути - единственной). Особенно, если принять во внимание зачастую противоречащие друг другу миссии Google: с одной стороны, подчиняться местным законам государств, будь они репрессивными или нет, а с другой - обеспечивать принцип quot;информации, не знающей границquot;; с одной стороны, quot;не быть зломquot;, а с другой#8194;- максимально успешно работать повсюду в этом очень злом порою мире…

Познакомившись с работой Google изнутри, Джефри Розен признает, что команде quot;решателейquot; пока удается ставить принципы свободы слова выше краткосрочных финансовых интересов фирмы. Однако те люди, что командуют контролем сейчас, не будут на своих постах вечно. И если история хоть чему-нибудь нас учит, заключает автор, то со временем их заменят юристы, куда более озабоченные корпоративными прибылями, нежели гражданскими свободами.

Аномалии поиска

Интернет-активист Дэниел Брандт, известный своими сайтами wikipedia-watch.org и scroogle.org с критикой Википедии и Google, недавно опубликовал статью о выявленных им любопытных аномалиях в работе поисковой машины Google (sethf.com/infothought/blog/archives/001403.html). А именно, что при общем ранжировании веб-страниц, отыскиваемых при поиске по ключевым словам, определенно работает некая фильтрация, принципы которой неизвестны, поскольку технические нюансы работы поисковой машины являются коммерческой тайной компании.

Тесты Брандта построены на основе сравнений поисков информации о его собственном сайте wikipedia-watch.org - как они выглядят в Google и в других популярных поисковых сервисах Yahoo и Live.com. Это удобно делать потому, что wikipedia-watch.org является популярным сайтом, имеющим многие тысячи внешних ссылок с других сайтов, что стабильно выводит его на верхние строчки в поисковиках Yahoo и Live.com. В то же время у Google имеются причины не любить конкретно Брандта и созданные им сайты. Из-за чего, полагает Брандт, заглавная страница wikipedia-watch.org очень редко попадает в top100, то есть первую сотню строк с результатами поиска через Google той или иной информации с критикой Википедии. Если же текущий рейтинг этого сайта высок, то он может - очень ненадолго - взлетать в верхние 10–15 строк Google, но исключительно лишь туда и никогда в интервал между местами 15 и 100.

Статья Брандта пестрит техническими наблюдениями и содержит quot;параноидальныйquot; (по характеристике самого автора) вывод, что помимо автоматической фильтрации в поисковике Google, похоже, имеется еще и элемент quot;ручной подстройкиquot;, подгоняющей результаты под текущую политическую ситуацию.

Самое забавное, что вскоре после этой публикации Брандта были отмечены существенные перемены в результатах поисков на Google относительно сайта wikipedia-watch.org. Если раньше запросы типа quot;can I sue Wikipediaquot; (могу ли я судиться с Википедией) или quot;Wikipedia plagiarismquot; (плагиат в Википедии) в Yahoo и Live.com выдавали сайт Брандта в первых 3–5 строчках, а в Google оказывались где-то между 300-м и 700-м местом, то теперь wikipedia-watch.org во всех трех поисковиках выводится одинаково.

Цена доверия

Специфику сложившейся ситуации интересно прокомментировал Тим Ву (Tim Wu), профессор права из Колумбийского университета, а в недавнем прошлом бывший кадровый сотрудник Google: quot;Чтобы любить эту компанию, вы должны быть немного монархистом, вы должны обладать верой примерно того же рода, что вера подданных королюquot;. А Google по сию пору ведет себя в целом достойно лишь потому, что жизнь и смерть корпорации в немалой степени зависит от доверия пользователей.

Более развернутое изложение этой же, по сути, идеи можно найти во множестве блогов. Мало кто уже сомневается, что Google в масштабах планеты, Baidu в Китае или Yandex в России стали инстанциями, принимающими ключевые решения о доступе к информации. Однако это вовсе не значит, что все мы оказываемся за дверью и не в силах повлиять на эти решения. Как потребители quot;бесплатныхquot; сервисов Google и подобных ей компаний, мы имеем и определенную степень влияния на них, причем вовсе не гипотетического. Ибо в тот момент, когда люди сочтут, что Google ведет себя неправильно, и перестанут верить компании, они задумаются о том, чтобы перенести свою сетевую активность куда-то еще, подальше от quot;сторожаquot;.[Нечто подобное происходит сейчас с AOL, пытающейся задушить альтернативные ICQ-клиенты (см. quot;13-ю комнатуquot;)]

Есть немало механизмов, с помощью которых общественность может удерживать Google со товарищи в узде. Во-первых, следует не бояться настаивать на прозрачности методов сбора и блокирования информации. Во-вторых, при использовании чьих-то интернет-сервисов имеет смысл помнить и о таких вещах, как минимизация затрат на переход к альтернативным услугам, чтобы подобное переключение (если компания вдруг поведет себя некорректно) оставалось реалистичной возможностью.

Интересно, что следование этим же принципам заметно влияет и на укрепление защиты приватной информации пользователей. Есть ощущение, что такая связь неслучайна.

Злоупотреблять - это просто

В Китае недавно разразился скандал вокруг Baidu.com, крупнейшего в стране поискового сервиса, обслуживающего 70% поисковых запросов в китайском сегменте Интернета. Руководство Baidu попало в крайне неловкое положение, поскольку фирму, как говорится, схватили за руку. Она позволяла нелицензированным поставщикам медицинских услуг и медикаментов подделывать документы и за деньги обеспечивала им высокие позиции в результатах поиска информации по определенным ключевым словам. Хотя достоверно неизвестно, как давно Baidu разрешила этим компаниям скупать высокие рейтинги, установлено, что китайские граждане покупали у них медуслуги и медикаменты по крайней мере несколько последних месяцев 2008 года. История получила широкую огласку к концу ноября, когда государственная телекомпания CCTV показала передачу, где люди жаловались на то, что заплатили уйму денег за неэффективные медуслуги и лекарства, найденные через Baidu.

В частности, один из больных рассказал, что потратил на лечение больше 10 тысяч юаней (около 1500 долларов) в quot;высококлассной клиникеquot;, которую нашел через Baidu, однако боли так и не прошли. После этого бедолага обратился в Народную больницу, крупнейшую клинику Пекина, где его быстро поставили на ноги всего за сотню юаней.

После скандальной передачи китайский Интернет буквально разрывало от гневных обвинений в адрес Baidu, так что компании не оставалось ничего иного, кроме как затеять внутреннее расследование, а затем наказать и уволить quot;нескольких недобросовестных сотрудниковquot;.