"Google. Прорыв в духе времени" - читать интересную книгу автора (Малсид Марк, Вайз Дэвид А.)

Виртуальная библиотека

Библиотека Мичиганского университета, функционирующая уже более полутора веков, является одним из крупнейших в Соединенных Штатах Америки хранилищ знаний (почти семь миллионов книг!) и признанным центром научных исследований. Ларри Пейджу, студентом бродившему среди ее стеллажей, она навевала воспоминания о веселых университетских деньках. И ей же отводилась ключевая роль в стратегических планах его компании. Он как раз искал нетронутые залежи информации, которую можно было бы перевести в цифровой формат и сделать доступной для поиска в Интернете. Библиотека Мичигана казалась ему Эверестом – вершиной, которую мало кто способен покорить.

Если XXI век считается эпохой информации, то именно Интернет, по мнению Брина и Пейджа, должен уничтожить все барьеры для ее распространения. Бытовала шутка, что благодаря Сети в 1996 году мир заново родился. Несмотря на наличие в базе данных Google миллиардов веб-страниц онлайн-энциклопедий, государственных документов, каталогов и т п., поиск в Сети серьезных, авторитетных и проверенных временем источников часто не давал желаемых результатов. Качество и достоверность информации были неоднородны. Пользователям, искавшим заслуживающие доверия источники, приходилось перерывать горы всевозможного хлама. Пейдж и Брин, сами неоднократно с этим сталкивавшиеся, после тщательного анализа всех стратегических и технических задач приняли смелое решение.

На званом обеде в студенческом городке Мичиганского университета осенью 2002 года Пейдж обратился к руководству университета с дерзким предложением: он возьмет на себя расходы по сканированию всех книг, имеющихся в университетской библиотеке, если ему позволят индексировать всю информацию в Google. Идея заключалась в том, чтобы перевести миллионы книг – самое ценное и самое практичное вместилище знаний – в формат, в котором они были бы доступны многим. В Интернете содержалось много отрывков из разных изданий, информации о книгах и даже полных текстов книг, не защищенных авторским правом, – таких как Библия и произведения Шекспира. Но огромное количество томов, изданных как в предыдущие столетия, так и относительно недавно, были представлены слабо.

Пейдж и Брин были готовы выделить значительные финансовые и технические ресурсы на оцифровывание миллионов книг, пылившихся и желтевших на полках малопосещаемых залов великих библиотек мира. Потенциал для расширения человеческих познаний был огромен. Впервые ученые (и не только) получат доступ к полным текстам книг независимо от того, в какой точке земного шара они находятся. (В изданиях, защищенных авторским правом, пользователи смогут просматривать лишь фрагменты страниц, а вот поиск можно будет вести по всему тексту.) Обладание сокровищем в виде эксклюзивного контента позволит Google предложить услугу, отсутствующую у конкурентов, увеличить посещаемость своего сайта и получать прибыль от релевантных рекламных объявлений, размещаемых в колонке справа. Более того, если Google поставит оцифровку книг на поток, другие библиотеки, вполне вероятно, тоже изъявят желание присоединиться к проекту, что обеспечит расширение базы доступного для поиска контента.

Перед Пейджем и Брином стояли серьезные препятствия. Им необходимо будет усовершенствовать технологию, позволявшую эффективно и точно оцифровывать книги в таких масштабах, в которых этого никто никогда не делал. Им также нужно будет найти библиотеки, которые согласятся принять участие в новом проекте, что для молодой компании представлялось очень непростой задачей. Именно поэтому они решили начать с библиотеки Мичиганского университета – альма-матер Пейджа. Ему, гордости университета, поддерживавшему с ним тесные связи, наверняка предоставят возможность изложить все свои доводы.

Через несколько месяцев после званого обеда Пейдж встретился с Уильямом Гослингом и Джоном Уилкином, руководителями университетской библиотеки. Предложение Пейджа их заинтересовало с самого начала: они и сами хотели оцифровать книги, но все никак не могли найти финансирование и подходящего партнера. В ходе предварительных переговоров с IBM и другими компаниями о сканировании части библиотечного фонда они, по словам Уилкина, «были очень далеки друг от друга в вопросах интеллектуальной собственности, плана работ, прав на оцифрованные книги, стандартов и пр.». Но переговоры с Пейджем с самого начала были пронизаны доверием. «После того как мы обсудили с Ларри основные вопросы, у нас было совершенно иное ощущение».

Параллельно Пейдж зондировал почву на предмет реализации своей идеи и в Стэнфорде – университете, с которым он также поддерживал тесные связи. Именно там у него, докторанта, зародилась идея о переносе офлайнового контента в Интернет. Он размышлял над этим в процессе работы над проектом «Цифровые библиотеки» вместе с профессором Терри Виноградом. И хотя в его рамках оцифровке книг не отводилось главное место, именно тогда Пейдж понял, что все печатные материалы можно сохранить в цифровом формате и выложить в Интернете, и заявил: «Мы отсканируем абсолютно все». «Еще до основания Google мы мечтали о том, чтобы сделать общедоступным бескрайний океан информации, который с такой любовью пестуют библиотекари», – вспоминает Пейдж. Но, как и в процессе работы над другими новшествами, в том числе над самой поисковой системой, главным мотивирующим фактором для Ларри и Сергея было стремление удовлетворить собственное любопытство.

«Я бы и сам хотел порыться в библиотечных фондах, – говорит Ларри. – Если вас интересует определенная тема, вам хочется выяснить, насколько глубоки знания в данной сфере». Он полагал, что сканирование и размещение книг в Интернете существенно облегчит жизнь ученых: им больше не нужно будет ездить по библиотекам в поисках информации, необходимой для научных исследований. «В настоящее время ученым очень сложно работать вне области своей специализации из-за географических барьеров». Ларри хорошо помнил, какое разочарование он испытал в детстве, когда не смог раздобыть инструкцию по сборке разобранной им электронной игрушки: «Их можно было достать только в одном книжном магазине». Нужная ему информация была доступна лишь в одной точке. То же самое можно было сказать и в отношении книг, пылившихся на стеллажах в залах университетских библиотек. И не имело значения, будет ли информация, содержавшаяся в них, пользоваться большим спросом – отсутствовал сам механизм доступа к ней широких масс.

Пейдж поделился своим видением на закрытой конференции, организованной миллиардером-филантропом Полом Алленом на его вилле на островах Сан-Хуан близ Сиэтла. Аллен пригласил к себе технических специалистов и университетских преподавателей, чтобы обсудить с ними свой проект под названием Final Encyclopedia («Окончательная энциклопедия»), являвшего собой некую стратегию по сбору информации. Профессор Стэнфорда Терри Виноград, получивший приглашение, делегировал вместо себя Пейджа, ну а тот воспользовался представившейся возможностью и рассказал директору библиотеки Стэнфордского университета Майклу Келлеру о своей идее поставить на поток оцифровку книг, подчеркнув, насколько важно внести книги в доступный для поиска универсум Всемирной сети. Келлер согласился с ним, и Google со Стэнфордом приступили к обсуждению условий сотрудничества.

«Идея о массовом сканировании книг уже долгое время интересует Стэнфорд, – заметил сотрудник библиотеки университета Эндрю Герковиц. – Google представила нам концепцию прорыва, над которым мы ломали голову в течение многих лет».

Сидни Верба, директор библиотеки Гарвардского университета, был наслышан обо всех схемах перевода книг в цифровой формат – даже о той, которая предполагала транспортировку редких изданий в другие страны, где эту трудоемкую работу можно было выполнять с меньшими затратами. Последняя для почтенного учреждения, которым заведовал Верба, была неприемлема. Библиотека Гарварда, открытая в 1638 году, является крупнейшим университетским хранилищем книг в мире. Верба и сотрудники библиотеки изучали возможные способы оцифровки ее огромного фонда (около 15 миллионов книг), но пришли к выводу, что все эти схемы предполагают очень большие затраты и не гарантируют сохранности книг.

Поэтому Верба был настроен довольно скептически, когда осенью 2002 года принимал представителя Google, приехавшего обсудить возможность оцифровывания всей библиотеки Гарварда. «Я даже не знаю, как это выразить словами – у меня было такое чувство, что они задумали что-то серьезное», – вспоминает Верба, отмечая, что сама беседа прошла в теплой и дружеской атмосфере. Они затронули такие вопросы, как затраты, время отсутствия книг в библиотеке и возможный ущерб. «Я подумал, что будет очень здорово, если им удастся сделать это, – говорит Верба. – Но скепсис все же отравлял мой оптимизм. Я считал, что пройдет еще очень много времени, прежде чем все книги библиотеки будут оцифрованы».

Несколько месяцев спустя из Google прибыла команда ведущих разработчиков. В их обновленной презентации описывался «гораздо более эффективный и менее вредный способ сканирования книг», вспоминает Верба. «Когда я впервые услышал об этом, у меня мелькнула мысль, что им вряд ли удастся это осуществить. Но когда они вернулись, стало ясно, что проделана огромная работа по технической стороне проекта и обдуманы все основные моменты. Теперь этот проект выглядел вполне осуществимым». Поэтому он и другие сотрудники библиотеки Гарвардского университета нанесли визит в Googleplex, чтобы увидеть новые устройства для сканирования своими глазами. «Мы были поражены. Особенно поразило нас то, что они своими силами создали новый, высокопроизводительный аппарат для сканирования, переводивший книги в цифровой формат. С книгами он обращался гораздо нежнее, чем сканирующие устройства других фирм. Вопрос о целесообразности сотрудничества с Google отпал сам собой».

Следующим шагом было обсуждение проекта с Harvard Corporation – управляющим органом университета. Корпорация во всем придерживалась принципа «осторожность превыше всего», и ее руководители хотели гарантий, что против университета не будут возбуждать иски о нарушении авторских прав и что он не будет нести больших затрат – даже несмотря на то, что Google предложила взять на себя все расходы, связанные с реализацией проекта по сканированию книг. «Если кто-то что-нибудь делает для тебя, тебе тоже приходится платить», – замечает Верба. Имелись также определенные опасения относительно целесообразности сотрудничества старого уважаемого университета и молодой ИТ-компании, в особенности учитывая недавний обвал рынка интернет-технологий. Google было всего шесть лет от роду, тогда как Гарварду – триста семьдесят пять.

К концу 1990-х годов технология сканирования печатных материалов для перевода их в цифровой формат получила широкое распространение: во многих офисах имелся настольный сканер, позволявший преобразовывать документы, фотографии и другие материалы в компьютерные файлы. Однако процесс этот невозможно было приспособить под объем в несколько миллионов томов. Компании необходимо было разработать устройство, которое оцифровывало бы книги с высокой скоростью и точностью.

Весной 2003 года специалисты Google встретились с сотрудниками библиотеки Мичиганского университета, чтобы в деталях рассмотреть способы и технологию сканирования. В прошлом перед оцифровыванием Мичиган нередко прибегал к расплетению книг – отдельные листы сканировать было проще и быстрее. Это ускоряло процесс, однако многие библиотекари не одобряли такой практики, поскольку при расплетении книги часто повреждались. Google тоже экспериментировала с «деструктивным» сканированием: для своего сервиса Froogle и проекта Google Catalogs, работа над которым велась с перерывами, она отрезала корешки каталогов и пропускала отдельные страницы через листоподающее устройство, напоминавшее более мощную копировальную машину. Но, принимая во внимание масштабы проекта, стороны пришли к выводу, что расплетение – это не лучший вариант. Поэтому специалисты Google принялись за разработку системы, которая обеспечивала бы быстрое сканирование страниц и одновременно бережное обращение с книгами. Они изучали, как работают автоматические устройства, переворачивавшие страницы роботизированными «руками» или путем подсоса воздуха, что позволяло производить сканирование практически без участия человека. В конечном итоге остановились на процессе, предполагавшем использование ручного труда, – взяли на вооружение запатентованную технологию, которая удовлетворяла их потребностям. Google возьмет на работу несколько десятков специалистов, которые пройдут в компании обучение обращению с книгами и сканирующими устройствами. «М ы не придумывали фотоаппарат. И не придумывали сканирование, – говорит Адам Смит, руководитель проекта по оцифровке библиотечных книг. – Здесь важна не столько технология, сколько процесс».

Уилкин оценил по достоинству решение Google. «На это у них ушло больше времени, чем они предполагали, но они справились».

Per Kapp, директор Бодлеанской библиотеки при Оксфордском университете, зимой 2002 года собирал средства для реализации собственного проекта по оцифровке книг и случайно завязал беседу с Раймондом Насром – директором Google по связям с топ-менеджментом. Наср приехал в Оксфорд для встречи со студентами факультета «Бизнес» в рамках программы «Силиконовая долина в Оксфорде», и Карр, воспользовавшись представившейся возможностью, показал гостю легендарный университетский городок со зданиями в готическом стиле, богатая история которого просто зачаровывает. Естественно, он не преминул поднять вопрос о возможном сотрудничестве Google с Бодлеанской библиотекой.

«Мой главный аргумент был следующим: Бодлеанская библиотека одна из известнейших в мире, a Google – лидер в сфере информационных технологий и поиска информации, поэтому мы вполне могли бы осуществить какой-нибудь совместный проект», – говорит Карр. Для него как специалиста по сбору средств главная задача – «получить ресурсы на то, чем ты уже хочешь заниматься». Поскольку Бодлеанская библиотека при Оксфордском университете является депозитарной, то есть она получает экземпляр каждой книги, изданной в Великобритании (как и Библиотека Конгресса в Соединенных Штатах Америки), Карр полагал, что она представляет для Google особый интерес. Бодлеанская библиотека также вторая по величине в Соединенном Королевстве.

Если кто-то и сомневался в заинтересованности Google приобщить к проекту Оксфордскую библиотеку, то все сомнения были развеяны осенью 2003 года, когда Карр решил в Сан-Франциско организовать благотворительный обед. Наср, вошедший в состав организационного комитета, помог продать столики. Среди гостей, конечно, была и Google. Для Карра этот обед стал хорошей возможностью познакомиться с ее руководством и произвести впечатление на публику. Мероприятие проходило в арендованном им изысканном здании Butter-field's в центральной части Сан-Франциско. «Руководители Google присутствовали в полном составе», – отмечает он. Дабы придать происходящему соответствующий шарм, он распорядился, чтобы банкетный зал оформили в стиле Оксфордского университета. Редкие книги на сумму в 50 миллионов фунтов стерлингов, специально транспортированные из Великобритании, охраняли вооруженные до зубов охранники. Попивая изысканные напитки, Ларри, Сергей и другие сотрудники Google общались с гостями у стендов с сокровищами мировой литературы, среди которых были копия «Великой хартии вольностей» и оригинальная рукопись «Кентерберийских рассказов» Чосера.

Несмотря на присутствие руководителей Google на Оксфордском обеде, проект по оцифровке библиотечных книг для широкой общественности был тайной за семью печатями. Google настаивала на полной секретности этого проекта, ставя тем самым своих университетских партнеров в неловкое положение. «Все, похоже, очень боятся соглашения о неразглашении конфиденциальной информации, навязанного Google», – заметил Эндрю Герковиц из библиотеки Стэнфорда. Google потребовала, чтобы все, кто имеет отношение к проекту, подписали строгое соглашение о неразглашении – документ, очень распространенный в мире бизнеса, но доселе невиданный в сообществе библиотекарей.

Поль Ле Клер, директор Нью-Йоркской публичной библиотеки, тоже вевший переговоры с Google о сканировании собрания научно-технической литературы, заметил: «Мне даже трудно сказать, подписывал ли я когда-нибудь соглашение о неразглашении». Верба же понимал, почему Google настаивала на неразглашении, но все равно ощущал определенный дискомфорт. «Google не распространялась о том, с кем она ведет переговоры. Они предпочитали действовать тихо, не привлекая внимания. Университеты же являются открытыми учреждениями. Я испытывал некоторую неловкость из-за того, что не мог рассказать преподавателям университета о том, что произойдет в скором времени». Сообщество, практиковавшее открытое распространение информации, считало требование о неразглашении странным и даже парадоксальным.

Первого февраля 2004 года тайна едва не стала достоянием общественности. В газете The New York Times в статье о перспективах Google был вскользь упомянут проект по оцифровыванию собрания библиотеки Стэнфорда, имевший кодовое название Project Ocean. В сообществе библиотекарей заговорили о том, что, вероятно, грядет нечто серьезное, но раздобыть более конкретную информацию так и не смогли.

В июле, когда Google готовилась к выходу на биржу, группа Google Print привезла в Мичиганский университет первые сканирующие устройства и приступила к обучению специалистов-подрядчиков, которые будут с ними работать. Мичиган должен был стать «испытательным полигоном» для нового оборудования и процесса сканирования. Когда к зданию библиотеки подъехала машина с оборудованием для сканирования, один сотрудник университета, не задействованный в проекте, стал расспрашивать присутствующих, что происходит. Уилкин понял, что им нужно как можно быстрее выработать стратегию, которая обеспечила бы сохранение конфиденциальности информации. Совместный проект с Google было решено «замаскировать»: предоставленное компанией оборудование они установили в той части здания библиотеки, где уже производилось сканирование книг, а на двери повесили табличку «Michigan Digitization Project» («Проект по оцифровке книг библиотеки Мичигана»). «И больше никаких вопросов не было», – говорит Уилкин.

Выбор технологии сканирования лишь одна из проблем, которые необходимо было разрешить в процессе подготовки к реализации проекта. Google внимательно прислушивалась к пожеланиям библиотек относительно обращения с их книгами. Этот аспект имел большое значение для библиотекарей и архивариусов, которые хотели сохранить собрание для потомков. Но вот как насчет того элемента, который не принадлежал университету, – авторского права? В этом-то вся и суть: сканирование идей и текстов, то есть всего то, что юристы называют интеллектуальной собственностью. Почти по каждой из книг, изданной в Соединенных Штатах Америки после 1923 года, авторское право принадлежит издателю, автору или третьей стороне.

Американское законодательство об авторском праве – это очень сложная сфера, изобилующая противоречиями и нестыковками. Google пришлось столкнуться с множеством подводных камней. Закон о защите авторского права дает возможность компаниям-издателям и авторам зарабатывать деньги на литературных произведениях. Да, проект по оцифровке библиотечных книг имел целью прежде всего свободное распространение знаний, но на кону были большие деньги. А это означало, что протесты и судебные иски против Google – лишь дело времени. «Было бы наивно полагать, что эта деятельность не будет предметом судебных разбирательств, – отметил Герковиц. – Наши надежды и амбиции могут закончиться на первых же судебных слушаниях. Google держит ухо востро. Они знают, что рано или поздно их схватят за руку. Мы, Стэнфорд, вероятно, тоже не сможем наблюдать за происходящим со стороны». Осознавая всю важность этого вопроса, Google согласилась возместить библиотекам все расходы, связанные с возможными судебными исками по поводу авторских прав.

Майк Келлер, директор библиотеки Стэнфорда, подход Google считал очень разумным. «Объединив в одну связку пять очень крупных библиотек, мы имеем хорошую возможность сообща поработать над рядом проблемных вопросов – в частности, исследовать американское и английское законодательство в сфере авторского права», – отметил он.

«Заручиться поддержкой книгоиздателей очень важно, – признал Пейдж. – Для того чтобы наш проект работал, следует помочь издателям зарабатывать деньги». Он понимал, что заверения Google могут быть восприняты как пустые обещания. Поэтому их необходимо будет подкрепить конкретными действиями.

В начале октября 2004 года Ларри и Сергей посетили Франкфуртскую книжную ярмарку – крупнейший форум представителей книгоиздательской индустрии, на котором объявили о запуске нового поискового инструмента, Google Print (позднее переименованный в Book Search). С типично гугловским энтузиазмом, светящимися значками и футболками с логотипом компании, предназначенными для посетителей, Брин и Пейдж, облаченные в костюмы и галстуки, провели 40-минутную пресс-конференцию. Они поведали собравшимся о том, как именно они сделают защищенные авторским правом книги доступными для поиска в Интернете и постараются при этом избежать судебных исков и недовольства книгоиздателей. Их идея была не совсем новой – компания Amazon com годом раньше запустила нечто подобное под названием Search Inside This Book («искать в этой книге»), – однако момент для ее обнародования был выбран очень удачно.

Книгоиздатели даже не знали, как им относиться к этой затее. С одной стороны, они разделяли интерес Google к распространению информации и могли получать дополнительную прибыль благодаря наличию своих продуктов в Сети. С другой – Google стремилась распространить контент максимально широко и предоставлять его бесплатно, одновременно зарабатывая деньги на размещении рекламы, тогда как издателям нужно было свои книги продавать. Только в CШA каждую неделю издавалось более тысячи книг. Объем контента впечатлял, а потому, оценив свой потенциал, Google предложила книгоиздателям что-то вроде сделки: компания берет на себя все затраты, связанные со сканированием и индексированием книг, в обмен па право показывать их в результатах поиска. Демонстрироваться будут лишь несколько страниц или фрагментов текста, содержащих слова из запроса пользователя, и формате, исключающем возможность копирования или распечатывания. Google будет предоставлять библиографическую информацию и ссылки на сайты издательств, а также отчислять издателям часть дохода от размещения рекламных объявлений на страницах с результатами.

Замысел Google был прост: предоставить читателю отрывок, который побудит его впоследствии приобрести книгу. К моменту открытия Франкфуртской книжной ярмарки большинство крупных книгоиздателей заключили соглашение о сотрудничестве с Google. (Amazon к тому времени уже располагала около 120 тысячами книг и 33 миллионами страниц текста.) Немаловажным моментом было и то, что сервис Google Print заручился поддержкой издателей еще до того, как было объявлено о запуске суперсекретного проекта по оцифровыванию библиотечных книг.

Четырнадцатого декабря 2004 года Google наконец объявила о своем намерении произвести оцифровку 15 миллионов библиотечных книг. The New York Times, «седая леди» печати, статью об этом поместила на первой полосе. «Э т о огромный шаг вперед, – отметил Майкл Келлер. – Проект придаст оцифровке книг Стэнфорда промышленные масштабы». Некоторые даже сравнили его по значимости с изобретением печатной машины. «Сегодня мир изменился», – заявил Джон Уилкин.

Действительно, даже на начальном этапе реализации проекта масштабы были впечатляющими. Соглашения, заключенные Google, предусматривали оцифровывание всех семи миллионов книг библиотеки Мичиганского университета; более миллиона изданий XIX века Бодлеанской библиотеки; 40 тысяч – библиотеки Гарварда; 12 тысяч – Нью-Йоркской публичной библиотеки и неуточненного числа книг библиотеки Стэнфордского университета. Если библиотеки, согласившиеся лишь на пилотную программу, изъявят желание оцифровать все свое собрание, то в базе данных Google по завершении процесса сканирования (примерно лет через десять) будет свыше 50 миллионов полных текстов книг. Для сравнения: индекс Google в 1998 году, когда Брин и Пейдж запустили свой поисковый сервер, включал 25 миллионов веб-страниц.

Однако не все считали проект по оцифровке книг хорошим начинанием. После объявления о его запуске ряд издателей, писателей и сотрудников библиотек, видевших в намерениях Google серьезную угрозу, предприняли попытку очернить его. В своей статье, опубликованной в газете Los Angeles Times, Майкл Горман, на тот момент новоизбранный президент Американской ассоциации библиотек, невысоко оценил усилия «мальчиков буги-вуги». «Огромные базы данных с оцифрованными книгами – это дорогие и бесполезные затраты, – писал он, – которые базируются на странном представлении, что впервые в истории один способ передачи информации (электронный) вытеснит и уничтожит все ранее существовавшие. Последняя версия гугловского очковтирательства, несомненно, встанет в один ряд с такими провальными проектами, как организация поездок на работу на маршрутном вертолете и перенос всей Библиотеки Конгресса на рулон микропленки, умещающийся в обычном дипломате».

Во Франции новый проект Google расценили как поигрывание Америки «культурными» мускулами. Так, Жан-Ноэль Жаннени, директор Национальной библиотеки Франции, писал в газете he Mond, что он таит «угрозу тотального доминирования Америки в области формирования представления о мире у будущих поколений». «Я не хотел бы, чтобы о Французской революции могли рассказать только отобранные Соединенными Штатами книги», – заметил он.