II. Баланс сил
Google был зарегистрирован в 1998 году. Стэнфордские аспиранты Ларри Пейдж и Сергей Брин основали его всего два года спустя после того, как браузер Mosaic открыл всемирную паутину для компьютерной публики. С самого начала компания воплощала в себе обещание информационного капитализма как освободительной и демократической социальной силы, которая вдохновляла и восхищала людей второго модерна по всему миру.
Благодаря такому масштабному подходу Google успешно внедрила компьютерное посредничество во множестве новых областей человеческого поведения, по мере того как люди пользовались поиском в интернете и строили свои взаимодействия с сетью с помощью растущего списка сервисов Google. Возникновение этих новых видов деятельности сопровождалось появлением совершенно новых источников данных. Например, в дополнение к ключевым словам, каждый поисковый запрос Google генерирует целый спектр побочных данных, таких как количество и последовательность поисковых терминов, конкретная формулировка запроса, орфография, пунктуация, паузы при наборе, последовательность кликов мышкой и географическое местоположение.
Вначале эти поведенческие побочные продукты хранились как попало и ни для чего не использовались. Первым человеком, который осознал чрезвычайную важность этих случайно сохраненных данных для Google, часто называют Амита Пателя, молодого аспиранта Стэнфорда, проявлявшего особый интерес к «интеллектуальному анализу данных». Его работа с подобными журналами данных убедила его в том, что на основе неструктурированных сигналов, сопровождающих каждое онлайн-действие, можно выстроить подробный рассказ о каждом пользователе его мыслях, чувствах, интересах. Эти данные, заключил он, представляют собой по сути «широкий датчик человеческого поведения» и могут быть незамедлительно использованы для реализации мечты одного из соучредителей, Ларри Пейджа, о Поиске как о всеобъемлющем искусственном интеллекте[133].
Инженеры Google вскоре поняли, что непрерывные потоки побочных поведенческих данных могут превратить поисковую систему в рекурсивную самообучаемую систему, которая постоянно улучшает результаты поиска и стимулирует инновации в виде таких продуктов, как проверка орфографии, перевод и распознавание голоса. Как заметил тогда Кеннет Кукье,
Другие поисковые системы 1990-х имели шанс сделать то же самое, но не воспользовались им. Около 2000 года в Yahoo! разглядели этот потенциал, но идея осталась идеей. Именно Google распознал золотой песок в пустой породе своих взаимодействий с пользователями и позаботился о том, чтобы собрать его <> Google использует информацию, образующуюся как побочный продукт взаимодействия с пользователем, или «выхлоп данных», который автоматически перерабатывается для улучшения существующих услуг или создания совершенно новых продуктов[134].
То, что рассматривалось как отходы производства «выхлоп данных», оседающий на серверах Google во время работы поискового «движка», быстро было переосмыслено как критический элемент превращения поисковой системы Google в процесс непрерывного самообучения и самосовершенствования.
На этой ранней стадии развития Google петля обратной связи, связанная с улучшением ее функций поиска, создавала нужный баланс сил: поиску требовались люди, на которых он мог бы учиться, а людям требовался поиск, который позволял им учиться. Благодаря этому симбиозу алгоритмы Google обучались и выдавали всё более релевантные и полные результаты поиска. Чем больше запросов, тем больше обучения; чем больше обучения, тем более релевантны результаты. Больше актуальности больше поисков и больше пользователей[135]. К тому времени, когда молодая компания провела свою первую пресс-конференцию в 1999 году, чтобы объявить о покупке акций компании на 25 миллионов долларов со стороны двух наиболее уважаемых фирм венчурного капитала Кремниевой долины, Sequoia Capital и Kleiner Perkins, поиск Google уже обрабатывал по семь миллионов запросов в день[136]. Несколько лет спустя Хэл Вэриан, который в 2002 году пришел в Google в качестве главного экономиста, заметит:
Каждое действие, которое выполняет пользователь, считается сигналом, который нужно проанализировать и передать обратно системе[137].
Алгоритм Page Rank, названный в честь его основателя, уже давал Google значительное преимущество в определении наиболее популярных результатов для поисковой выдачи. Но в течение следующих нескольких лет именно сбор, хранение, анализ и изучение побочных продуктов этих поисковых запросов превратят Google в золотой стандарт веб-поиска.
Здесь необходимо понимать одно важное отличие. В этот ранний период поведенческие данные работали на благо пользователя. Пользовательские данные бесплатно создавали ценность, и эта ценность реинвестировалась в пользовательский опыт в виде совершенствования качества услуг улучшения, которые пользователи тоже получали бесплатно. Пользователи предоставляли сырье в форме поведенческих данных, и эти данные собирались для повышения скорости, точности и актуальности, а также для создания дополнительных продуктов, таких как перевод. Я называю это циклом реинвестирования поведенческой стоимости (или ценности), в котором все поведенческие данные реинвестируются в улучшение продукта или услуги (рис. 1).