Всего за 499 руб. Купить полную версию
Приведу пример из личного опыта. Как-то раз мне довелось пообщаться с генеральным директором компании, специализирующейся не на чем-нибудь, а на data science. Я задал ему вопрос: «Сколько специалистов по обработке данных в вашем высшем руководстве или совете директоров?» Мой собеседник изобразил пальцами большой ноль. Удивительно: неужели сама мысль, что специалист по обработке данных может представлять компанию или выступать от ее имени, настолько всех пугает? Эта история иллюстрирует проблему в пространстве данных и дата-аналитики постоянно действуют разрозненные и центробежные силы. В прошлом сфера данных, ПО и технологий всегда существовала в организациях как бы отдельно от всего остального. Ответственные за эту сферу сотрудники считались узкими специалистами, от них не требовалось владеть навыками коммуникации и публичных выступлений. Эту ситуацию необходимо в корне менять, и перемены должны стать частью стратегии.
Меня постоянно спрашивают: есть ли у специалистов по обработке данных собственное место в мире дата-грамотности? Я с полной уверенностью отвечаю: да! Если мы собираем мозаику информационно-аналитической стратегии и говорим о необходимости демократизации данных в организациях, то уметь эффективно общаться на языке данных должен каждый. Это означает, что внутриорганизационная подготовка специалистов-профессионалов по обработке данных будет отличаться от подготовки, которую должны пройти сотрудники, которые только начинают работать с данными. Нам нужно, чтобы настоящие специалисты учились выступать перед широкой публикой, эффективно общаться и помогать всем остальным путешествовать по миру данных. Готов поспорить, у большинства специалистов по обработке данных есть этот неприятный опыт: когда ты выступаешь перед аудиторией с результатами своей работы, а встречаешь абсолютно непонимающие взгляды. Масса важнейших знаний и идей остаются незамеченными просто потому, что аудитория не способна их воспринять. Дата-грамотность требует от специалистов строить выступление так, чтобы язык, на котором они говорят, был понятен каждому. Их роль должна измениться: теперь им следует вдохновлять других овладевать дата-грамотностью.
Что еще могут делать специалисты по данным в мире дата-грамотности? Мы установили, что не каждому нужно быть узким специалистом, но каждому нужна дата-грамотность. Так какое место в этом мире должны занимать узкоспециальные технические методы обработки и анализа? В организации должно я подчеркиваю, должно быть место для обработки данных в чистом виде. Это гарантирует, что люди, обладающие соответствующими профессиональными навыками, смогут строить работающие аналитические модели. Обработка данных в чистом виде это использование данных для тестирования, построения гипотез, применения статистических методов, прогнозирования, моделирования, создания алгоритмов и т. д. Это техническая часть нашей мозаики. И она необходима каждой организации. Только в этом случае данные и дата-аналитика обретают истинную силу. А чтобы все подразделения и сотрудники организации смогли воспользоваться этой силой, необходима эффективная коммуникация.
Дата-грамотность и визуализация данных
Мир дата-грамотности огромен и состоит из множества движущихся частей, но есть один элемент, способный облегчить работу буквально всем: визуализация данных. Что это такое? Это упрощенный подход к изучению данных. Представьте себе, что вам нужно проанализировать таблицу данных из 100 000 строк и 50 столбцов. Обрадует вас такая перспектива? Визуализация данных дает возможность упрощать большие объемы данных, поскольку мы с вами способны воспринимать зрительные образы. Поясню на примерах.
Рис. 4.2 представляет собой одну из моих самых любимых визуализаций. Мы можем проследить за походом Наполеона в Россию 1812 года и увидеть, как таяла его армия. И все это в упрощенном виде. А теперь представьте себе те же данные, но в виде объемной таблицы. Или в виде множества публикаций в различных журналах (и вам нужно выискивать цифры самостоятельно, а затем составлять целостную картину). Много удовольствия вы бы получили, пытаясь таким образом понять, что же произошло с армией? Эта визуализация помогает упростить представление о наполеоновском походе.
Слышали ли вы про вспышку холеры, которая произошла в XIX веке в Лондоне на Брод-стрит (ныне Бродвик-стрит)? Если нет, взгляните на рис. 4.3. Это очень интересное исследование: визуализация данных помогла обществу сдержать эпидемию опасного заболевания. Врач Джон Сноу определил, что источником вспышки холеры стала загрязненная вода из водоразборной колонки, которой пользовалось множество людей. Получив нужную информацию, власти Лондона установили причинно-следственную связь и распорядились закрыть колонку, что предотвратило дальнейшее распространение болезни. Согласитесь, визуализация данных сработала на удивление эффективно!
Эти примеры показывают, как полезно упрощать представление данных. А теперь давайте разберемся, что же такое визуализация. Слишком глубоко закапываться в эту тему мы не будем, лучше полистайте замечательную «Большую книгу об информационных панелях» (The Big Book of Dashboard) С. Векслера, Дж. Шеффера и Э. Котгрейва, но все же давайте слегка коснемся вопроса.