Крупная организация
Большой зрелой организации, которая уделяла достаточное внимание своей информационной системе, нет нужды использовать даже расширенные версии популярных CRM. Потому что у них уже есть подобная система в каждом отделе. Они ее уже выстрадали регулярной и планомерной работой многих специалистов компании по развитию собственной системы и убедились, что делать свое намного выгоднее и удобнее, чем купленное на стороне. При этом в организации уже трудится пара программистов, способных за считанные часы добавить новые функции, перестроить старые рабочие процессы или увеличить вместимость озера данных. Благодаря их деятельности все большие данные компании находятся в руках компании, что позволяет проводить серьезную аналитику и машинное обучение хоть каждый день.
Большие данные в компании
От темы CRM вернемся к большим данным. Ими же наполнена и самодельная CRM, сводку о состоянии которой видит руководитель компании на своей информационной панели каждый день. Давайте разберемся, как эти данные используются в разных отделах организации, как собираются и обрабатываются. Но сначала познакомимся с основными профессиями, которые связаны с большими данными.
В реальной жизни количество параметров, отслеживаемых/собираемых в рамках «больших данных», может достигать нескольких тысяч. Эти данные не ограничиваются стенами предприятия или даже границами города. К примеру, один из крупнейших банков нашей страны при выдаче ипотечного кредита использует сотни параметров. В том числе такую экзотику как «количество занятых одноместных номеров в трехзвездочных гостиницах в радиусе 500 метров от приобретаемой квартиры». Все значения этих параметров непрерывно отслеживаются и обновляются в автоматическом режиме. Для этого создаются специальные программы, которые, словно конвейер, неустанно доставляют информацию в озеро данных компании. При этом старые сведения не удаляются. К ним лишь добавляются новые. Из-за этого хранилища могут разрастаться до невероятных размеров (отсюда и название «большие данные»). Сбором, обработкой, сжатием и упорядочиванием данных занимаются инженеры данных (Data Engineer). Эти же специалисты конвертируют информацию в таблицы для дальнейшего ее анализа и построения графиков на ее основе.
После того как данные собраны и преобразованы в подходящий для анализа вид, в дело вступают аналитики данных (Data Analitycs). Они представляют информацию в виде наглядных графиков, в которых нуждается бизнес. Также аналитики ищут в данных полезные связи, новые способы их демонстрации, что позволило бы руководству лучше оценивать текущую ситуацию. Цель работы этих специалистов найти пути получения прибыли из собранной информации. Аналитики думают только о деньгах. Они не умеют настраивать хранилища, управлять озером данных или круто программировать, поэтому инженеры по данным должны предоставлять им хорошо подготовленную информацию в удобной форме. Но именно аналитики знают, как из этих данных получить дополнительную маржу, как превратить данные в деньги.
Собранные большие данные позволяют буквально предсказывать будущее в результате учета значимых связей и зависимостей между отдельными компонентами данных, выявленных программными алгоритмами. Созданием инструментов для подобных прогнозов занимаются специалисты по машинному обучению (Machine Learning Engineer). Они могут заставить компьютер проанализировать тысячи собранных параметров с миллионами значений, чтобы предсказать практически любой экономический показатель. Имея достаточно данных и используя машинное обучение, профессионалы могут ответить на любые вопросы, касающиеся оптимизации продукта и максимизации прибыли.
Вспомните пример с ипотечным кредитом и странным параметром «количество занятых одноместных номеров в трехзвездочных гостиницах в радиусе 500 метров от приобретаемой квартиры». На наш обывательский взгляд, данный пункт вряд ли влияет на спрос жилья в районе. А собственник бизнеса или топ-менеджер никогда не попросит инженера по данным построить график зависимости прибыли от этого параметра на информационной панели в системе компании. Но с точки зрения машинного обучения данный фактор может внести существенный вклад в предсказания, потому что компьютер, в отличие от человека, способен уловить любую, даже еле заметную, связь в параметрах.
Все три профессии аналитик, инженер по данным и специалист по машинному обучению называют одним термином «специалисты по данным» (англ. Data Scientists). Благодаря их слаженной работе руководство компании может в реальном времени наблюдать за всеми показателями, прогнозировать будущее и тестировать предложения по смене стратегии компании.
Как начать собирать большие данные
В каждой компании существует свой уникальный производственный процесс. Любая его стадия может быть описана определенными величинами в цифрах: количество выполненных операций, себестоимость использованных комплектующих, затраченное время и количество задействованных сотрудников и т. д. и т. п. Эти цифры необходимо собирать и хранить, чтобы в будущем найти между ними взаимосвязь. Обнаружив ее, можно будет разработать стратегию развития компании, выделить основные показатели и определить для них желаемые значения. Без количественной оценки конкретных параметров любое улучшение в компании будет казаться сотрудникам очередной бесполезной инициативой руководства. В такой ситуации топ-менеджер или собственник не сможет аргументированно доказать необходимость изменений.
Попробуем разобрать популярные методики сбора информации и организации деятельности в компаниях, которые уже работают полностью «в цифре». Допустим, ваше собственное предприятие разделено на несколько отделов по роду деятельности, в соответствии с современными канонами управления[5]:
Административное отделение.
Отделение создания и построения компании.
Отделение распространения (маркетинг и рекламу рассмотрим отдельно).
Финансовое отделение.
Техническое отделение.
Отделение квалификации и качества.
Отделение по работе с клиентами и партнерами.
Конечно, в вашей компании деление может быть несколько иным, но в качестве примера рассмотрим именно такой вариант. Пройдемся по всем отделам, обсудим, как вообще можно провести их цифровизацию с нуля, чтобы начать собирать данные.
Сразу уточню, что, говоря о больших данных для бизнеса, почти всегда подразумевают их привязку к дате и времени. Например, если ведется статистика количества опубликованных рекламных материалов, то в собранной информации обязательно присутствует время. То есть сколько штук в какой день и час было опубликовано. Привязка ко времени критически важна для предсказания циклических процессов при машинном обучении. Поэтому почти все примеры собираемых данных, приведенные в этой книге, стоит дополнять пунктом «дата и время наступления события».
Административное отделение
Административное отделение определяет направление развития и общие цели компании. Работу по внедрению цифровизации и запуску сбора больших данных стоит начать с этого отделения, потому что зачастую именно управленцы (на разных уровнях) останавливают автоматизацию производства. Саботаж сотрудников происходит по нескольким причинам: