Валентин Юльевич Арьков - Бизнес-аналитика. Извлечение, преобразование и загрузка данных стр 14.

Шрифт
Фон

Format Data Series  Series Options  Fill & Line  Marker  Marker Options  Built-in  Size  2.

Fill  Solid fill  Color  Light Gray.

Border  No line.

Можно видеть траекторию, на которой одна бумага отстаёт от изменений второй. В этом конкретном примере «металлы» и «газ» изменяются почти «в противофазе». Это явление обычно учитывают в моделях динамики за счёт введения запаздывания.


Рис. 6.41. Комбинированная диаграмма


Задание. Постройте комбинированную диаграмму.


Построим обычную диаграмму динамики, чтобы рассмотреть зависимость изменений по разным бумагам.

Построим новую сводную таблицу на новом листе.

В этот раз оставим группировку по годам и дням. То есть данные не будут сгруппированы вообще.

Удаляем общие и промежуточные годовые итоги.

Мы получили слегка изменённую объединённую таблицу (рис. 6.42).

Теперь у нас котировки по каждой бумаге расположены в отдельных колонках. Так будет немного легче работать.


Рис. 6.42. Данные по бумагам без группировки


Задание. Постройте сводную таблицу (рис. 6.42).


Построим диаграмму динамики

Insert  Charts  Insert Line or Area Chart  2D Line  Line.

В сводной таблице отключаем промежуточные годовые итоги.

Выбираем данные для графика.

Это будут два разных набора данных их разных колонок.

По оси «иксов» пока ничего не указываем. Здесь отображаются порядковые номера точек.

Поскольку уровни цен разные, настроим раздельные оси для каждого графика.

Format Data Series  Series Options  Series Options  Plot Series On  Secondary Axis.

Задаём масштаб по каждой оси отдельно, чтобы на графике не было пустого места (рис. 6.43).

Горизонтальную ось отключаем:

Primary Horizontal

На таком графике можно видеть развитие событий во времени.


Рис. 6.43. Оформление графика


Задание. Постройте диаграмму динамики.


Мы рассмотрели процедуру анализа для одной пары бумаг.

Теперь нужно проделать описанные шаги для остальных возможных сочетаний. Для начала попробуйте определить, сколько вариантов нам предстоит рассмотреть. СОЧЕТАНИЕ  это понятие из области комбинаторики.

Задание. Прочитайте в Википедии статью «Сочетание» и определите количество сочетаний из пяти бумаг по две акции.


В специализированных пакетах программ есть возможность проводить анализ взаимосвязи сразу по списку из нескольких переменных. Результаты такого анализа  «матрица» из нескольких графиков  гистограмм и диаграмм разброса.

КОНЕЦ ОЗНАКОМИТЕЛЬНОГО ОТРЫВКА

В специализированных пакетах программ есть возможность проводить анализ взаимосвязи сразу по списку из нескольких переменных. Результаты такого анализа  «матрица» из нескольких графиков  гистограмм и диаграмм разброса.

Задание. Найдите в Картинках Яндекса изображения на тему correlation matrix plot.


Конечно, мы не будем исследовать все возможные комбинации. Хотя, конечно, было бы интересно. Мы ограничимся тремя дополнительными заданиями.

Задание. Проведите анализ взаимосвязи для трёх сочетаний (по две акции).


Мы прошлись по основным этапам загрузки и обработки данных. Мы прошли по кругу и вернулись к началу.

Функции ETL настраивают в виде сценариев или процедур так, чтобы затем многократно их использовать. Когда в источнике данных происходят изменения, эти новые данные загружаются в систему бизнес-аналитики автоматически. Или по требованию пользователя:

Refresh.

Соответственно, должна обновиться наша объединённая таблица, а вслед за ней  все результаты анализа, таблицы и графики.

Задание. Скачайте данные для выбранных для исследования акций за последние пять лет и поместите файлы в каталог для загрузки. Вызовите обновление запроса на загрузку. Убедитесь в изменении объединённой таблицы и результатов анализа.

Заключение

В этой работе мы познакомились с процедурой извлечения, преобразования и загрузки данных. Английское название: ETL. Это подготовка данных для анализа в системах бизнес-аналитики.

Мы убедились в том, что это долгая и кропотливая работа. Она подходит не всем. Работа с данными, с числами требует терпения, усидчивости и внимательности. А ещё требуется некоторый кругозор. Все источники данных разные. Да ещё в них будут самые разные ошибки и нестыковочки.

Это подготовка данных для анализа. И нужна эта подготовка в конечном счёте для того, чтобы потом руководитель смог посмотреть на экран и за пару секунд понять, как идут дела в его компании или подразделении.

Попутно мы немного расширили свой кругозор и эрудицию. Немного приблизились к общему пониманию. Ещё это называется цельная или целостная картина мира. Зачем же это нужно? Есть такое любопытное высказывание: знание общих закономерностей может скомпенсировать незнание какого-то отдельного факта.

Задание. Найдите в интернете последнюю фразу и выясните, кто автор этого высказывания.

Литература

1. Паклин Н. Б., Орешков В. И. Бизнес-аналитика  от данных к знаниям: учебное пособие.  СПб.: ПИТЕР, 2013.  702 с.


2. Винстон У. Л. Бизнес-моделирование и анализ данных. Решение актуальных задач с помощью Microsoft Excel.  СПб.: Питер, 2018.  864 с.


3. Александер М. Excel 2019. Библия пользователя. Исчерпывающее руководство.  СПб.: Диалектика, 2019.  1136 с.


4. Джелен Б., Александер М. Сводные таблицы в Microsoft Excel 2013.  М.: Вильямс, 2017.  448 с.

Ваша оценка очень важна

0
Шрифт
Фон

Помогите Вашим друзьям узнать о библиотеке

Скачать книгу

Если нет возможности читать онлайн, скачайте книгу файлом для электронной книжки и читайте офлайн.

fb2.zip txt txt.zip rtf.zip a4.pdf a6.pdf mobi.prc epub ios.epub fb3