Валентин Юльевич Арьков - Бизнес-аналитика. Извлечение, преобразование и загрузка данных стр 4.

Шрифт
Фон

Сравним с оригиналом  числа стали гораздо больше. Программа просто проигнорировала запятые. Это искажает данные. Откатим изменения.


Рис. 3.12. Результаты преобразования второго столбца


Задание. Задайте целый тип данных для второго столбца и обратите внимание на изменения.


Попробуем заменить запятые на точки.

Находим инструмент поиска и замены в меню (рис. 3.13):

Home  Transform  Replace Values


Рис. 3.13. Функция замены значений


Задание. Прочитайте всплывающую подсказку для кнопки Замена значений.


Нажимаем кнопку Замена значений:

Replace Values.

Заменим запятые на точки (рис. 3.14).


Рис. 3.14. Поиск и замена


Задание. Замените запятые на точки.


Рассмотрим результаты поиска и замены (рис. 3.15).

Действительно, теперь у нас во втором столбце точки вместо запятых.

При этом тип данных по-прежнему текстовый.


Рис. 3.15. Результаты поиска и замены


Задание. Замените запятые на точки во втором столбце.


Изменим тип данных во втором столбце с текстового на числовой:

Decimal Number.

Обращаем внимание на изменение форматирования и сообщение о типе в заголовке столбца.

В одной ячейке за 1998 год был прочерк. Возможно, это означает, что дивиденды не выплачивались. То есть равны нулю.

Теперь в этой ячейке выводится сообщение об ошибке (рис. 3.16).


Рис. 3.16. Преобразование типа второго столбца


Задание. Измените тип данных на числовой и обратите внимание на сообщение об ошибке.


Отменяем последний шаг преобразований.

Заменяем прочерк, то есть символ тире, на ноль.

Щёлкаем по ячейке с неправильным содержимым и копируем её в буфер обмена. Затем вызываем функцию поиска и замены. В строке поиска будет загадочное тире. В строке замены  ничего.

Снова изменяем тип данных на числовой.

Теперь всё прошло успешно (рис. 3.17).

В ячейке за 1998 год стоит ноль.

Ошибок нет.

Все выполненные шаги по преобразованию данных выводятся в списке

APPLIED STEPS


Рис. 3.17. Второй столбец преобразован


Задание. Завершите преобразование второго столбца и убедитесь в отсутствии ошибок.


Здесь мы столкнулись с длинным тире. Это не просто чёрточка. Неплохо было бы с этими чёрточками познакомиться. А ещё есть символ минуса. Это тоже какая-то чёрточка. Или это одно и то же?

КОНЕЦ ОЗНАКОМИТЕЛЬНОГО ОТРЫВКА

Задание. Прочитайте в Википедии статьи «Тире», «Дефис» и «Минус». Выясните английские названия этих символов, какие символы для каких целей используют, а также как вводить разные виды тире в текстовом редакторе Microsoft Word.


Преобразование данных в третьем столбце потребует нескольких действий:

 удалить пробелы, которые мешают преобразованию в число;

 возможно, удалить запятую и два нуля в конце строк;

 преобразовать тип данных в числовой и настроить формат вывода на экран.

Мало того, в данных за 2015 год отсутствует один пробел.

Выделяем третий столбец и начинаем проводить перечисленные преобразования.

Замена пробела на «ничто» не удалась.

Попробуем выяснить причину.

Возвращаемся в браузер и вызываем просмотр исходного текста страницы сайта (рис. 3.18). Нажимаем правую кнопку мыши и в контекстном меню выбираем

View Page Source.

Мы работаем в браузере Firefox. В других браузерах функция просмотра исходного текста может скрываться в другом месте.


Рис. 3.18. Переход к исходному тексту страницы


Задание. Откройте исходный текст страницы.


Рассматриваем полученный текст (рис. 3.19).

Между тройками цифр стоит загадочная комбинацию букв.

А в неудачной строке за 2015 год есть и пробел, и эти загадочные буквы. В конце числа пробел действительно отсутствует.


Рис. 3.19. Фрагмент исходного текста


Задание. Ознакомьтесь с представлением данных за 2015 и 2016 годы в исходном тексте.


Поищем в интернете ответ на вопрос:

что такое  

Выясняется, что это так называемый НЕРАЗРЫВНЫЙ ПРОБЕЛ (рис. 3.20).

Английское название: non-breaking space.

Сокращённое обозначение: NBSP  Non-Breaking Space.


Рис. 3.20. Описание неразрывного пробела


Задание. Прочитайте в Википедии статью «Неразрывный пробел» и выясните, в каких случаях его рекомендуют применять, а также как его вставлять в редакторе Microsoft Word.


Мы разобрались, что это было. Оно только выглядит как пробел. На самом деле, это другой символ. Поэтому поиск обычного пробела ничего не дал.

Снова вызываем функцию поиска и замены:

Replace Values.

На этот раз сделаем всё правильно (рис. 3.30).

Раскрываем дополнительные возможности

Advanced Options.

Ставим отметку для выбора специальных символов:

Replace using special characters.

Неразрывный пробел относится как раз к специальным символам.

Щёлкаем по строке поиска:

Value To Find.

Раскрываем выпадающий список:

Insert special character.

Выбираем в этом списке тот самый неразрывный пробел:

Non-breaking Space.

А вот в строке замены не пишем ничего.

Значит пробел заменят на ничто. То есть мы все эти символы удаляем.

Нажимаем ОК.


Рис. 3.30. Удаление неразрывного пробела


Задание. Удалите неразрывные пробелы в третьем столбце.


Рассмотрим полученные результаты (рис. 3.31).

Числа стали похожи на числа.

Но в данных за 2015 год остался один пробел.

Изучаем исходный текст и обнаруживаем один настоящий пробел. Похоже при составлении данной страницы каждый год в таблицу дивидендов добавляли новую строчку. И данные за 2015 год ввели по-другому. Может быть, использовали другой редактор HTML. А, может, просто была плохая погода. Или, наоборот, хорошая. Нас интересует получить числа. А по пути приходится выяснять причины ошибок и справляться с ними.

Ваша оценка очень важна

0
Шрифт
Фон

Помогите Вашим друзьям узнать о библиотеке

Скачать книгу

Если нет возможности читать онлайн, скачайте книгу файлом для электронной книжки и читайте офлайн.

fb2.zip txt txt.zip rtf.zip a4.pdf a6.pdf mobi.prc epub ios.epub fb3