Excel надстройка
Запускаем табличный редактор Excel.
Делаем заголовок это наши «иксы».
Вызываем надстройку: Данные Анализ данных. В диалоговом окне выбираем генератор случайных чисел.
Рис. Общий план демонстрации
Задаём число переменных. Имеется ввиду число столбцов. В электронных таблицах каждая переменная это, прежде всего, столбец. Это же касается и баз данных там тоже есть таблицы, и данные в таблицах тоже расположены по столбцам. Нас интересует одна колонка случайных чисел. Пускай у нас будет 10 тысяч значений.
В разделе «Распределение» выбираем Uniform / Равномерное.
Диапазон значений от 0 до 1.
Параметр Random seed в русском переводе звучит как «Случайное рассеивание». На самом деле, это НАЧАЛЬНОЕ СОСТОЯНИЕ ГЕНЕРАТОРА. Этот параметр задаётся целым числом. Мы в качестве примера напишем 1234.
Диапазон для вывода результатов Output range. Мы говорим, что надо выводить случайные числа, начиная с указанной ячейки.
Машина немного подумает и сгенерирует нам заданное количество случайных чисел.
После этого мы их округлим и посчитаем вероятность нашего события.
Событие А заключается в том, что у нас выпала единичка. Мы пишем ROUND, даём ссылку на соседнюю ячейку и говорим: ноль знаков после запятой.
Рис. Моделирование нулей и единиц
Конечно, есть некоторые сомнения по поводу округления числа, равного точно 0,5. Проделаем опыт: напишем 0,5 и округлим.
Сделаем откат и возвращаемся к исходным данным.
Теперь нам предстоит заполнить второй столбец. Берём правый нижний уголок ячейки это маркер автозаполнения. Дважды щёлкаем по нему и вся колонка заполняется нулями и единицами. Чтобы это проверить, нажимаем [Ctrl+Down]. Перемещаемся самый низ нашего столбца в последнюю заполненную ячейку. Мы видим 10001 строку. Это последняя строка. Возвращаемся в начало: [Ctrl+Home].
Теперь подсчитаем вероятность. Я напомню, что это только оценка вероятности. Поскольку наши данные это нули и единицы, оценка вероятности это среднее значение по столбцу А. Среднее значение в английском варианте Excel называется AVERAGE, в русском варианте СРЗНАЧ. Указываем диапазон ячеек: щёлкаем первую ячейку, затем нажимаем комбинацию клавиш [Ctrl+Shift+Down]. Мы отметили все ячейки. Нажимаем клавишу [Enter] или [Ввод].
Вот наш результат мы получили число, которое очень близко к 0,5. Но это не ровно 0,5. Просто достаточно близко к теоретическому значению.
В чём особенность этого метода? Мы генерируем числа с помощью надстройки. Если мы хотим сгенерировать новый набор данных, нам нужно будет снова вызвать «Анализ данных». Мы вызываем генератор, задаём новое состояние генератора, нажимаем [OK]. Нас предупреждают, что ячейки вообще-то заняты предыдущими числами. Машин подумает и заполнит наши 10 тысяч ячеек. Обратим внимание на новую оценку вероятности.
Такой эксперимент вам предстоит проделать несколько раз в рамках знакомства с данным материалом.
Подведём итоги. Мы вызвали генератор случайных чисел с помощью надстройки, установили равномерное распределение, округлили и нашли оценку вероятности как среднее из нулей и единиц. Что это значит применительно к нашей формуле? В числителе находится количество единиц это число событий, которые нас интересуют. В данном случае сумма единиц это количество событий, когда выпал орёл. В знаменателе общее количество событий. В нашем примере это 10000. Так что если у нас нули и единицы и мы считаем среднее из этого количества данных, мы автоматом получаем оценку нашей вероятности. Она называется ЧАСТОТА.
Если оценка вероятности получена по реальным данным, её называют частотой. Конечно, это просто количество в отличие от физики. В физике частота это число событий в единицу времени или число оборотов в единицу времени. В физике частоту измеряют в Герцах, а в статистике в «единицах», в «штуках», в количестве объектов или событий. Так что это частота в разном понимании.
Excel функция
Есть и другой способ генерирования случайных чисел. Это готовая функция RAND / СЛЧИС. Мы его тоже можем разобрать. Внешне всё будет выглядеть точно так же, как в предыдущем примере: столбец «иксов» и столбец нулей и единиц, затем оценка частоты, то есть вероятность, см. рис.