Простой случайный выбор
Материал из MachineLearning.
Содержание |
Введение
- Рассмотрим случайный эксперимент , связанный с одномерной случайной величиной . Осуществив n' независимых повторений эксперимента , мы получим последовательность n наблюдений значений величины , которые обозначим .
- Такая последовательность, представляющая собой результат n независимых повторений некоторого случайного эксперимента, является представителем простого, но чрезвычайно важного класса статистических данных.
- Рассмотрим случайный эксперимент такого типа: задано некоторое множество, содержащее конечное число элементов; наш эксперимент заключается в том, что мы выбираем наугад какой-нибудь элемент этого множества, регистрируем значение некоторой определённой характеристики этого элемента и затем возвращаем элемент во множество. Предполагается при этом, что эксперимент организован так, что вероятность быть выбранным одинакова для всех элементов. Будем называть заданное множество генеральной совокупностью, а элементы этого множества - его членами или индивидуумами. Группа индивидуумов, наблюденных при n повторениях эксперимента , будет называеться случайной выборкой из генеральной совокупности, а описанный процесс выбора - простым случайным выбором.
Пример реализации простого случайного выбора
- Часто мы интересуемся не индивидуумами как таковыми, а только значениями характеристической величины и их распределением среди членов совокупности. В таких случаях удобно рассматривать генеральную совокупность, как состоящую не из индивидуумов, а из значений величины . Последовательность n наблюденных значений будет рассматриваться как случайная выборка из этой совокупности значений . С этой точки зрения мы можем заменить генеральную совокупность урной, содержащей билеты, по одному на каждый член совокупности, с написанными на них соответствующими значениями величины . Эксперимент будет тогда заключаться в том, что мы наугад выбираем билет, отмечаем написанное на нем значение и возвращаем билет обратно в урну.
- Так как в урне содержится лишь конечное число объектов, случайная величина будет иметь конечное число возможных значений, так что её распределение будет дискретного типа. Однако, полагая число N билетов очень большим, можно сколь угодно точно приблизить это распределение к любому наперед заданному распределению, и если N стремится к бесконечности, то ошибку такого приближения можно заставить стремиться к нулю. Таким образом, мы можем интерпретировать любой случайный эксперимент как случайный выбор индивидуума из бесконечной генеральной совокупности. При этом мы представляем себе урну, содержащую бесконечное количество билетов, на каждом из которых написано некоторое число, причем распределение этих чисел совпадает с распределением случайной величины , связанной с экспериментом . Каждое осуществление эксперимента интерпретируется как случайная выборка из бесконечной совокупности чисел, написанных на билетах. Значения соотвественно будут называться выборочными значениями.
Замечание
- Необходимо особо подчеркнуть, что распространение идеи выбора на случай бесконечной генеральной совокупности следует рассматривать как простую иллюстрацию случайного эксперимента; мы прибегаем к ней лишь с целью введения удобной терминологии. Такие понятия, как случайный выбор индивидуумов из бесконечной совокупности, ни в коей мере не следует частью теории.
- Имея в виду эту оговорку, часто пользуются терминологией выбора в указанном выше расширенном смысле. Множество наблюденных значений случайной величины с некоторой функцией распределения , таким образом, часто рассматривается как случайная выборка из совокупности, имеющей функцию распределения или, как еще иногда говорится, случайная выборка из распределения, соответствующего .
Случай многомерной случайной величины
- Все вышесказанное можно непосредственно распространить на случайные величины любого числа измерений. Тогда каждый индивидуум в нашей воображаемой бесконечной совокупности будет характеризоваться k числами, где k — размерность соответствующей случайной величины, а каждая последовательность наблюденных значений k-мерной случайной величины может интерпретироваться как случайная выборка из k-мерной бесконечной совокупности.
Ссылки
- Статистический анализ данных (курс лекций, К.В.Воронцов)/2009
- Понятие выборки. Основные характеристики выборки. Типы выборки.
- Выборка в аудите
Список литературы
- Гаральд Крамер Математические методы статистики. (пер. с английского) Под редакцией А.Н. Колмогорова. - Изд-во. "Мир", Москва, 1975.
— Валентин Голодов 18:38, 29 декабря 2009 (MSK)