Закон средних чисел простым языком. Средние величины. Понятия закона больших чисел и его трактовка

Закон больших чисел

Зако́н больши́х чи́сел в теории вероятностей утверждает, что эмпирическое среднее (среднее арифметическое) достаточно большой конечной выборки из фиксированного распределения близко к теоретическому среднему (математическому ожиданию) этого распределения. В зависимости от вида сходимости различают слабый закон больших чисел, когда имеет место сходимость по вероятности , и усиленный закон больших чисел, когда имеет место сходимость почти всюду .

Всегда найдётся такое количество испытаний, при котором с любой заданной наперёд вероятностью относительная частота появления некоторого события будет сколь угодно мало отличаться от его вероятности.

Общий смысл закона больших чисел - совместное действие большого числа случайных факторов приводит к результату, почти не зависящему от случая.

На этом свойстве основаны методы оценки вероятности на основе анализа конечной выборки. Наглядным примером является прогноз результатов выборов на основе опроса выборки избирателей.

Слабый закон больших чисел

Пусть есть бесконечная последовательность (последовательное перечисление) одинаково распределённых и некоррелированных случайных величин , определённых на одном вероятностном пространстве . То есть их ковариация . Пусть . Обозначим выборочное среднее первых членов:

Усиленный закон больших чисел

Пусть есть бесконечная последовательность независимых одинаково распределённых случайных величин , определённых на одном вероятностном пространстве . Пусть . Обозначим выборочное среднее первых членов:

.

Тогда почти наверное.

См. также

Литература

  • Ширяев А. Н. Вероятность, - М .: Наука. 1989.
  • Чистяков В. П. Курс теории вероятностей, - М ., 1982.

Wikimedia Foundation . 2010 .

  • Кинематограф России
  • Громека, Михаил Степанович

Смотреть что такое "Закон больших чисел" в других словарях:

    ЗАКОН БОЛЬШИХ ЧИСЕЛ - (law of large numbers) В том случае, когда поведение отдельных представителей населения отличается большим своеобразием, поведение группы в среднем более предсказуемо, чем поведение любого ее члена. Тенденция, в соответствии с которой группы… … Экономический словарь

    ЗАКОН БОЛЬШИХ ЧИСЕЛ - см. БОЛЬШИХ ЧИСЕЛ ЗАКОН. Antinazi. Энциклопедия социологии, 2009 … Энциклопедия социологии

    Закон Больших Чисел - принцип, согласно которому количественные закономерности, присущие массовым общественным явлениям, наиболее явным образом проявляются при достаточно большом числе наблюдений. Единичные явления в большей степени подвержены воздействию случайных и… … Словарь бизнес-терминов

    ЗАКОН БОЛЬШИХ ЧИСЕЛ - утверждает, что с вероятностью, близкой к единице, среднее арифметическое большого числа случайных величин примерно одного порядка будет мало отличаться от константы, равной среднему арифметическому из математических ожиданий этих величин. Разл.… … Геологическая энциклопедия

    закон больших чисел - — [Я.Н.Лугинский, М.С.Фези Жилинская, Ю.С.Кабиров. Англо русский словарь по электротехнике и электроэнергетике, Москва, 1999 г.] Тематики электротехника, основные понятия EN law of averageslaw of large numbers … Справочник технического переводчика

    закон больших чисел - didžiųjų skaičių dėsnis statusas T sritis fizika atitikmenys: angl. law of large numbers vok. Gesetz der großen Zahlen, n rus. закон больших чисел, m pranc. loi des grands nombres, f … Fizikos terminų žodynas

    ЗАКОН БОЛЬШИХ ЧИСЕЛ - общий принцип, в силу к рого совместное действие случайных факторов приводит при нек рых весьма общих условиях к рез ту, почти не зависящему от случая. Сближение частоты наступления случайного события с его вероятностью при возрастании числа… … Российская социологическая энциклопедия

    Закон больших чисел - закон, гласящий, что совокупное действие большого числа случайных факторов приводит, при некоторых весьма общих условиях, к результату, почти не зависящему от случая … Социология: словарь

    ЗАКОН БОЛЬШИХ ЧИСЕЛ - статистический закон, выражающий связь статистических показателей (параметров) выборочной и генеральной совокупности. Фактические значения статистических показателей, полученные по некоторой выборке, всегда отличаются от т.н. теоретических… … Социология: Энциклопедия

    ЗАКОН БОЛЬШИХ ЧИСЕЛ - принцип, по которому частота финансовых потерь определенного вида может быть предсказана с высокой точностью тогда, когда есть большое количество потерь аналогичных видов … Энциклопедический словарь экономики и права

Книги

  • Комплект таблиц. Математика. Теория вероятностей и математическая статистика. 6 таблиц + методика , . Таблицы отпечатаны на плотном полиграфическом картоне размером 680 х 980 мм. В комплект входит брошюра с методическими рекомендациями для учителя. Учебный альбом из 6 листов. Случайные…

Не потеряйте. Подпишитесь и получите ссылку на статью себе на почту.

Взаимодействуя ежедневно в работе или учебе с цифрами и числами, многие из нас даже не подозревают о том, что существует очень интересный закон больших чисел, применяемый, например, в статистике, экономике и даже психолого-педагогических исследованиях. Он относится к теории вероятностей и говорит о том, что среднее арифметическое какой-либо большой выборки из фиксированного распределения близко к математическому ожиданию этого распределения.

Вы, наверное, заметили, что понять сущность этого закона непросто, особенно тем, кто не особо дружит с математикой. Исходя из этого, мы бы хотели рассказать о нем простым языком (насколько это возможно, конечно), чтобы каждый мог хотя бы примерно уяснить для себя, что это такое. Эти знания помогут вам лучше разобраться в некоторых математических закономерностях, стать более эрудированным и положительным образом повлиять на .

Понятия закона больших чисел и его трактовка

Помимо рассмотренного нами выше определения закона больших чисел в теории вероятностей, можно привести и его экономическое толкование. В этом случае он представляет собой принцип, согласно которому частоту финансовых потерь конкретного вида можно предсказать с высокой степенью достоверности тогда, когда наблюдается высокий уровень потерь подобных видов вообще.

Помимо этого, в зависимости от уровня сходимости признаков можно выделить слабый и усиленный законы больших чисел. О слабом речь идет, когда сходимость существует по вероятности, а об усиленном – когда сходимость существует практически во всем.

Если интерпретировать несколько иначе, то следует сказать так: всегда можно найти такое конечное число испытаний, где с любой запрограммированной наперед вероятностью меньше единицы относительная частота появления какого-то события будет крайне мало отличаться от его вероятности.

Таким образом, общую суть закона больших чисел можно выразить так: результатом комплексного действия большого количества одинаковых и независимых случайных факторов будет такой результат, который не зависит от случая. А если говорить еще более простым языком, то в законе больших чисел количественные закономерности массовых явлений будут явно проявляться только при большом их числе (поэтому и называется закон законом больших чисел).

Отсюда можно сделать вывод, что сущность закона состоит в том, что в числах, которые получаются при массовом наблюдении, имеются некоторые правильности, обнаружить которые в небольшом количестве фактов невозможно.

Сущность закона больших чисел и его примеры

Закон больших чисел выражает наиболее общие закономерности случайного и необходимого. Когда случайные отклонения «гасят» друг друга, средние показатели, определенные для одной и той же структуры, приобретают форму типичных. Они отражают действия существенных и постоянных фактов в конкретных условиях времени и места.

Определенные посредством закона больших чисел закономерности сильны только тогда, когда представляют массовые тенденции, и они не могут быть законами для отдельных случаев. Так, вступает в силу принцип математической статистики, говорящий, что комплексное действие ряда случайных факторов способно стать причиной неслучайного результата. И наиболее яркий пример действия данного принципа – это сближение частоты наступления случайного события и его вероятности, когда возрастает количество испытаний.

Давайте вспомним обычное бросание монетки. Теоретически орел и решка могут выпасть с одной и той же вероятностью. Это означает, что если, к примеру, бросить монетку 10 раз, 5 из них должна выпасть решка и 5 – орел. Но каждый знает, что так не происходит практически никогда, ведь соотношение частоты выпадения орла и решки может быть и 4 к 6, и 9 к 1, и 2 к 8 и т.д. Однако с увеличением количества подбрасываний монетки, например, до 100, вероятность того, что выпадет орел или решка, достигает 50%. Если же теоретически проводить бесконечное количество подобных опытов, вероятность выпадения монетки обеими сторонами всегда будет стремиться к 50%.

На то, как именно упадет монетка, влияет огромное число случайных факторов. Это и положение монетки на ладони, и сила, с которой совершается бросок, и высота падения, и его скорость и т.д. Но если опытов много, вне зависимости от того, как воздействуют факторы, всегда можно утверждать, что практическая вероятность близка к вероятности теоретической.

А вот еще один пример, который поможет понять сущность закона больших чисел: предположим, что нам нужно оценить уровень заработка людей в каком-то регионе. Если мы будем рассматривать 10 наблюдений, где 9 человек получают 20 тыс. рублей, а 1 человек – 500 тыс. рублей, среднее арифметическое составит 68 тыс. рублей, что, естественно, маловероятно. Но если мы возьмем в расчет 100 наблюдений, где 99 человек получают 20 тыс. рублей, а 1 человек – 500 тыс. рублей, то при расчете среднего арифметического получим 24,8 тыс. рублей, что уже ближе к реальному положению дел. Увеличивая число наблюдений, мы будем заставлять среднее значение стремиться к истинному показателю.

Именно по этой причине для применения закона больших чисел в первую очередь необходимо набрать статистический материал, чтобы получать правдивые результаты, изучая большое число наблюдений. Потому-то и удобно использовать этот закон, опять же, в статистике или социальной экономике.

Подведем итоги

Значение того, что закон больших чисел работает, сложно переоценить для любой области научного знания, и особенно для научных разработок в области теории статистики и методов статистического познания. Действие закона также обладает большим значением и для самих изучаемых объектов с их массовыми закономерностями. На законе больших чисел и принципе математической статистике основываются практически все методы статистического наблюдения.

Но, даже не беря во внимание науку и статистику как таковые, можно смело сделать вывод, что закон больших чисел – это не просто явление из области теории вероятностей, но феномен, с которым мы сталкиваемся практически каждый день в своей жизни.

Надеемся, теперь сущность закона больших чисел стала вам более понятна, и вы сможете легко и просто объяснить его кому-то другому. А если тема математики и теории вероятностей вам интересна в принципе, то рекомендуем почитать о и . Также познакомьтесь с и . И, конечно же, обратите внимание на наш , ведь, пройдя его, вы не только овладеете новыми техниками мышления, но и улучшите свои когнитивные способности в целом, в том числе и математические.

Слова о больших числах относятся к числу испытаний – рассматривается большое число значений случайной величины или совокупное действие большого числа случайных величин. Суть этого закона состоит в следующем: хотя невозможно предсказать, какое значение в единичном эксперименте примет отдельная случайная величина, однако, суммарный результат действия большого числа независимых случайных величин утрачивает случайный характер и может быть предсказан практически достоверно (т.е. с большой вероятностью). Например, невозможно предсказать, какой стороной упадет одна монета. Однако если подбросить 2 тонны монет, то с большой уверенностью можно утверждать, что вес монет, упавших гербом вверх, равен 1 тонне.

К закону больших чисел прежде всего относится так называемое неравенство Чебышева, которое оценивает в отдельном испытании вероятность принятия случайной величиной значения, уклоняющееся от среднего значения не более, чем на заданное значение.

Неравенство Чебышева . Пусть Х – произвольная случайная величина, а=М(Х ) , а D (X ) – ее дисперсия. Тогда

Пример . Номинальное (т.е. требуемое) значение диаметра вытачиваемой на станке втулки равно 5мм , а дисперсия не более 0.01 (таков допуск точности станка). Оценить вероятность того, что при изготовлении одной втулки отклонение ее диаметра от номинального окажется менее 0.5мм .

Решение. Пусть с.в. Х – диаметр изготовленной втулки. По условию ее математическое ожидание равно номинальному диаметру (если нет систематического сбоя в настройке станка) : а=М(Х )=5 , а дисперсия D (Х)≤0.01 . Применяя неравенство Чебышева при ε = 0.5 , получим:

Таким образом, вероятность такого отклонения достаточно велика, а потому можно сделать вывод о том, что при единичном изготовлении детали практически наверняка отклонение диаметра от номинального не превзойдет 0.5мм .

По своему смыслу среднее квадратическое отклонение σ характеризует среднее отклонение случайной величины от своего центра (т.е. от своего математического ожидания). Поскольку это среднее отклонение, то при испытании возможны и большие (ударение на о) отклонения. Насколько же большие отклонения практически возможны? При изучении нормально распределенных случайных величин мы вывели правило «трех сигм»: нормально распределенная случайная величина Х при единичном испытании практически не отклоняется от своего среднего далее, чем на , где σ= σ(Х) – среднее квадратическое отклонение с.в. Х . Такое правило мы вывели из того, что получили неравенство

.

Оценим теперь вероятность для произвольной случайной величины Х принять значение, отличающееся от среднего не более чем на утроенное среднее квадратическое отклонение. Применяя неравенство Чебышева при ε = и учитывая, что D (Х)= σ 2 , получаем:

.

Таким образом, в общем случае вероятность отклонения случайной величины от своего среднего не более чем на три средних квадратичных отклонения мы можем оценить числом 0.89 , в то время как для именно нормального распределения можно гарантировать это с вероятностью 0.997 .

Неравенство Чебышева может быть обобщено на систему независимых одинаково распределенных случайных величин.

Обобщенное неравенство Чебышева . Если независимые случайные величины Х 1 , Х 2 , … , Х n M (X i )= a и дисперсиями D (X i )= D , то

При n =1 это неравенство переходит в неравенство Чебышева, сформулированное выше.

Неравенство Чебышева, имея самостоятельное значение для решения соответствующих задач, применяется для доказательства так называемой теоремы Чебышева. Мы с начала расскажем о сути этой теоремы, а затем дадим ее формальную формулировку.

Пусть Х 1 , Х 2 , … , Х n – большое число независимых случайных величин с математическими ожиданиями М(Х 1 )=а 1 , … , М(Х n )=а n . Хотя каждая из них в результате эксперимента может принять значение, далекое от своего среднего (т.е. математического ожидания), однако, случайная величина
, равная их среднему арифметическому, с большой вероятностью примет значение, близкое к фиксированному числу
(это среднее всех математических ожиданий). Это означает следующее. Пусть в результате испытания независимые случайные величиныХ 1 , Х 2 , … , Х n (их много!) приняли значения соответственно х 1 , х 2 , … , х n соответственно. Тогда если сами эти значения могут оказаться далекими от средних значений соответствующих случайных величин, их среднее значение
с большой вероятностью окажется близким к числу
. Таким образом, среднее арифметическое большого числа случайных величин уже теряет случайный характер и может быть предсказано с большой точностью. Это можно объяснить тем, что случайные отклонения значенийХ i от a i могут быть разных знаков, а потому в в сумме эти отклонения с большой вероятностью компенсируются.

Терема Чебышева (закон больших чисел в форме Чебышева). Пусть Х 1 , Х 2 , … , Х n – последовательность попарно независимых случайных величин, дисперсии которых ограничены одним и тем же числом. Тогда, какое бы малое число ε мы ни взяли, вероятность неравенства

будет как угодно близка к единице, если число n случайных величин взять достаточно большим. Формально это означает, что в условиях теоремы

Такой вид сходимости называется сходимостью по вероятности и обозначается:

Таким образом, теорема Чебышева говорит о том, что если есть достаточно большое число независимых случайных величин, то их среднее арифметическое при единичным испытании практически достоверно примет значение, близкое к среднему их математических ожиданий.

Чаще всего теорема Чебышева применяется в ситуации, когда случайные величины Х 1 , Х 2 , … , Х n имеют одинаковое распределение (т.е. один и тот же закон распределения или одну и ту же плотность вероятности). Фактически это просто большое число экземпляров одной и той же случайной величины.

Следствие (обобщенного неравенства Чебышева). Если независимые случайные величины Х 1 , Х 2 , … , Х n имеют одинаковое распределение с математическими ожиданиями M (X i )= a и дисперсиями D (X i )= D , то

, т.е.
.

Доказательство следует из обобщенного неравенства Чебышева переходом к пределу при n →∞ .

Отметим еще раз, что выписанные выше равенства не гарантируют, что значение величины
стремится ка при n →∞. Эта величина по-прежнему остается случайной величиной, а ее отдельные значения могут быть достаточно далекими от а . Но вероятность таких (далеких от а ) значений с ростом n стремится к 0.

Замечание . Заключение следствия, очевидно, справедливо и в более общем случае, когда независимые случайные величины Х 1 , Х 2 , … , Х n имеют различное распределение, но одинаковые математические ожидания (равные а ) и ограниченные в совокупности дисперсии. Это позволяет предсказывать точность измерения некоторой величины, даже если эти измерения выполнены разными приборами.

Рассмотрим подробнее применение этого следствия при измерении величин. Проведем некоторым прибором n измерений одной и той же величины, истинное значение которой равно а и нам неизвестно. Результаты таких измерений х 1 , х 2 , … , х n могут значительно отличаться друг от друга (и от истинного значения а ) в силу различных случайных факторов (перепады давления, температуры, случайная вибрация и т.д.). Рассмотрим с.в. Х – показание прибора при единичном измерении величины, а также набор с.в. Х 1 , Х 2 , … , Х n – показание прибора при первом, втором, …, последнем измерении. Таким образом, каждая из величин Х 1 , Х 2 , … , Х n есть просто один из экземпляров с.в. Х , а потому все они имеют то же самое распределение, что и с.в. Х . Поскольку результаты измерений не зависят друг от друга, то с.в. Х 1 , Х 2 , … , Х n можно считать независимыми. Если прибор не дает систематической ошибки (например, не «сбит» ноль на шкале, не растянута пружина и т.п.), то можно считать, что математическое ожидание М(Х) = а , а потому и М(Х 1 ) = ... = М(Х n ) = а . Таким образом, выполняются условия приведенного выше следствия, а потому в качестве приближенного значения величины а можно взять «реализацию» случайной величины
в нашем эксперименте (заключающемся в проведении серии изn измерений), т.е.

.

При большом числе измерений практически достоверна хорошая точность вычисления по этой формуле. Это является обоснованием того практического принципа, что при большом числе измерений их среднее арифметическое практически почти не отличается от истинного значения измеряемой величины.

На законе больших чисел основан широко применяемый в математической статистике «выборочный» метод, который позволяет по сравнительно небольшой выборке значений случайной величины получать ее объективные характеристики с приемлемой точностью. Но об этом будет рассказано в следующем разделе.

Пример . На измерительном приборе, не делающем систематических искажений, измерена некоторая величина а один раз (получено значение х 1 ), а потом еще 99 раз (получены значения х 2 , … , х 100 ). За истинное значение измерения а сначала взят результат первого измерения
, а затем среднее арифметическое всех измерений
. Точность измерения прибора такова, что среднее квадратическое отклонение измерения σ не более 1 (потому дисперсияD 2 тоже не превосходит 1). Для каждого из способов измерения оценить вероятность, что ошибка измерения не превзойдет 2.

Решение. Пусть с.в. Х – показание прибора при единичном измерении. Тогда по условию М(Х)=а . Для ответа на поставленные вопросы применим обобщенное неравенство Чебышева

при ε=2 сначала для n =1 , а затем для n =100 . В первом случае получим
, а во втором. Таким образом, второй случай практически гарантирует задаваемую точность измерения, тогда как первый оставляет в этом смысле большие сомнения.

Применим приведенные выше утверждения к случайным величинам, возникающим в схеме Бернулли. Напомним суть этой схемы. Пусть производится n независимых испытаний, в каждом из которых некоторое событие А может появиться с одной и той же вероятностью р , а q =1–р (по смыслу это вероятность противоположного события – не появления события А ) . Проведем некоторое число n таких испытаний. Рассмотрим случайные величины: Х 1 – число появлений события А в 1 -ом испытании, …, Х n – число появлений события А в n -ом испытании. Все введенные с.в. могут принимать значения 0 или 1 (событие А в испытании может появиться или нет), причем значение 1 по условию принимается в каждом испытании с вероятностью p (вероятность появления события А в каждом испытании), а значение 0 с вероятностью q = 1 p . Поэтому эти величины имеют одинаковые законы распределения:

Х 1

Х n

Поэтому средние значения этих величин и их дисперсии тоже одинаковы: М(Х 1 )=0 q +1 р= р, …, М(Х n )= р ; D (X 1 )=(0 2 q +1 2 p )− p 2 = p ∙(1− p )= p q, … , D (X n )= p q . Подставляя эти значения в обобщенное неравенство Чебышева, получим

.

Ясно, что с.в. Х =Х 1 +…+Х n – это число появлений события А во всех n испытаниях (как говорят – «число успехов» в n испытаниях). Пусть в проведенных n испытаниях событие А появилось в k из них. Тогда предыдущее неравенство может быть записано в виде

.

Но величина
, равная отношению числа появлений событияА в n независимых испытаниях, к общему числу испытаний, ранее была названа относительной частотой события А в n испытаниях. Поэтому имеет место неравенство

.

Переходя теперь к пределу при n →∞, получим
, т.е.
(по вероятности). Это составляет содержание закона больших чисел в форме Бернулли. Из него следует, что при достаточно большом числе испытанийn сколь угодно малые отклонения относительной частоты
события от его вероятностир − почти достоверные события, а большие отклонения − почти невозможные. Полученный вывод о такой устойчивости относительных частот (о которой мы ранее говорили как об экспериментальном факте) оправдывает введенное ранее статистическое определение вероятности события как числа, около которого колеблется относительная частота события.

Учитывая, что выражение p q = p ∙(1− p )= p p 2 не превосходит на интервале изменения
(в этом легко убедиться, найдя минимум этой функции на этом отрезке), из приведенного выше неравенства
легко получить, что

,

которое применяется при решении соответствующих задач (одна из них будет приведена ниже).

Пример . Монету подбросили 1000 раз. Оценить вероятность того, что отклонение относительной частоты появления герба от его вероятности будет меньше 0.1.

Решение. Применяя неравенство
приp = q =1/2 , n =1000 , ε=0.1 , получим .

Пример . Оценить вероятность того, что в условиях предыдущего примера число k выпавших гербов окажется в пределах от 400 до 600 .

Решение. Условие 400< k <600 означает, что 400/1000< k / n <600/1000 , т.е. 0.4< W n (A )<0.6 или
. Как мы только что убедились из предыдущего примера, вероятность такого события не менее0.975 .

Пример . Для вычисления вероятности некоторого события А проведено 1000 экспериментов, в которых событие А появилось 300 раз. Оценить вероятность того, что относительная частота (равная 300/1000=0.3) отстоит от истиной вероятности р не далее, чем на 0.1 .

Решение. Применяя выписанное выше неравенство
дляn=1000, ε=0.1 , получим .

Средняя величина является самым обобщающим показателем в статистике. Это связано с тем, что с ее помощью можно охарактеризовать совокупность по количественно варьирующему признаку. Например, для сравнения заработной платы рабочих двух предприятий не может быть взята заработная плата двух конкретных рабочих, поскольку она выступает варьирующим показателем. Также не может быть взята общая сумма заработной платы, выплаченной на предприятиях, так как она зависит от количества работающих. Если же мы разделим общую сумму заработной платы каждого предприятия на численность работающих, то сможем их сравнить и определить, на каком предприятии средняя заработная плата выше.

Иными словами заработная плата изучаемой совокупности рабочих получает обобщенную характеристику в средней величине. В ней выражается то общее и типичное, что характерно для совокупности рабочих в отношении изучаемого признака. Она в этой величине показывает общую меру этого признака, имеющего различное значение у единиц совокупности.

Определение средней величины. Средней величиной в статистике называется обобщенная характеристика совокупности однотипных явлений по какому-либо количественно варьирующему признаку. Средняя величина показывает уровень этого признака, отнесенный к единице совокупности. С помощью средней величины можно сравнивать между собой различные совокупности по варьирующим признакам (доходы на душу населения, урожайность сельскохозяйственных культур, себестоимость производства продукции на различных предприятиях).

Средняя величина всегда обобщает количественную вариацию признака, которым мы характеризуем изучаемую совокупность, и который в равной степени присущ всем единицам совокупности. Значит, за всякой средней величиной всегда скрывается ряд распределения единиц совокупности по какому - то варьирующему признаку, т.е. вариационный ряд. В этом отношении средняя величина принципиально отличается от относительных величин и, в частности от показателей интенсивности. Показатель интенсивности – отношение объемов двух разных совокупностей (например, производство ВВП на душу населения), в то время как средняя – обобщает характеристику элементов совокупности по одному из признаков(например, средняя заработная плата рабочего).

Средняя величина и закон больших чисел. В изменении средних показателей проявляется общая тенденция, под влиянием которой складывается процесс развития явлений в целом, в отдельных же индивидуальных случаях эта тенденция может и не обнаружиться явно. Важно, чтобы средние величины были основаны на массовом обобщении фактов. Только при этом условии они выявят общую тенденцию, лежащую в основе процесса целом.


Во все более полном погашении отклонений, порождаемых случайными причинами, по мере увеличения числа наблюдений проявляется сущность закона больших чисел и его значение для средних величин. То есть закон больших чисел создает условия, чтобы в средней величине проявился типичный уровень варьирующего признака в конкретных условиях места и времени. Величина этого уровня определяется сущностью этого явления.

Виды средних величин. Средние величины, применяемые в статистике, относятся к классу степенных средних, общая формула которых имеет следующий вид:

Где х – степенная средняя;

Х – меняющиеся величины признака(варианты)

– число вариант

Показатель степени средней;

Знак суммирования.

При различных значениях показателя степени средней получаются различные виды средней величины:

Средняя арифметическая;

Средняя квадратическая;

Средняя кубическая;

Средняя гармоническая;

Средняя геометрическая.

Различные виды средней величины имеют разные значения при использовании одних и тех же исходных статистических материалов. При этом, чем больше показатель степени средней, тем выше ее величина.

В статистике правильную характеристику совокупности в каждом отдельном случае дает только вполне определенный вид средних величин. Для определения этого вида средней величины используется критерий, определяющий свойства средней: средняя величина только тогда будет верной обобщающей характеристикой совокупности по варьирующему признаку, когда при замене всех вариант средней величиной общий объем варьирующего признака остается неизменным. То есть правильный вид средней определяется тем, как образуется общий объем варьирующего признака. Так, средняя арифметическая применяется тогда, когда объем варьирующего признака образуется как сумма отдельных вариант, средняя квадратическая – когда объем варьирующего признака образуется как сумма квадратов, средняя гармоническая – как сумма обратных значений отдельных вариант, средняя геометрическая – как произведение отдельных вариант. Кроме средних величин в статистике

Применяют описательные характеристики распределения варьирующего признака (структурные средние), моду (наиболее часто встречающаяся варианта) и медиану (серединная варианта).

Лекция 8. Раздел 1. Теория вероятностей

Рассматриваемые вопросы

1) Закон больших чисел.

2) Центральная предельная теорема.

Закон больших чисел.

Под законом больших чисел в широком смысле понимается общий принцип, согласно которому при большом числе случайных величин их средний результат перестает быть случайным и может быть предсказан с большой степенью определенности.

Под законом больших чисел в узком смысле понимается ряд математических теорем, в каждой из которых при тех или иных условиях устанавливается возможность приближения средних характеристик большого числа испытаний

к некоторым определенным постоянным. При доказательстве теорем такого рода используются неравенства Маркова и Чебышева, представляющие также самостоятельный интерес.

Теорема 1(неравенство Маркова) . Если случайная величина принимает неотрицательные значения и имеет математическое ожидание, то для любого положительного числа справедливо неравенство

Доказательство проведем для дискретной случайной величины. Будем считать, что она принимает значений из которых первые меньше или равны а все остальные- больше Тогда

откуда

Пример 1. Среднее количество вызовов, поступающих на коммутатор завода в течение часа, равно 300. Оценить вероятность того, что в течении следующего часа число вызовов на коммутатор:

1) превысит 400;

2) будет не более 500.

Решение. 1) Пусть случайная величина есть число звонков, поступающих на коммутатор в течение часа. Среднее значение-это . Значит Нам надо оценить . Согласно неравенству Маркова

2) Таким образом, вероятность того, что число вызовов будет не более 500, не менее 0,4.

Пример 2. Сумма всех вкладов в отделение банка составляет 2 млн. рублей, а вероятность того, что случайно взятый вклад не превышает 10 тыс. рублей, равна 0,6. Что можно сказать о числе вкладчиков?

Решение. Пусть случайно взятая величина есть размер случайно взятого вклада, а число всех вкладов. Тогда (тыс.). Согласно неравенству Маркова откуда

Пример 3. Пусть -время опоздания студента на лекцию, причем известно, что в среднем он опаздывает на 1 минуту. Оцените вероятность того, что студент опоздает не менее чем на 5 минут.

Решение. По условию Применяя неравенство Маркова, получаем, что

Таким образом, из каждых 5 студентов опоздает по крайней мере на 5 минут не более, чем 1 студент.

Теорема 2 (Неравенство Чебышева). .

Доказательство. Пусть случайная величина Х задается рядом распределения

Согласно определению дисперсии Исключим из этой суммы те слагаемые, для которых . При этом, т.к. все слагаемые, неотрицательны, сумма может только уменьшится. Для определенности будем считать, что отброшены первые k слагаемых. Тогда

Следовательно, .

Неравенство Чебышева позволяет оценивать сверху вероятность отклонения случайной величины от ее математического ожидания на основе информации лишь о ее дисперсии. Оно широко используется, например, в теории оценивания.

Пример 4. Монета подбрасывается 10 000 раз. Оценить вероятность того, что частота выпадения герба отличается от на 0,01 или более.

Решение. Введем независимые случайные величины , где – случайная величина с рядом распределения

Тогда так как распределена по биномиальному закону с Частота появления герба есть случайная величина где . Поэтому дисперсия частоты появления герба есть Согласно неравенству Чебышева, .

Таким образом, в среднем не более чем в четверти случаев при 10 000 подбрасываниях монеты частота выпадения герба будет отличаться от на одну сотую или больше.

Теорема 3 (Чебышева). Если – независимые случайные величины, дисперсии которых равномерно ограничены (), то

Доказательство. Так как

то применяя неравенство Чебышева, получаем

Поскольку вероятность события не может быть больше 1, получаем требуемое.

Следствие 1. Если – независимые случайные величины с равномерно ограниченными дисперсиями и одним и тем же математическим ожиданием, равным а , то

Равенство (1) говорит о том, что случайные отклонения отдельных независимых случайных величин от их общего среднего значения при большом в своей массе взаимно погашаются. Поэтому, хотя сами величины случайны, их среднее при большом практически уже не случайно и близко к . Это означает, что если заранее неизвестно, то его можно вычислить с помощью среднего арифметического . Это свойство последовательностей независимых случайных величин называется законом статистической устойчивости. Закон статистической устойчивости обосновывает возможность применения анализа статистик при принятии конкретных управленческих решений.

Теорема 4 (Бернулли). Если в каждом из п независимых опытов вероятность р появления события А постоянна, то

,

где – число появлений события А при этих п испытаниях.

Доказательство. Введем независимые случайные величины , где Х i – случайная величина с рядом распределения

Тогда М(Х i )=р, D(Х i )=рq. Так как , то D(Х i ) ограничены в совокупности. Из теоремы Чебышева следует, что

.

Но Х 1 +Х 2 +…+Х п есть число появлений события А в серии из п испытаний.

Смысл теоремы Бернулли заключается в том, что при неограниченном увеличении числа одинаковых независимых опытов с практической достоверностью можно утверждать, что частота появления события будет сколь угодно мало отличаться от вероятности его появления в отдельном опыте (статистическая устойчивость вероятности события). Поэтому теорема Бернулли служит переходным мостиком от теории приложений к ее применениям.