Статистические методы оценки малой выборки пример расчета. Бутстреп, малые выборки, применение в анализе данных. Метод малых выборок

Метод малых выборок имеет ряд преимуществ перед методом больших выборок. Основными преимуществами его являются, во-первых, уменьшение объема вычислительных работ, во-вторых, возможность следить за динамикой изменения точности процесса во времени, чего нельзя сделать с помощью метода больших выборок. Метод больших выборок может дать представление лишь о точности и устойчивости процесса в период взятия выборки, которые могут сохраниться и в дальнейшем, если после взятия выборки условия протекания процесса не изменяются. В действительности такой неизменности производственных условий заранее предвидеть нельзя. Например, при работе на прутковом автомате в течение смены производится несколько раз замена материала (смена прутка), смена инструмента в связи с износом, поднастройка станка и т.д., которые могут вносить значительные коррективы в полученные ранее параметры распределения. Метод малых выборок, если последние берут в течение всей смены регулярно через определенные промежутки времени, позволяет получить полную картину состояния процесса в течение исследуемого периода, выяснить степень его устойчивости, а также выявить причины недостаточной устойчивости процесса во времени, если она есть.

Статистический анализ малыми выборками производится следующим образом. Выборки объемом n = 5-10 шт. берутся через определенные фиксированные промежутки времени (например, через 15-30 мин). Период времени для отбора проб устанавливается опытным путем и зависит от производительности станка, объема выборки и степени устойчивости технологического процесса. Для каждой выборки нужно вычислить и S . Далее необходимо для каждых двух смежных выборок проверить гипотезу однородности дисперсий выборок при помощи F - критерия Фишера.

Если гипотеза подтверждается, то это свидетельствует о стабильности рассеивания или о том, что сравниваемые выборки взяты из одной и той же генеральной совокупности. При подтверждении гипотезы однородности дисперсий двух выборок следует проверить гипотезу однородности двух выборочных средних по t -критерию Стьюдента.

Подтверждение гипотезы равенства двух смежных выборочных средних означает, что центр настройки оборудования не изменится в момент взятия данной выборки и остался таким, каким был при взятии предыдущей выборки, т.е. процесс находится в стабильном состоянии. Когда гипотеза равенства двух средних выборок не подтверждается, это свидетельствует о смещении центра настройки станка во время взятия данной выборки. Так как выборки берутся через определенные промежутки времени, то при обнаружении смещения центра настройки или изменения зоны рассеивания можно определить период времени, через который наступило нарушение стабильности процесса.

Обнаружив факт нарушения стабильности процесса, можно установить и область, в которой следует искать причину этого явления. Неоднородность выборочных дисперсий, свидетельствующая о нестабильности рассеивания, указывает на то, что причину этого следует искать в станке или в механических свойствах обрабатываемого материала. Неоднородность выборочных средних говорит о смещении центра настройки (причину искать в инструменте).

Таким образом, беря в течение смены через определенные интервалы времени малые выборки из текущей продукции станка, вычислены средние и дисперсии выборок путем сравнения и оценки их расхождения при помощи F и t- критериев, можно установить моменты разладок процесса и даже источники этих разладок.

На практике довольно часто приходится иметь дело с выборками весьма малого объема, численности которых значительно меньше двадцати - тридцати. Такие выборки в статистике получили название малых выборок. Необходимость специального рассмотрения малых выборок вызвана тем, что разобранные выше методы точечной и интервальной оценки выборочных характеристик предполагают достаточно большую численность выборок.

Понятие о малых выборках. Распределение Стьюдента

Выборочная средняя и, соответственно, ее ошибка распределены нормально, а поправка на величину смещения выборочной дисперсии очень близка к единице и не имеет практического значения. Ошибка выборки в этих условиях очень редко превышает величину. Иное дело при небольшом объеме выборки. При малых выборках выборочная дисперсия оказывается значительно смещенной. Поэтому применять функцию нормального распределения для вероятностных выводов о возможной величине ошибки было бы неправомерно. При малом объеме выборки всегда нужно пользоваться несмещенной оценкой дисперсии:

Следовательно, для получения несмещенной оценки дисперсии по данным малой выборки сумму квадратов отклонений нужно делить на величину. Эта величина называется числом степеней свободы вариации. В дальнейшем для краткости число степеней свободы вариации будет обозначаться греческой буквой (ню).

Проблема оценки выборочных характеристик на основе малых выборок впервые была исследована английским математиком статистиком В. Госсетом, публиковавшим свои работы под псевдонимов Стьюдент (1908 г.).

Исходя из предложения о нормальности распределения признака в генеральной совокупности и рассматривая вместо абсолютных отклонений их отношения к независимому стандарту, Стьюдент нашел распределение, которое зависит только от численности выборки. Позже (1925 г.) Р. Фишер дал более строгое доказательство этого распределения, которое получило название распределение Стьюдента.

Величина Стьюдента выражается как следующее отношение:

В числителе выражения фигурирует переменная величина, которая отражает возможные значения отклонений выборочных средних от генеральной средней. Величина распределена нормально с центром, равным нулю, и дисперсией, равной.

Следует особо подчеркнуть, что знаменатель выражения нельзя рассматривать как среднюю ошибку переменной. Величина рассматривается здесь как независимо распределенная от числителя переменная. означает среднее квадратическое (стандартное) отклонение данной выборки и не является оценкой генеральной совокупности, так как распределение Стьюдента не зависит ни от одного параметра генеральной совокупности. определяется по данным выборки как

Распределения независимы друг от друга. Только при этом условии и для выборок из нормальных совокупностей имеет место распределение Стьюдента.

Основное преимущество распределения Стьюдента состоит в том, что оно не зависит от параметров генеральной совокупности и имеет дело только с величинами, полученными непосредственно из выборки.

Дифференциальный закон распределение Стьюдента (плотность вероятности) имеет вид:

где объем выборки;

величина соответствующая максимальной ординате кривой распределения при t = 0.

Соответственно функция распределения Стьюдента выражается:

Иначе говоря,

где t ф стандартизированная (нормированная) разность, вычисляемая по результатам малой выборки.

Величины Г() и Г() являются гамма- функциями. Для некоторого числа гамма - функция выражается несобственным интегралом:

В малых выборках всегда целое положительное число (объем выборки).

В этом случае гамма - функция всегда имеет конечную величину и выражается через факториалы:

следовательно:

При вычислении гамма - функции полезно знать следующие свойства:

1) При есть;

  • 3) Например,

Используя это свойство, легко можно вычислить значения Г() и Г() в выражении плотности распределения;

4) Функция достигает минимума при дробном значении

Рис 3.1

Общий вид гамма - функции показан на рис. 3.1.

Из свойств распределения Стьюдента, рассматриваемых обычно в курсе теории вероятностей, обращается внимание на следующее:

1) Распределение Стьюдента замечательно тем, что зависит только от одного параметра - объема выборки и не зависит от средней и дисперсии генеральной совокупности (в отличие от нормального распределения, зависящего о этих двух параметров).

  • 2) Распределение Стьюдента точно для любого объема выборки следовательно, и для малых выборок, что позволяет делать вероятностные выводы по малому числу наблюдений.
  • 3) При увеличении объема выборки величина приближается к значению, а распределение Стьюдента приближается к нормальному. При распределение Стьюдента становится нормальным. Практически для нормального приближения считается достаточным.

Рис 3.2

На рис. 3.2 показаны соотношения между распределением Стьюдента и нормальным распределением.

Как видно из рис. 3.2, под концами кривой распределения Стьюдента, например или, расположена значительно большая часть площади, чем под кривой нормального распределения при тех же значениях. Это значит, что при малом объеме выборок вероятность допущения больших ошибок заметно увеличивается. Из рисунка видно, что при значениях нормированного отклонения, превышающих по абсолютному значению, площадь под кривой распределения Стьюдента гораздо больше, чем под кривой нормального распределения.

О величине расхождений между значениями функции распределения Стьюдента в зависимости от объема выборки и значениями нормальной функции распределения можно судить по данным табл. 3.2, где приведены значения площадей под кривой распределения от при разной численности выборки при.

Таблица 3.1

Значение нормальной функции распределения

Таблица 3.2

Значения вероятностей при разном объеме выборки

Нормированное отклонение

Значение при малых выборках с численностями

Значение при больших выборках

Из таблицы 3.2. видно, что с увеличением объема выборки малая выборка быстро приближается к нормальной. В то же время при очень маленькой численности выборки расхождения между значениями при данном значении весьма значительны.

Исследованиями было установлено, что распределение Стьюдента практически применимо не только в случае нормального распределения признака в генеральной совокупности. Оказалось, что оно происходит к практически приемлемым выводам и тогда, когда распределения признака в генеральной совокупности не является нормальным, а лишь симметрично и даже несколько асимметрично, но объем выборки не слишком мал.

Значения функции распределения Стьюдента затабулированы при различных значениях Поэтому при оценке выборочных характеристик пользуются готовыми таблицами:

Таблица 3.3

Таблица значений функции

Значения функции распределения Стьюдента могут быть использованы различными способами в зависимости от характера решаемых задач при определении вероятности отклонения выборочной от генеральной. Наиболее часто используются:

1) Определение вероятности того, что разность между выборочной средней и генеральной средней окажется меньше на некоторую заданную величину. В нормированных отклонениях задача сводится к определению вероятности того, что окажется меньше значения, задаваемого условиями задачи, т.е. к нахождению значения

Рис 3.3

Это есть вероятность больших отрицательных отклонений, которая на рис. 3.3 соответствует заштрихованной площади.

2) Определение вероятности того, что разность между выборочной средней и средней генеральной окажется не менее некоторой заданной величины, иначе говоря, следует найти

Рис 3.4

Это есть вероятность больших положительных отклонений, которая показана в виде заштрихованной площади на рис. 3.4. эту вероятность легко найти, используя таблицы.

3) Определение вероятности того, что нормированное отклонение по абсолютной величине окажется менее, выражается

Это есть вероятность меньших по абсолютной величине отклонений. Эта вероятность может быть определена с использованием таблиц. Поскольку на практике чаще всего приходится определять эту вероятность, составленной специальной таблицы значения (табл. 3.3).

Графическая иллюстрация вероятности меньших по абсолютной величине отклонений дана на рис. 3.5

Рис 3.5

4) Определение вероятности того, что ошибка выборки по абсолютной величине окажется не менее некоторой заданной величины. В нормированных единицах вероятность того, что по абсолютной величине окажется не менее, выразится

Это есть вероятность больших по абсолютной величине отклонений. Графически она иллюстрируется на рис. 3.6.

Рис 3.6

Для нахождения вероятности больших по абсолютной величине отклонений имеются специальные таблицы (приложение 3). Эту вероятность легко можно вычислить, также используя таблицы.

При изучении изменчивости выделяют признаки количественные и качественные, изучением которых занимается вариационная статистика в основе которой лежит теория вероятности. Вероятность указывает возможную частоту встречи особи с тем или иным признаком. P=m/n, где m-число особей с данной величиной признака; n-число всех особей в группе. Вероятность колеблется от 0 до 1 (например вероятность равна 0,02- появление двойни в стаде, т.е. значит на 100 отёлов появится две двойни). Таким образом объектом изучения биометрии является варьирующий признак, изучение которого осуществляется на определённой группе объектов т.е. совокупности. Различают генеральную и выборочную совокупность. Генеральная совокупность это многочисленная группа особей, которая нас интересует по изучаемому признаку. В генеральную совокупность может входить вид животных, породы одного и того же вида. В генеральную совокупность (породу) входит несколько миллионов животных. В тоже время порода расходится на много совокупностей т.е. стада отдельных хозяйств. Так как генеральная совокупность состоит из большого числа особей, то изучить её технически сложно. Поэтому изучают не всю генеральную совокупность, а только её часть, которая называется выборной или выборочной совокупностью .

По выборочной совокупности делают суждение о всей генеральной совокупности в целом. Выборка должна осуществляться по всем правилам, куда должны входить особи со всеми значениями варьирующего признака. Отбор особей из генеральной совокупности осуществляется по принципу случайности или методом жеребьёвки. В биометрии выделяют два типа случайной выборки: большая и малая. Большой выборкой называют такую, куда входит больше 30 особей или наблюдений, а малой выборкой меньше 30 особей. Для большой и малой выборочной совокупности существуют различные методы обработки данных. Источником статистической информации могут служить данные зоотехнического и ветеринарного учёта, где даётся информация о каждом животном от рождения до его выбытия. Другим источником информации могут служить данные научно-производственных опытов, проводимые на ограниченном числе животных. После того как получена выборочная совокупность приступают к её обработке. Это позволяет получить в виде математических величин ряд статистических величин или коэффициентов, которые характеризуют признаки интересующих групп животных.

Биометрическим методом получают следующие статистические параметры или показатели:

1. Средние величины варьирующего признака (средняя арифметическая величина, мода, медиана, средняя геометрическая величина).

2. Коэффициенты, измеряющие величину варьирования т.е. (изменчивости) изучаемого признака (среднее квадратическое отклонение, коэффициент вариации).

3. Коэффициенты, измеряющие величину связи между признаками (коэффициент корреляции, регрессии и корреляционное отношение).

4. Статистические ошибки и достоверность получаемых статистических данных.

5. Долю варьирования возникающая под действием различных факторов и другие показатели, которые связаны с изучением генетических и селекционных проблем.

При статистической обработке выборки члены совокупности организуются в виде вариационного ряда. Вариационным рядом называется группировка особей на классы в зависимости от величины изучаемого признака. Вариационный ряд состоит из двух элементов: из классов и ряда частот. Вариационный ряд может быть прерывистым и непрерывным. Признаки, которые могут принимать только целое число называют прерывистым числом голов, число яиц, число поросят и другие. Признаки, которые могут выражаться дробными числами называются непрерывистыми (рост см, удой кг, % жира, живая масса и другие).

При построении вариационного ряда придерживаются следующих принципов или правил:

1. Определяют или подсчитывают количество особей для которых будет построен вариационный ряд (n).

2. Находят мах и min величину изучаемого признака.

3. Определяют классный промежуток К=мах - min/ к-во классов, количество классов берётся произвольно.

4. Строят классы и определяют границу каждого класса, min+К.

5. Делают разноску членов совокупности по классам.

После построения классов и распределения особей по классам вычисляют основные показатели вариационного ряда (Х, σ, Cv, Mх, Мσ, Мcv). Наибольшее значение при характеристике совокупности получила средняя величина признака. При решении всех зоотехнических, ветеринарных, медицинских, экономических и других задач всегда определяют среднюю величину признака (средний удой по стаду, % жира, плодовитость в свиноводстве, яйценоскость у кур и другие признаки). В число параметров, характеризующих среднее значение признака входят следующие:

1. Средняя арифметическая величина.

2. Средне взвешенная арифметическая.

3. Средняя геометрическая.

4. Мода (Мо).

5. Медиана (Ме) и другие параметры.

Средняя арифметическая величина показывает нам какую величину признаков имели особи данной группы, если он был одинаков для всех, и определяется по формуле Х=А+в× К

Основным свойством средней арифметической величины является то, что она как бы устраняет варьирование признака и делает его общим для всей совокупности. В тоже время необходимо отметить, что средняя арифметическая величина принимает абстрактное значение, т.е. при её вычислении получают дробные показатели, в действительности которых может и не быть. Например: выход телят на 100 коров-85,3 телёнка, плодовитость свиноматок 11,8 поросят, яйценоскость кур 252,4 яйца и другие показатели.

Значение средней арифметической величины очень велико в практике животноводства и характеристики популяции. В практике животноводства в частности скотоводства используют средне взвешенную арифметическую величину при определении среднего содержания жира в молоке за лактацию.

Средняя геометрическая величина вычисляется в том случае, если необходимо характеризовать темп роста, темп увеличения популяции, когда средняя арифметическая величина искажает данные.

Модой называют чаще всего встречающуюся величину варьирующего признака, как количественного, так и качественного. Модальным числом у коровы является число сосков-4. Хотя встречаются коровы с пятью, шестью сосками. В вариационном ряду модальным классом будет тот класс, где имеется наибольшее количество частот и мы его определяем как нулевой класс.

Медианой называется варианта, которая делит всех членов совокупности на две равные части. Половина членов совокупности будет иметь величину варьирующего признака меньше медианы, а другая больше медианы (например: стандарт породы). Медиана чаще всего используется для характеристики качественных признаков. Например: форма вымени чашеобразная, округлая, козье. При правильной выборке вариант все три показателя должны быть одинаковы (т.е. Х, Мо, Ме). Таким образом первой характеристикой совокупности служат средние величины, однако для суждения о совокупности их недостаточно.

Вторым важным показателем любой совокупности является изменчивость или вариабильность признака. Изменчивость признака обуславливается многими факторами внешней среды и внутренними факторами т.е. наследственными факторами.

Определение изменчивости признака имеет большое значение, как в биологии, так и в практике животноводства. Так с помощью статистических параметров измеряющих степень изменчивости признака можно установить породные различия в степени изменчивости различных хозяйственно-полезных признаков, прогнозировать уровень отбора в различных группах животных, а также его эффективность.

Современное состояние статистического анализа позволяет не только устанавливать степень проявления фенотипической изменчивости, но и разделить фенотипическую изменчивость на составляющие её типы, а именно на генотипическую и паратипическую изменчивость. Это разложение изменчивости делается с помощью дисперсионного анализа.

Основными показателями изменчивости служат следующие статистические величины:

1. Лимиты;

2. Среднее квадратическое отклонение (σ);

3. Коэффициент изменчивости или вариации (Сv).

Наиболее простой способ представить величину изменчивости признака помогают нам лимиты. Лимиты определяются следующим образом: разница между мах и min значением признака. Чем больше эта разница, тем больше изменчивость этого признака. Основным параметром измерения изменчивости признака служит среднее квадратическое отклонение или (σ) и определяется по формуле:

σ = ±К ∙ √∑Pa 2 - b 2

Основными свойствами среднего квадратического отклонения т.е. (σ) являются следующие:

1. Сигма всегда величина именованная и выражается (в кг, г, метрах, см, шт.).

2. Сигма всегда величина положительная.

3. Чем больше величина σ, тем больше изменчивость признака.

4. В вариационном ряду все частоты вкладываются в ±3σ.

С помощью среднего квадратического отклонения можно определить к какому вариационному ряду относится данная особь. Методы определения изменчивости признака с помощью лимитов и среднего квадратического отклонения имеют свои недостатки, так как сопоставить разноимённые признаки по величине изменчивости невозможно. Необходимо знать изменчивость разных признаков у одного и того же животного или одной и той же группы животных, например: изменчивость удоя, содержания жира в молоке, живой массы, количества молочного жира. Поэтому сопоставляя изменчивость разноимённых признаков и выявляя степень их изменчивости рассчитывают коэффициент изменчивости по следующей формуле:

Таким образом, основными методами оценки изменчивости признаков у членов совокупности являются: лимиты; среднее квадратическое отклонение (σ) и коэффициент вариации или изменчивости.

В практике животноводства и экспериментальных исследованиях очень часто приходится иметь дело с малыми выборками. Малой выборкой называют число особей или животных не превышающее 30 или меньше 30. Установленные закономерности с помощью малой выборки переносятся на всю генеральную совокупность. У малой выборки определяют те же самые статистические параметры, что и у большой выборочной совокупности (Х, σ, Cv, Mx). Однако формулы и расчёты их отличаются от большой выборки (т.е. от формул и расчётов вариационного ряда).

1. Средняя арифметическая величина Х = ∑V

V- абсолютное значение варианты или признака;

n- число вариант или число особей.

2. Среднее квадратическое отклонение σ = ± √∑α 2

α = х-¯х, это разность между значением варианты и средней арифметической величиной. Эту разность α возводят в квадрат и получают α 2 n-1 число степеней свободы, т.е. количество всех вариант или особей уменьшенное на единицу (1).

Контрольные вопросы :

1.Что такое биометрия?

2.Какие статистические параметры характеризуют совокупность?

3.Какие показатели характеризуют изменчивость?

4.Что такое малая выборка

5. Что такое мода и медиана?

Лекция № 12

Биотехнология и трансплантация эмбрионов

1. Понятие о биотехнологии.

2. Отбор коров- доноров и реципиентов, трансплантация эмбрионов.

3. Значение трансплантации в животноводстве.

При контроле качества товаров в экономических исследованиях эксперимент может проводиться на основе малой выборки.Под малой выборкой понимается несплошное статистическое обследование,при котором выборочная совокупность образуется из сравнительно небольшого числа единиц генеральной совокупности. Объем малой выборки обычно не превышает 30 единиц и может доходить до 4 - 5 единиц.Средняя ошибка малой выборки вычисляется по формуле:,где - дисперсия малой выборки.При определении дисперсии число степеней свободы равно n-1: . Предельная ошибка малой выборки определяется по формулеПри этом значение коэффициента доверия t зависит не только от заданной доверительной вероятности, но и от численности единиц выборки n. Для отдельных значений t и n доверительная вероятность малой выборки определяется по специальным таблицам Стьюдента (Табл. 9.1.), в которых даны распределения стандартизированных отклонений:.Поскольку при проведении малой выборки в качестве доверительной вероятности практически принимается значение 0,59 или 0,99, то для определения предельной ошибки малой выборки используются следующие показания распределения Стьюдента:

Способы распространения характеристик выборки на генеральную совокупность. Выборочный метод чаще всего применяется для получения характеристик генеральной совокупности по соответствующим показателям выборки. В зависимости от целей исследований это осуществляется или прямым пересчётом показателей выборки для генеральной совокупности, или посредством расчёта поправочных коэффициентов. Способ прямого пересчёта. Он состоит в том, что показатели выборочной доли или средней распространяется на генеральную совокупность с учётом ошибки выборки.Так, в торговле определяется количество поступивших в партии товара нестандартных изделий. Для этого (с учётом принятой степени вероятности) показатели доли нестандартных изделий в выборке умножаются на численность изделий во всей партии товара. Способ поправочных коэффициентов . Применяется в случаях, когда целью выборочного метода является уточнение результатов сплошного учета.В статистической практике этот способ используется при уточнении данных ежегодных переписей скота, находящегося у населения. Для этого послеобобщения данных сплошного учета практикуется 10%-ное выборочное обследованиес определением так называемого “процента недоучета”. Способы отбора единиц из генеральной совокупности. В статистике применяются различные способы формирования выборочных совокупностей, что обусловливается задачами исследования и зависит от специфики объекта изучения.Основным условием проведения выборочного обследования является предупреждение возникновения систематических ошибок, возникающих вследствие нарушения принципа равных возможностей попадания в выборку каждой единицы генеральной совокупности. Предупреждение систематических ошибок достигается в результате применения научно обоснованных способов формирования выборочной совокупности. Существуют следующие способы отбора единиц из генеральной совокупности:1) индивидуальный отбор - в выборку отбираются отдельные единицы;2) групповой отбор - в выборку попадают качественно однородные группы или серии изучаемых единиц;3) комбинированный отбор - это комбинация индивидуального и группового отбора. Способы отбора определяются правилами формирования выборочной совокупности.Выборка может быть:- собственно-случайная;- механическая;- типическая;- серийная;- комбинированная. Собственно-случайная выборка состоит в том, что выборочная совокупность образуется в результате случайного (непреднамеренного) отбора отдельных единиц из генеральной совокупности. При этом количество отобранных в выборочную совокупность единиц обычно определяется исходя из принятой доли выборки. Доля выборки есть отношение числа единиц выборочной совокупности n к численности единиц генеральной совокупности N, т.е..Так, при 5%-ной выборке из партии товара в 2 000 ед. численность выборки n составляет 100 ед. (5*2000:100), а при 20%-ной выборке она составит 400 ед. (20*2000:100) и т.д. Механическая выборка состоит в том, что отбор единиц в выборочную совокупность производится из генеральной совокупности, разбитой на равные интервалы (группы). При этом размер интервала в генеральной совокупности равен обратной величине доли выборки.Так, при 2%-ной выборке отбирается каждая 50-я единица (1:0,02), при 5%-ной выборке - каждая 20-я единица (1:0,05) и т.д.Таким образом, в соответствии с принятой долей отбора, генеральная совокупность как бы механически разбивается на равновеликие группы. Из каждой группы в выборку отбирается лишь одна единица.Важной особенностью механической выборки является то, что формирование выборочной совокупности можно осуществить, не прибегая к составлению списков. На практике часто используют тот порядок, в котором фактически размещаются единицы генеральной совокупности. Например, последовательность выхода готовых изделий с конвейера или поточной линии, порядок размещения единиц партии товара при хранении, транспортировке, реализации и т.д. Типическая выборка. При типической выборке генеральная совокупность вначале расчленяется на однородные типические группы. Затем из каждой типической группы собственно-случайной или механической выборкой производится индивидуальный отбор единиц в выборочную совокупность.Типическая выборка обычно применяется при изучении сложных статистических совокупностей. Например, при выборочном обследовании производительности труда работников торговли, состоящих из отдельных групп по квалификации.Важной особенностью типической выборки является то, что она дает более точные результаты по сравнению с другими способами отбора единиц в выборочную совокупность.Для определения средней ошибки типической выборки используются формулы: повторный отбор , бесповторный отбор , Дисперсия определяется по следующим формулам: , При одноступенчатой выборке каждая отобранная единица сразу же подвергается изучению по заданному признаку. Так обстоит дело при собственно-случайной и серийной выборке.При многоступенчатой выборке производят подбор из генеральной совокупности отдельных групп, а из групп выбираются отдельные единицы. Так производится типическая выборка с механическим способом отбора единиц в выборочную совокупность. Комбинированная выборка может быть двухступенчатой. При этом генеральная совокупность сначала разбивается на группы. Затем производят отбор групп, а внутри последних осуществляется отбор отдельных единиц.

Выборка – ограниченная по численности группа объектов (в психологии – испытуемых, респондентов) специально отбираемая из генеральной совокупности для изучения ее свойств .

Генеральная совокупность – это все множество объектов, в отношении которого формулируется исследовательская гипотеза .

Изучение на выборке свойств генеральной совокупности называется выборочным исследованием . Практически все психологические исследования являются выборочными, а их выводы распространяются на генеральные совокупности.

Основное требование к выборке испытуемых – ее репрезентативность – представительность, показательность, соответствие характеристик, полученных в результате частичного (выборочного) обследования какой-либо группы, характеристикам этой группы в целом. . Исследователь должен помнить о возможности распространения выводов конкретного обследования на всю популяцию, частью которой является обследуемая группа.

Необходимо очень внимательно подходить к составлению выборки в испытуемых в эмпирическом исследовании. Важно учитывать пол, возраст, социальное положение, уровень образования, состояние здоровья, индивидуально-психологические особенности испытуемых и другие параметры, которые могут оказать влияние на результаты.

Выделяют два основных типа выборки: вероятностную (построенную на математических и статистических расчетах) ицелевую (заданную целью исследования и определяемую доступностью, типичностью и равным представительством испытуемых).

В строгом понимании репрезентативной может быть только вероятностная выборка, т.к. она соответствует принципу рандомизации: одинаково равной вероятности попадания каждого члена генеральной совокупности в выборочную совокупность. Существуют следующие виды вероятностной выборки: простая, случайная, систематическая, стратифицированная, кластерная, многоступенчатая .

Чаще всего в психологических исследованиях применяют целевой отбор, используют целевую выборку. Критериями для построения целевой выборки являются: доступность, типичность, равное представительство. В связи с этим можно выделить следующие виды выборки по принципу целевого отбора: выборка на основании принципа доступных случаев; отбор критических, либо типичных случаев; выборка, построенная на основании метода «снежного кома»; квотная выборка.

Выборка на основании принципа доступных случаев – наиболее распространенный вариант выборки испытуемых. Применяется при изучении больших по численности групп испытуемых, не обладающих уникальными, специфическими параметрами.

Выборка по принципу отбора критических, либо типичных случаев , построенана основаниитеоретических представлений или предшествующего эмпирического опыта исследователя. Из всей обследуемой совокупности испытуемых отбираются те, которые обладают необходимыми специфическими характеристиками.

Пример: Выборку исследования составляют родители, которыми ситуация поступления их ребенка в школу оценивается как стрессовая.

Выборка, построенная по методу «снежного кома» или методу «редких» совокупностей . Первоначально опрашиваются один или несколько человек интересующей исследователя выборочной совокупности, которые в дальнейшем служат источниками информации о других членах данной совокупности. Выборка расширяется в геометрической прогрессии, подобно формирующемуся «снежному кому». Данный метод применяется тогда, когда испытуемые по различным причинам не афишируют свою принадлежность к той или иной группе людей.

Пример: Выборку составляют ученые, исследования которых касаются узкой научной проблемы.

Квотная выборка связана с разбиением изучаемой совокупности на подгруппы на основании социально-демографических или иных характеристик, которые являются важными для проведения исследования. Опираясь на известные пропорции определенных групп в генеральной совокупности, исследователь выделяет «квоту» для каждой обследуемой подгруппы. (Социально-демографические данные можно найти в статистических сборниках, выпускаемых ежегодно отделами статистики регионов).

Пример: Выборка исследования включает мужчин и женщин предпенсионного возраста – 50-60 лет. По статистике мужчины данного возраста составляют 46%, а женщины – 54 % генеральной совокупности. Следовательно, при общей численности выборки 100 человек должно быть обследовано не менее 46 мужчин и 54 женщин.

Одни из важных вопросов психологического исследования является вопрос объема выборки испытуемых , который должен обеспечивать доказательность выводов научного исследования. Исходя из методов математической обработки, к объему выборки предъявляются следующие требования:

    Наибольший объем выборки необходим при разработке диагностической методики – от 200 до 1000-2500 человек.

    При сравнении двух выборок, их общая численность должна быть не менее 50 человек. При этом численность сравниваемых выборок должна быть примерно одинаковой.

    При изучении взаимосвязи между свойствами, чертами и т.п. объем выборки должен быть не меньше 30-35 человек.

    Если для обработки данных применяется факторный анализ, важно помнить, что надежные факторные решения можно получить лишь в том случае, если количество испытуемых превышает число регистрируемых переменных в три и более раз.

    Чем больше изменчивость изучаемого свойства, тем больше объем выборки. Изменчивость можно уменьшить, увеличивая однородность выборки, например, по полу, возрасту и т.д. Но возможности распространения выводов исследования на генеральную совокупность уменьшатся.

    Целесообразно увеличение количества испытуемых на 5-10 % по сравнению с планируемым, так как часть полученных бланков будет отбракована в ходе исследования (не поняли инструкцию, не приняли задачу, дали отклоняющиеся результаты и т.п.) .

Зависимые и независимые выборки

Часто исследование строится таким образом, что свойство, интересующее исследователя, изучается на двух или более выборках с целью их дальнейшего сравнения. Эти выборки могут находиться в различных соотношениях – в зависимости от цели и задач исследования.

Независимые выборк и характеризуются тем, что вероятность отбора любого испытуемого из одной выборки не зависит от отбора любого испытуемого другой выборки.

Зависимые выборки характеризуются тем, что каждому испытуемому одной выборки поставлен в соответствие по определенному критерию испытуемый из другой выборки.

Пример 1: Зависимые выборки – два ряда значений, полученных при обследовании одной и той же группы испытуемых: измерено состояние какого-либо свойства «до» и «после» экспериментального воздействия.

В этом случае выборки (одна – «до», другая – «после» воздействия) зависимы в максимально возможной степени, так как они включают одних и тех же испытуемых.

Пример 2: Зависимые выборки: мужья – 1 выборка, жены – 2 выборка.

Пример 3: Зависимые выборки: дети 5-7 лет – 1 выборка, их братья и сестры – 2 выборка.

В примерах 2,3 представлены варианты менее зависимых выборок.

В общем случае зависимые выборки предполагают попарный подбор испытуемых в сравниваемые выборки, а независимые выборки – независимый отбор испытуемых .