Способы создания и оценки репрезентативности выборки. Репрезентативность - что это за процесс? Ошибка репрезентативности

Требования к выборке

К выборке применяется ряд обязательных требований, опре­деленных, прежде всего, целями и задачами исследования. Плани­рование эксперимента должно включать в себя учет, как объема выборки, так и ряда ее особенностей. Так, в психологических ис­следованиях важно требование однородности выборки. Оно озна­чает, что психолог, изучая, например, подростков, не может, включать в эту же выборку взрослых людей. Напротив, исследо­вание, выполненное методом возрастных срезов, принципиаль­но предполагает наличие разновозрастных испытуемых. Однако и в этом случае должна соблюдаться однородность выборки, но уже по другим критериям, в первую очередь таким, как возраст, пол. Основаниями для формирования однородной выборки могут служить разные характеристики, такие, как уровень интеллекта, национальность, отсутствие определенных заболеваний и т.д., в зависимости от целей исследования.

В общей статистике имеется понятие повторной и безповторной выборки, или, иначе говоря, выборки с возвратом и без возврата. В качестве примера приводится, как правило, выбор шара, доставаемого из какой-либо емкости. В случае выборки с возвратом каждый выбранный шар опять возвращается в емкость и, следовательно, может быть выбран снова. При бесповторном выборе однажды выбранный шар откладывается в сторону и больше не может участвовать в выборке. В психологических исследованиях можно найти аналоги подобного рода способам организации выборочного исследования, поскольку психологу нередко приходится несколько раз тестировать одних и тех же испытуемых при помощи одной и той же методики. Однако, строго говоря, повторной в этом случае является процедура тес­тирования. Выборка испытуемых при полной тождественности состава в случае повторных исследований всегда будет иметь не­которые отличия, обусловленные функциональной и возрастной изменчивостью, присущей всем людям. Подобная выборка по ха­рактеру проведения процедуры является повторной, хотя смысл термина здесь, очевидно, иной, чем в случае с шарами.

Важно подчеркнуть, что все требования, предъявляемые к любой выборке, сводятся к тому, что на ее основе психологом должна быть получена наиболее полная, неискаженная инфор­мация об особенностях генеральной совокупности, из которой взята эта выборка. Иными словами, выборка должна как можно более полно отражать характеристики изучаемой генеральной со­вокупности.

Состав экспериментальной выборки должен представлять (моделировать) генеральную совокупность, поскольку выводы, полученные в эксперименте, предполагается в дальнейшем пе­ренести на всю генеральную совокупность. Поэтому выборка должна обладать особым качеством - репрезентативностью, позволяющим распространить полученные на ней выводы на всю генеральную совокупность.


Репрезентативность выборки очень важна, тем не менее, по объективным причинам соблюдать её крайне сложно. Так, хоро­шо известен факт, что от 70% до 90% всех психологических ис­следований поведения человека проводились в США в 60-х годах XX века с испытуемыми-студентами колледжей, причем боль­шинство из них были студентами психологами. В лабораторных исследованиях, выполняемых на животных, наиболее распрост­раненным объектом изучения являются крысы. Поэтому неслу­чайно психологию называли раньше «наукой о студентах-второ­курсниках и белых крысах». Студенты психологических коллед­жей составляют всего 3% от общей численности населения США. Очевидно, что выборка студентов нерепрезентативна в качестве модели, претендующей на представительство всего населения страны.

Репрезентативная выборка, или, как еще говорят, предста­вительная выборка, - это такая выборка, в которой все основ­ные признаки генеральной совокупности представлены прибли­зительно в той же пропорции и с той же частотой, с которой данный признак выступает в данной генеральной совокупности. Иными словами, репрезентативная выборка представляет собой меньшую по размеру, но точную модель той генеральной сово­купности, которую она должна отражать. В той степени, в какой выборка является репрезентативной, выводы, основанные на изучении этой выборки, можно с большой долей уверенности считать применимыми ко всей генеральной совокупности. Это распространение результатов называется генерализуемостью.

В идеале репрезентативная выборка должна быть такой, чтобы каждая из основных изучаемых психологом характерис­тик, черт, особенностей личности и т.п. была бы представлена в ней пропорционально этим же особенностям в генеральной совокупности. Согласно этим требованиям процедура форми­рования выборки должна иметь внутреннюю логику, способ­ную убедить исследователя, что при сравнении с генеральной совокупностью она действительно окажется репрезентатив­ной, представительной.

В своей конкретной деятельности психолог действует следую­щим образом: устанавливает подгруппу (выборку) внутри гене­ральной совокупности, подробно изучает эту выборку (проводит с ней экспериментальную работу), а затем, если это позволяют результаты статистического анализа, распространяет полученные выводы на всю генеральную совокупность. Это и есть основные этапы работы психолога с выборкой.

Начинающий психолог должен иметь в виду часто повторяю­щуюся ошибку: каждый раз, когда он осуществляет сбор любых данных любым методом и из любого источника, у него всегда появляется соблазн распространить свои выводы на всю гене­ральную совокупность. Для того чтобы избежать подобной ошиб­ки, надо не просто обладать здравым смыслом, но, прежде все­го, хорошо владеть основными понятиями математической ста­тистики.

В формировании выборочной совокупности важную роль играет определение ее объема и обеспечение репрезентативности.

«Если тип выборки говорит о том, как попадают люди в выборочную совокупность, то объём выборки сообщает о том, какое их количество попало сюда». То есть объем выборки - это количество единиц попавших в выборочную совокупность. И очень важно, чтобы выборка была репрезентативной, то есть не искажала представлений о генеральной совокупности в целом. «Требования репрезентативности выборки означают, что по выделенным параметрам (критериям) состав обследуемых должен приближаться к соответствующим пропорциям в генеральной совокупности».

Одна из ключевых проблем, встающих, как правило, перед социологом, решающим: доверять полученным в ходе него данным или нет, это то, сколько же человек должно быть опрошено для того, чтобы получить действительно репрезентативную информацию. К сожалению, единой и четкой формулы, используя которую можно было бы рассчитать оптимальный объем выборочной совокупности, не существует в природе. И объясняется это весьма просто. Дело в том, что определение объема выборочной совокупности - это проблема не столько статистическая, сколько содержательная.

Иными словами, объем выборочной совокупности зависит от множества факторов, основные из них следующие:

  • 1. затраты на сбор информации, включая временные;
  • 2. стремление к определённой статистической достоверности результатов, которую надеется получить исследователь;
  • 3. ценность и новизна информации, получаемой в результате опроса.

Объем выборки обусловлен степенью однородности или неоднородности, генеральной совокупности, количеством характеризующих ее признаков. Однородной считается совокупность, в которой контролируемый признак, например уровень грамотности, распределён равномерно, то есть не образует пустот и сгущений, тогда опросив лишь несколько человек, можно сделать вывод о том, что большинство людей грамотны. Чем более однородна генеральная совокупность, тем меньше объем выборки. Например, «допустим, мы осуществляем отбор из генеральной совокупности в 2000 человек, контролируя состав выборочной совокупности по признаку «пол»»: 70% мужчин и 30% женщин. Согласно теории вероятности, можно предположить, что примерно среди каждых десяти отбираемых респондентов встретятся три женщины. Если мы хотим опросить по крайней мерее 90 женщин, то исходя из вышеупомянутого соотношения, нам необходимо отобрать не менее 300 человек. А теперь предположим, что в генеральной совокупности 90% мужчин и 10% женщин. В этом случае, чтобы в выборочную совокупность попало 90 женщин, необходимо отобрать уже не менее 900 человек». Из примера видно, что объем выборки зависит от разброса признака (дисперсии), и его нужно вычислять по признаку, дисперсия значений которого наибольшая.

«Степень однородности социального объекта зависит, в сущности, от того, насколько детально мы намерены его исследовать. Практически любой, самый «элементарный» объект оказывается чрезвычайно сложным. Лишь в анализе мы представляем его как относительно простой, выделяя те или иные его свойства. Чем более основательным и детальным будет анализ, чем больше свойств данного объекта мы намерены принять во внимание в их сочетании, а не изолированно, тем больше должен быть объем выборки».

В репрезентативной выборке все элементы генеральной совокупности представлены в той же пропорции. Но как бы тщательно не соблюдать этот принцип, случайные ошибки все же будут. Мы имеем возможность определять ошибку репрезентативности. Ошибкой репрезентативности, как правило, называют «расхождение между двумя совокупностями - генеральной, на которую направлен теоретический интерес социолога и представление о свойствах которой он хочет получить в конечном итоге, и выборочной, на которую направлен практический интерес социолога, которая выступает одновременно как объект обследования и средство получить информацию о генеральной совокупности». Важно учитывать, что при помощи выборочного метода никогда нельзя получить абсолютно точную оценку наблюдаемого признака, всегда существует вероятность ошибки, но, если вероятность ошибки мала, то она скорее всего не произойдет. В отечественной литературе наряду с термином «ошибка репрезентативности» встречается и другой - «ошибка выборки». Обычно они используются как синонимы, но понятие «ошибка выборки» количественно более точное, чем «ошибка репрезентативности». Ошибка выборки - это «отклонение средних характеристик выборочной совокупности от средних характеристик генеральной совокупности. На практике она определяется путём сравнения известных характеристик генеральной совокупности с выборочными средними».

Репрезентативность выборки определяется двумя компонентами: систематическими и случайными ошибками. Случайные ошибки связаны «со статистическими погрешностями (зависят от динамики исследуемых признаков) и непредвиденными нарушениями процедуры сбора информации (процедурные ошибки, допущенные при регистрации признаков)». Случайные ошибки уменьшаются с увеличением объема выборочной совокупности. Случайную ошибку можно измерить методами математической статистики, если при формировании выборочной совокупности соблюдался принцип случайности, обеспечивающийся строго определенными правилами, которые составляют метод формирования выборочной совокупности, и устранить.

На практике принцип случайности соблюсти очень сложно, а иногда просто невозможно, что приводит к появлению систематической ошибки, которые возникают «из-за неполной объективности выборки генеральной совокупности (недостаток информации о генеральной совокупности, отбор наиболее «удобных» для исследования элементов генеральной совокупности), а так же из-за несоответствия выборки целям и задачам исследования». Иногда такие ошибки называют ошибками смещения. Они возникают при различных телевизионных опросах, когда телеведущий предлагает телезрителям позвонить по определённым номерам телефонов, послать смс-сообщение и высказать своё мнение по какой-то проблеме. Естественно мы не можем утверждать что эти люди отражают мнение всего населения страны, и даже телеаудитории. Вероятнее всего в таких опросах участвуют более образованные и активные люди, чем вся генеральная совокупность, поэтому любой телевизионный опрос содержит в себе систематическое искажение и носит поверхностный характер.

Но систематические ошибки возникают и в ходе корректно организованного опроса. Например, на улице на вопросы интервьюера отвечают только те, кто никуда не спешит. Искажения можно избежать, если соблюдать принципы случайного отбора и опрашивать, к примеру, каждого десятого прохожего.

Причины возникновения систематических ошибок:

  • 1. «в ходе исследования была не правильно составлена основа выборки (использовались устаревшие, неполные данные либо отсутствовала статистика по некоторым важным для формирования выборки признакам),
  • 2. неудачно выбран способ отбора единиц наблюдения,
  • 3. часть респондентов по разным причинам «выпала» из опроса (отсутствовала, отказалась отвечать) и так далее».

При помощи математических средств такие ошибки устранить невозможно, поэтому необходимо осуществить логический анализ причин появления систематических ошибок и разработать меры, которые смогли бы их устранить. «Величину ошибок смещения определить при помощи математических формул практически не возможно, поэтому они автоматически переходят на результаты и выводы исследования. Ошибки смещения бывают обычно следствием:

  • - неверных исходных статистических данных о параметрах контрольных признаков генеральной совокупности;
  • - слишком малого (статистически не значимого) объёма выборочной совокупности;
  • - неверного применения способа отбора единиц анализа (например, отбор из неверно составленного списка, неудачный выбор места и времени проведения опроса)» .

Существуют определённые пределы ошибки выборки, которые зависят от цели исследования. В экономических и демографических прогнозах, например при переписи населения, требуется повышенная надёжность и точность. Для таких прогнозов существенные ошибки оборачиваются миллионными потерями материальных ресурсов и просчетами в прогнозах и планировании. Но чаще поводятся социологические исследования для уяснения общих тенденций, общей ориентировки в социальной сфере не требующие стопроцентной надёжности. Существует приблизительная оценка на надёжность результатов исследования: «повышенная надёжность допускает ошибку выборки до 3%. Обыкновенная - до 3-10%, приближенная - то 10 до 20%, ориентировочная - от 20 до 40%, а прикидочная - более 40%».

Таким образом, существует несколько способов, чтобы избежать ошибки:

  • § каждый элемент генеральной совокупности должен иметь одинаковую вероятность попасть в выборочную совокупность;
  • § генеральная совокупность должна быть желательно однородной;
  • § необходимо иметь сведения о структуре генеральной совокупности и её характерные черты;
  • § при составлении выборочной совокупности заранее учесть случайные и систематические ошибки.

Например, если опросив 380 человек в поселении, где общая численность платёжеспособного населения 10 тысяч человек, мы выявили что 36% опрошенных покупателей, предпочитают отечественную продукцию, то с 95-процентной степенью вероятности мы можем утверждать, что отечественную продукцию постоянно покупают 46±5% (то есть от 41 до 51%) жителей этого поселения.

Многие обстоятельства усложняют проблему расчёта выборки и нередко могут привести к тому, что формально-статистически репрезентативная выборка окажется качественно непредставительной».

Качество выборки оценивают по двум показателям: репрезентативность и надежность. О репрезентативности уже говорилось выше. А чтобы создать надежную выборку необходимо правильно построить ее основу. Для этого соблюдаются следующие требования:

  • 1. Полнота выборки, которая требует наличия всех элементов генеральной совокупности в основе выборки. Если в выборку не включены многие единицы наблюдения, тем более, несущие в себе существенные особенности и характеристики объекта, то результаты исследования будут неполными и однобокими.
  • 2. Отсутствие дублирования, которое подразумевает недопустимость повторного включения в выборку одной и той же единицы наблюдения (например, ученик перешел учиться в другую школу, его включили в новый список, не вычеркнув при этом из старого, таким образом, он дважды попал в выборку).
  • 3. Точность информации выборки, предполагающая исключение несуществующих единиц наблюдения из основы выборки. Например, в избирательных списках, которые готовятся для очередных выборов депутатов различного уровня, нередко остаются умершие люди или жильцы снесенных домов.
  • 4. Адекватность, которая означает, что основа составленной выборки должна соотноситься с решением поставленных в исследовании задач. Например, полный список всех учащихся школы -- хорошая основа для того, чтобы сформировать выборку при изучении проблемы общей успеваемости. Но если нас интересует отношение старшеклассников к основным учебным дисциплинам, то этот список может быть использован только для формирования новой основы выборки -- списка старшеклассников.
  • 5. Удобство работы с основой выборки, при котором необходимо четко пронумеровать все элементы, которые в нее входят, а составленные списки централизованно хранить.

«Существует два основных подхода к обоснованию репрезентативности выборки:

  • 1. При статистическом подходе репрезентативность обеспечивается специальными вероятностными методами извлечения выборки. Для обобщения результатов исследования на генеральную совокупность применяются строгие индуктивные процедуры статистического вывода, оценивается ошибка выборки с заданной вероятностью.
  • 2. Внестатистическое обоснование репрезентативности предполагает теоретическое доказательство того, что выборка достаточно хорошо представляет генеральную совокупность. При использовании этого подхода статистическое оценивание ошибок выборки не производится».

На первый взгляд, кажется, что обеспечить репрезентативность выборки на практике просто невозможно, но на самом деле всё зависит от программных целей и задач исследования.

Если мы проводим обследование большой общественной значимости, по завершению которого нужно будет сделать выводы обо всей генеральной совокупности, то необходимо чётко следовать всем требования репрезентативной выборочной процедуры, так как ошибки в таких исследованиях недопустимы.

Если перед нами стоят более скромные задачи и уровень надежности выводов можно смело понизить, то необходимо следовать всем требованиям по качественному представительству выборочной совокупности. Если мы решим подчёркивать статистическую надёжность данных, то введём в заблуждение тех людей, кто привык верить математическим расчётам. Нельзя забывать, что та информация, которую мы получаем путём опросов и других способов, лишь условно переводится в количественные показатели. И не редкость когда количественные показатели только приблизительно отражают существо социальных процессов. «Поэтому усилия, направленные на строгость статистического обоснования результатов, приобретают смысл только при условии серьёзного качественного анализа проблемы, содержательного её изучения».

Необходимо помнить, что социолог должен сосредотачивать своё внимание именно на существе социальных проблем, привлекать к работе других специалистов, практиков и теоретиков, внимательно изучать литературу в области экономики, психологии, социологии о предмете исследования. И для решения статистических задач, по поводу типа и объема выборки, он сначала должен чётко сформулировать конкретные вопросы, которые необходимо решить, а уже потом обращаться к соответствующим расчётам различных статистик.

Выборочный метод в социологии.

Большинство социологических исследований носит не сплошной, а выборочный характер: по строгим правилам отбирается определенное количество людей, отражающих по социально-демографическим признакам структуру изучаемого объекта. Такое исследование называется выборочным.

При построении социологической выборки используется множество специальных терминов, в том числе два важнейших – генеральная ивыборочная совокупность .

Совокупность, из которой отбираются варианты для совместного изучения, называется генеральной, а отобранная из генеральной совокупности часть ее членов носит название выборки ,или выборочной совокупности . Объем генеральной совокупности обозначается символом N , а объем выборочной совокупности – n .

Генеральной совокупностью считают все население или ту его часть, которую социолог намерен изучить, совокупность людей, обладающих одним или несколькими свойствами, подлежащими изучению. Часто генеральная совокупность (еще называемая популяцией) настолько крупная, что опрос каждого представителя чрезвычайно обременителен и дорогостоящ. Это те, на кого направлен теоретический интерес социолога (в том смысле, что узнать о каждом представителе генеральной совокупности ученый может только косвенно – на основе информации о выборочной совокупности).

Выборкой называется совокупность элементов объекта социологического исследования, подлежащая непосредственному изучению. Понятие выборки в статистике и социологии рассматривается в двух значениях:

– выборка (как результат действия) – представительная часть генеральной совокупности, в которой закон распределения признака соответствует закону распределения этого признака в генеральной совокупности;

– выборка (как способ или процесс действия) – способ отбора объектов генеральной совокупности в выборочную.

Выборка должна наилучшим образом репрезентировать объект исследования (генеральную совокупность).

Выборочная совокупность – уменьшенная модель генеральной совокупности. Иначе говоря, это множество людей, которых социолог опрашивает. В выборку, или выборочную совокупность, входят только те, кого социолог намеревается непосредственно опросить. Представим, что предметом его исследования, т. е. темой, выступает экономическая активность пенсионеров. Все пенсионеры – пожилые люди в возрасте старше 55 (женщины) и 60 (мужчины) лет – будут составлять генеральную совокупность. По специальным формулам социолог рассчитал, что ему достаточно опросить 2,5 тысячи пенсионеров. Это и станет его выборочной совокупностью.

Основное правило ее составления гласит: каждый элемент генеральной совокупности должен иметь одинаковые шансы попасть в выборку .Но как этого добиться? Прежде всего, надо узнать как можно больше свойств, или параметров, генеральной совокупности, например, разброс в возрасте, доходах, национальности, местах проживания респондентов. Разброс в возрасте респондентов называется вариацией ,конкретные величины возраста – значениями , а совокупность всех значений образует переменную .



Таким образом, переменная «возраст» имеет значения от 0 до 70 (средняя продолжительность жизни) и более лет. Значения группируются в интервалы: 0–5, 6–10, 11–15 лет и т. д. Их можно группировать иначе, все зависит от задач исследования. Интервалы значений переменной «возраст» в случае с пенсионерами начинаются с 55 и 60 лет.

Все население, целая нация или очень большая социальная группа редко выступают генеральной совокупностью. В большинстве эмпирических исследований социолога интересует частная проблема, например, рост числа разводов среди молодых семей в крупных городах или интерес к инвестиционной деятельности среди представителей среднего класса столичного города. Разводы и инвестиционная деятельность – это те темы, которые интересуют конкретного исследователя в данный период времени. Соответственно все люди, втянутые в этот процесс или участвующие в данном событии, будут называться группой интереса .Их могут быть тысячи или десятки тысяч человек. Они составляют исходную популяцию, или генеральную совокупность, из которой социолог строит выборочную совокупность и опрашивает ее.

Сущность выборочного метода заключается в том, чтобы по свойствам части (выборки) судить о численных характеристиках целого (генеральной совокупности), по отдельным группам элементов – об их общей совокупности, которая иногда мыслится как совокупность неограниченно большого объема. Основу выборочного метода составляет та внутренняя связь, которая существует в популяциях между единичным и общим, частью и целым.

Репрезентативной выборкой в социологии считается такая выборочная совокупность, основные характеристики которой полностью совпадают (представлены в той же пропорции или с той же частотой) с такими же характеристиками генеральной совокупности. Только для этого типа выборки результаты обследования части единиц (объектов) можно распространять на всю генеральную совокупность. Необходимое условие для построения репрезентативной выборки – наличие информации о генеральной совокупности, т. е. либо полный список единиц (субъектов) генеральной совокупности, либо информация о структуре по характеристикам, существенно влияющим на отношение к предмету исследования.

Под репрезентативностью в социологии понимают такие свойства выборки, которые позволяют ей выступать на момент опроса моделью, представителем генеральной совокупности. Иными словами, репрезентативная выборка представляет собой точную модель генеральной совокупности, которую она должна отражать (по значимым для исследования параметрам). В той степени, в какой выборка является репрезентативной, выводы, основанные на изучении этой выборки, можно применить ко всей совокупности.

Репрезентативным считается такое исследование, при котором отклонение в выборочной совокупности по контрольным признакам не превышает 5 %. При пилотажном опросе небольшой генеральной совокупности (например, в рамках факультета численностью до 100–250 человек) репрезентативным будет сплошное анкетирование. В масштабах вуза достаточно будет опросить 25 % от общего числа студентов.

Как только социолог определился с тем, кого он хочет опросить, он определил основу выборки .После чего решается вопрос о типе выборки.

Типами выборки называются основные разновидности статисти-ческой выборки: случайная (вероятностная) и неслучайная (невероятностная). Тип выборки говорит о том, как люди попадают в выборочную совокупность, объем выборки сообщает о том, какое их количество туда попало.

Перейдем к характеристике наиболее распространенных выборок.

Выборка— это множество данных, взятых с помощью определённых процедур из генеральной совокупности для исследовательского анализа. Репрезентативность - это свойство воспроизведения представления о целом по его части. По иному, это возможность распространения представления о части на целое, которое эту часть включает в себя.

Репрезентативность выборки — это показатель, заключающийся в том, что выборка должна полно и достоверно отображать признаки той совокупности, частью которой она является. Её также можно определять как свойство выборки наиболее полно представлять характеристики генеральной совокупности, существенные с точки зрения цели исследования.

Допустим, что генеральная совокупность — все ученики школы (900 человек из 30 классов, по 30 человек в каждом классе). Объект исследования — отношение школьников к курению. Выборочная совокупность, состоящая из 90 учащихся только намного хуже представит всю совокупность, чем выборка из тех же 90 учеников, куда вошли бы из каждого класса по 3 ученика. Главная причина — неравное распределение по возрастам. Таким образом, в первом случае репрезентативность выборки будет низкой. Во втором случае - высокой.

В социологии говорят, что существует репрезентативность выборки и её нерепрезентативность.

В качестве примера нерепрезентативной выборки можно привести классический случай, произошедший в 1936 году в США во время президентских выборов.

Журнал «Литэрари дайджест», который до этого весьма успешно прогнозировал результаты предыдущих выборов, на этот раз ошибся в своих прогнозах, хотя разослал несколько миллионов письменных вопросов подписчикам, а также респондентам, которых они выбрали из телефонных книг и из списков регистрации автомобилей. В 1/4 бюллетеней, которые вернулись заполненные обратно, голоса распределились следующим образом: 57 % отдали первенство кандидату от республиканцев по имени Альф Лэндон, а 41 % отдали предпочтение действующему президенту - демократу Франклину Рузвельту.

В действительности, на выборах победил Ф. Рузвельт, который набрал почти 60 % голосов. Ошибка «Литэрари дайджест» была в следующем. Они захотели увеличить репрезентативность выборки. А так как они знали, что большинство их подписчиков относят себя к республиканцам, то они решили расширить выборку за счёт респондентов, выбранных ими из телефонных книг и автомобильных регистрационных списков. Но они не учли существующих реалий и фактически отобрали ещё больше сторонников республиканцев, потому что во времена иметь автомобили и телефоны мог позволить себе средний и высший класс. А это и были по большей части республиканцы, а не демократы.

Существуют различные виды выборки: простая случайная, серийная, типическая, механическая и комбинированная.

Простая случайная выборка состоит в отборе из всей совокупности изучаемых единиц наугад без какой-либо системы.

Механическую выборку применяют тогда, когда в генеральной совокупности есть упорядоченность, например, имеется некая последовательность единиц работников, избирательные списки, номера телефонов респондентов, номера квартир и домов и другое).

Типический отбор используется тогда, когда всю совокупность можно разделить на группы по типам. При работе с населением такими могут быть, например, образовательные, возрастные, социальные группы, при исследовании предприятий - отрасль или отдельная организация и др.

Серийный отбор удобен тогда, когда единицы объединены в небольшие серии или группы. Такой серией могут быть партии готовой продукции, школьные классы, и другие группы.

Комбинированная выборка предполагает использование всех предыдущих видов выборки в той или иной комбинации.

С точки зрения статистического подхода репрезентативность выборки обеспечивается выполнением следующих условий: а) каждый из объектов генеральной совокупности должен иметь одинаковую вероятность быть представленным в выборке; б) отбор производится из однородных совокупностей; в) число объектов в выборке должно быть достаточно большим; г) выборка и генеральная совокупность должны быть по возможности статистически однородны.

Создание простой вероятностной выборки может осуществляться методом рандомизации – процедурой случайного отбора.При этом методе характеристики испытуемых игнорируются, их включение в выборку имеет одинаковую вероятность и является непредвзятым. Это значит, что любой испытуемый имеет равные шансы попасть в выборку. Процедура построения простой случайной выборки включает в себя следующие шаги: а) необходимо получить полный список членов генеральной совокупности и пронумеровать этот список; б) определить предполагаемый объем выборки, то есть ожидаемое число испытуемых; в) извлечь из таблицы случайных чисел столько чисел, сколько требуется выборочных единиц (например, если в выборке должно оказаться 100 человек, из таблицы берут 100 случайных чисел, которые могут генерироваться компьютерной программой). Упрощенным вариантом рандомизации является механический отбор испытуемых на основе списка генеральной совокупности через определённый интервал (К), который определяется случайно.

Несмотря на свою простоту, этот метод имеет существенные ограничения:

Значительно увеличивает трудозатраты и стоимость сбора данных, если генеральная совокупность является численно большой или распределенной по большой географической территории (это характерно при создании ПДМ, рассчитанных на широкие слои населения);

Результаты применения простой случайной выборки часто характеризуются низкой точностью и большой стандартной ошибкой.

В случае неоднородной генеральной совокупности, прежде чем формировать выборку, рекомендуется разделить эту совокупность на однородные части. Они могут формироваться на основе того или иного признака: административно-территориальные единицы (например, районы города), социально-демографические характеристики (пол, возраст, социальный статус) или организационная принадлежность испытуемых (образовательные учреждения) и т.д. Такая выборка называется районированной (стратифицированной). Далее из каждой однородной части отбор в выборку осуществляется случайным образом. Например, для оценки методики изучения межличностной идентичности в группе и подгруппах и методики изучения микрогрупповой и групповой идентичности (применительно к учебным группам подростково-юношеского возраста) были выбраны шесть средних общеобразовательных школ в трех районах и два вуза г. Ростова-на-Дону. Далее методом случайного отбора в выборку были включены по шесть групп 10-х и 11-х классов школ и шесть студенческих групп 2 курса вузов (всего 18 групп).Общая численность испытуемых составила 413 человек.



Ещё одним вариантом рандомизации является создание серийной (гнездовой или кластерной) выборки. Здесьединицами случайного отбора выступают не сами объекты, а группы (кластеры или гнёзда). Объекты внутри групп обследуются сплошным образом.

Создание невероятностной выборки, что широко практикуется при оценке психодиагностических методик и составлении нормативов, осуществляется не по принципу случайности, а по субъективным критериям – доступности, типичности, равного представительства и т.д. Выделяют несколько способов формирования такой выборки:

1) Метод квотирования. Изначально выделяется некоторое количество групп объектов (например, мужчины и женщины в возрасте 18-25 лет, 26-35 лет и 36-55 лет. Для каждой группы задается количество испытуемых, которые должны быть обследованы с помощью данной методики. Количество испытуемых, которые должны попасть в каждую из групп, задается либо пропорционально заранее известной доле группы в генеральной совокупности (например, если генеральная совокупность представлена 5000 человек, из них 2000 женщин и 3000 мужчин, тогда в квотной выборке будет 200 женщин и 300 мужчин), либо одинаковым для каждой группы. Внутри групп объекты отбираются произвольно.

2) Метод «снежного кома». Выборка строится следующим образом: у каждого респондента, начиная с первого, просятся контакты его друзей, коллег, знакомых, которые подходили бы под условия отбора и могли бы принять участие в исследовании. Таким образом, за исключением первого шага, выборка формируется с участием самих объектов исследования.

3) Метод стихийного отбора.Опрашиваются наиболее доступные респонденты. Размер и состав стихийных выборок заранее не известен, и определяется только одним параметром – желанием и активностью респондентов.

4) Метод отбора типичных объектов. После районирования (стратификации) из каждой группы отбирается типичный объект, т.е. объект, который по большинству изучаемых в исследовании характеристик приближается к средним показателям.

Репрезентативность выборки измеряется разностью между характеристиками выборочной и генеральной совокупностей. (Чем более выборка и генеральная совокупность являются статистически однородны, тем более выборка репрезентативна.) Однако фактическая величина указанной разности остаётся неизвестной, вследствие чего мерой репрезентативности служит определяемая по правилам математической статистики её вероятная величина или же средняя квадратическая её возможных значений.

При разработке, оценке и стандартизации методики суждение о степени репрезентативностивыносится на основе оценки минимального объема выборк и и соответствия эмпирического распределения нормальному .

Требуемый объем выборки для обеспечения её количественной репрезентативности часто определяется как минимальный объем выборки, необходимый для того, чтобы выборочное среднее значение () отличалось от истинного среднего значения генеральной совокупности не более, чем на заданную величину. В этом случае минимальный объем выборки может оцениваться посредством определения доверительного интервала для среднего значения по показателям методики:

где n – минимальный объем выборки, ua – значения для стандартных доверительных вероятностей, - выборочное стандартное отклонение, d – заданная величина отклонения выборочного среднего значения от генерального среднего.

Например, по методике изучения общительности-замкнутости мы провели пилотажное обследование 50 испытуемых. С помощью «ключа» производим обработку результатов и получаем тестовые показатели по каждому испытуемому. Далее на этой выборке (N=50) проводим расчет:

а) среднего значения: , (3)

где - тестовый показатель каждого испытуемого, N – количество испытуемых;

б) стандартного (среднеквадратического) отклонения: (4).

По результатам выборочного исследования среднее значение составляет 11,25 и стандартное отклонение – 3,47. Задаемся, например, доверительной вероятностью 95% (ua= 1,96 в табл. 1) и отклонением выборочного среднего значения от истинного значения среднего результата не более чем на d = 0,5 и по формуле (1) находим

Таким образом, при объеме выборки n = 154 существует 95%-ная вероятность того, что выборочное среднее арифметическое будет отличаться от генерального среднего не более чем на 0,5 баллов.

Таблица 1

Значения ua для стандартных доверительных вероятностей

a 1 - a u a
0,05 0,95 1,96
0,01 0,99 2,58
0,001 0,999 3,28

В этом случае нам надо провести дополнительное обследование 104 испытуемых и, тем самым, довести объем выборки до 154. Величина минимального объема выборки зависит от заданного уровня доверительной вероятности, величины d и выборочного стандартного отклонения. Чем больше будет доверительная вероятность, меньше величина d или больше стандартное отклонение, тем потребуется большая по численности минимальная выборка.

Нормальное распределение наиболее часто применяют для статистического описания совокупности эмпирических данных, оценки репрезентативности выборки и шкалы (методики), для стандартизации тестовых баллов (на основе перевода в интервальную шкалу). На свойствах нормального распределения основаны статистические критерии проверки гипотез (z-критерий, критерий , F-критерий Фишера, t-критерий Стъюдента и др.).

Нормальность распределения оценивается с помощью критерия Колмогорова – Смирнова, который считается наиболее состоятельным для определения степени соответствия эмпирического распределения нормальному. Если p >0,1, то делается вывод о приблизительном соответствии данного эмпирического распределения нормальному. В качестве примера можно привести показатели оценки нормальности распределения по шкалам многомерного профессионально-психологического личностного теста.

Сравнение эмпирического распределения с теоретическим нормальным распределением можно также осуществлять посредством оценки таких свойств как асимметрия () и эксцесс (). Асимметрия и эксцесс нормального распределения равны нулю. Если хотя бы один из этих двух показателей проверяемого эмпирического распределения существенно отклоняется от данного значения, это означает аномальность оцениваемого распределения.

Асимметрия эмпирического распределения определяется по формуле:

, (5)

где - среднее арифметическое значение, - стандартное отклонение,

Среднее кубическое (), (6)

С – среднее квадратическое () (7).

Если эмпирическое распределение не соответствует нормальному, то выборка не репрезентативна по качеству и/или количеству. Однако это может свидетельствовать и о том, что данная методика не дает нормального распределения результатов, так как плохо составлен стимульный материал (например, многие тестовые задания не обладают средней диагностической силой).

Понятие стандартности

Стандартность – унификация, приведение к единым нормативам разных частей ПДМ и процедуры ее применения.

Психодиагностические методики с самого начала их разработки задумываются как универсальные, неспецифические, т.е. такие, которые могут использоваться разными специалистами в различных ситуациях. Поэтому ПДМ должна иметь единообразную процедуру проведения, стандартный стимульный материал (утверждения, рисунки и т.д.), стандартный метод обработки и способ интерпретации результатов. Именно это позволяет сравнить выводы, т.е. оценить проявление одного и того же психического параметра в разных ситуациях и у разных людей и, в зависимости от силы проявления диагностируемого параметра, выработать адекватные рекомендации. Стандартность ПДМ и условий ее применения дает возможность сравнивать результаты, полученные разными специалистами при диагностике различных людей. При любом отклонении ПДМ от стандарта, ее результаты невозможно сравнивать с результатами, полученными с помощью оригинала данной методики, использованной на других людях или в другой ситуации.

Однако отсутствие или нарушение стандартности ПДМ не означает, что данной методикой вообще невозможно пользоваться. Нестандартизированную методику можно использовать в научно-исследовательских целях – изучать новые психические явления, выявлять новые факты и накапливать научные результаты, устанавливать причинно-следственные связи и закономерности. Однако такой методикой нельзя пользоваться в психодиагностических целях.

Просмотров