Илюстративен образец. Представителна извадка. Пример за непредставителна извадка

Понятието "представителност" по отношение на социологическите проучвания - проучванията на общественото мнение - има почти магически ефект върху хората. Самият термин „представителство” има освен научен и ясно политически смисъл.

Каква е причината? Работата е там, че се предполага, че извадката (група от хора, избрани за проучването) може да представлява (представлява) цялата популация. Общата съвкупност в случая на общоруските проучвания е цялото население на страната. Сега нека си представим, че говорим за политическо решение – подкрепа на законопроект или гласуване на избори. С помощта на извадково проучване получаваме отличен механизъм за политическо представителство - механизъм, при който малка група хора може да представлява мнението или позицията на цялото население на страната. Затова на представителността на изследването се отрежда толкова важно място.

Концепцията за представителност се използва, разбира се, не само в политическите изследвания. Терминът почти винаги се използва, когато говорим за големи изследвания, независимо дали в областта на маркетинга, икономическото поведение или образованието.

Методология на представителните проучвания

Как след проучване на 1500 души може да се направят изводи за всички руснаци, които са повече от 140 милиона (и дори гласоподаватели повече от 110 милиона)? Технологията зад представителните анкети се основава на статистически закони. Най-близката причина е законът за големите числа или теоремата на Бернули.

Опростено, значението му може да се предаде по следния начин. Да предположим, че имаме някаква характеристика, например количеството на валежите на ден в Екатеринбург през 20 век. Ако напишем всички негови стойности заедно с тяхната честота (това се нарича разпределение) и след това на случаен принцип вземем достатъчно голямо числослучаи (т.е. не всички дни през 20-ти век, но доста), тогава ще видим, че разпределението в нашата извадка ще бъде много подобно на разпределението за целия 20-ти век. По този начин, ако изберем някои единици от съвкупността, те наистина могат да представляват цялата съвкупност и всъщност не е необходимо да се събират данни за всички случаи.

Има обаче едно ключово условие: това е вярно само ако изборът е строго случаен. Единственият проблем тук може да бъде отклонението от случайността. Така, ако вземем само данни за валежите за последните години(например, защото тези данни се намират по-лесно) или интервюираме 1500 наши познати (защото е по-лесно да се свържем с тях), а не случайни хора, тогава извадката със сигурност няма да е представителна.

Представете си, че от 143,5 милиона руснаци избирате произволно 1500 души, от които се нуждаете. Тогава, например, делът на средните мениджъри сред тях ще бъде приблизително равен на дела на средните мениджъри в популацията, което показва, че вашата извадка може да представлява цялата популация. Може ли да се случи тези два показателя да са много различни? Например сред руснаците е 14%, но в извадката ще бъде само 1%? Теоретично това е възможно, но вероятността за това е толкова малка, че може да бъде пренебрегната (като среща с дракон на улицата).

Освен това най-приятното в тази вероятност дори не е, че е малка, а че за случайни процеси тази вероятност може да бъде изчислена. Можем да кажем с каква вероятност стойността на нашата извадка ще се отклони от стойността в генералната съвкупност с 13% (както в горния пример) и с каква, да речем, с 2,5%. Обикновено обаче те правят обратното: първо определят вероятността, с която искаме нашата стойност да не се отклонява от стойността в общата съвкупност (най-често тя е фиксирана на ниво от 95%), а след това разглеждат големината на отклонението за проби с определен размер. Това отклонение се нарича доверителен интервал, понякога наричан извадкова грешка или статистическа грешка, и често се посочва заедно с резултатите от проучването.

И така, вероятността за отклонение, количеството на отклонението (доверителният интервал) и размерът на извадката са свързани. Въз основа на това формулата за изчисляване на размера на извадката е следната:

където n е размерът на извадката, Δ е доверителният интервал, z е стойността на функцията на нормалното разпределение за дадена вероятност за отхвърляне (за вероятност от 5%, тази стойност е 1,96).

Това е опростена формула, реалните проучвания използват малко повече сложни формули. Тази формула също може да се провали, ако стойността на индикатора е много различна от 50% (така например тази формула не е подходяща за оценка на дела на пациентите с рядко заболяване в дадена страна).

Ето какво се случва, ако замените някои стойности в тази формула:

С други думи, ако вземем произволна извадка от руснаци с размер от 1600 души и изчислим някакъв показател, например желанието да гласуват за определен политик, тогава с вероятност от 95% нашата оценка няма да се различава от желанието да гласуват за него сред всички руснаци с повече от 2, 45%.

Размер на извадката

Какво от това? по-голям размеризвадка, толкова по-вероятно е да сме по-близо до дял от населението. Изглежда, че това означава, че трябва да се опитаме да доближим извадката до 143,5 млн. Всъщност, както можете да видите от таблицата, природата на случайните процеси е такава, че от определен момент вероятността да попаднат в интервала започва да се увеличава много бавно (и този момент идва доста бързо). След като вземем извадка от 1500 единици, без значение колко увеличаваме размера на извадката, вероятността стойността на нашата извадка да попадне в стойността на съвкупността ще нараства много, много бавно.

Всъщност почти няма разлика между 1500 и 10 000 анкетирани. Някъде към 1500 г. вече можем да кажем, че нашите оценки ще се различават от дела в общата съвкупност с 2-3%. Ако увеличим допълнително извадката, тогава тази възможна грешка ще намалее, но много леко. С други думи, извадка от 100 000 е по-добра от извадка от 2500, но разликата е толкова малка, че няма смисъл и в случая на социални проучвания не е икономически оправдана. Обикновено увеличаването на извадката е скъпо и следователно няма смисъл да се увеличава, за да спечели един процентен пункт в стойността на доверителния интервал.

Важно е размерът на генералната съвкупност изобщо да не фигурира във формулата. Факт е, че когато популацията е голяма (повече от 20 000), това почти няма ефект върху размера на извадката. По този начин не е необходимо да знаем колко хора живеят в Русия, за да изградим представителна извадка. Ясно е, че изборът на 1500 от 2000 най-вероятно няма смисъл - по-лесно е да разгледате 2000 и да получите точна оценка. Но, ако е необходимо, като направим извадка, получаваме възможност да обобщим резултатите от нея за общата съвкупност. И поради същата причина размерът на извадката няма да се различава за големите и малките страни.

Представителност и точност

За да разберем значението на понятието "представителност", нека разгледаме извадка от 15 души. Колкото и да е странно, ако сте го направили случайно, той също е представителен. Освен това можете да направите проба от една единица. Представете си кутия с топки, от която на случаен принцип изтегляте една топка. Ако това е произволно избрана топка, тогава тя също ще представлява всички топки, които са в тази кутия. Той просто ще ги представлява. не точно. Защо? Защото има много голяма вероятност да сгрешите. Следващият път можем да изтеглим друга топка и да добием различна представа за топките в кутията. Да представиш неточно означава да имаш широк диапазон от оценки.

По същия начин 15 души представляват всяка генерална съвкупност, но те я представят неточно, защото грешката, доверителният интервал, е много голяма. Ще трябва да добавим +/- 33%, за да получим 95% шанс да попаднем в интервала. Ако сме готови да признаем това, тогава вземаме 15 души, установяваме, че 7 от тях са средни мениджъри и тогава получаваме оценка, че 7/15 от общия брой, тоест 47% +/- 33%, е прогнозния дял на мениджърите в общата съвкупност и това е абсолютно правилен извод. Просто няма стойност. Това можем да кажем и без проверка. Следователно, когато планирате извадка, има смисъл да постигнете размер, който ще бъде подходящ от гледна точка на рентабилност.

Всичко по-горе има за цел да предаде една проста идея, която много често не се реализира: размерът на извадката не е свързан с нейната представителност.

Малка извадка е неточна, но все пак може да бъде представителна. Размерите на извадката, които се използват днес в масови проучвания в Русия, почти винаги имат доста висока точност.

Представителността на извадката е застрашена не от нейния размер, а от пристрастност, тоест отклонение от принципа на случайността.

Нарушаване на принципа на случайността

Ако започнем да избираме единици неслучайно, извадката става непредставителна. Например, ако нещо ни пречи да ги изберем на случаен принцип. Представете си, че искаме да изберем произволно топки от нашата кутия, но след това се оказва, че някои от топките хапят. Механизмът, по който ще вземем само тези топчета, които са ни дадени, е механизъм, който нарушава произволността и следователно нарушава представителността. В този случай, колкото и топчета да вземем от кутията (дори да вземем всички топчета, които не хапят), ще имаме непредставителна извадка, защото няма да вземем под внимание нито едно от хапещите - те просто заобиколете нашата извадка.

Най-големият проблем с топките за хапване е, че те могат да бъдат различни от тези, които идват в ръцете ни, и се различават точно по начина, по който ни интересува. Тази ситуация се нарича отклонение на извадката.

Необходимо е да се разграничи ситуацията на неточно представителство, която описахме по-горе, от ситуацията на непредставителство. Това са различни проблеми и те имат различни решения. Не можете да разрешите едно от тях, като решите другото. Ако извадката не е представителна, няма смисъл да се увеличава. Освен това големите извадки в социалните проучвания са склонни да натрупват грешки, така че проблемът с представителството може само да се изостри от голямо увеличение на извадката.

Защо представителността е невъзможна?

В бележките към таблиците с резултатите от проучванията често може да се види, че „размерът на извадката е 1600 души, извадката е представителна по пол и възраст“. От казаното по-горе е очевидно, че това са два различни параметъра: индикацията за представителност не е свързана с размера на извадката. Всъщност тук се има предвид, че са следвани определени процедури, за да се гарантира съответствието между извадката и популацията. Например, за да се осигури представителност по пол, мъжете и жените се набират в извадката в същите пропорции, които съществуват сред руснаците според данните от преброяването. Но представителност по пол не означава представителност, например, по политически възгледи.

Защо е необходимо извадката да се подравнява по пол и други социално-демографски категории? Защото само случайна извадка може да осигури истинска представителност, а тя е невъзможно да се приложи на практика поради различни причини. Веднага щом се опитате да направите това, ще се натъкнете на много проблеми - без значение кой метод изберете да използвате. Някои респонденти изобщо ще бъдат недостъпни за вашия метод (да речем, за лични интервюта голям проблемса къщи с домофони и охрана), друга част ще отсъстват, няма да отговарят или ще предпочетат да си вършат работата. Има хора, които имат езикови проблеми и не могат да говорят с нас. Има хора, които не разбират защо е необходимо това и не искат да говорят с нас. Всичко това са сериозни нарушения на случайността, които правят реализацията й невъзможна.

Тези, които свеждат проблема с представителността в масовите проучвания до статистика, забравят, че хората са много специфични топчета. Има топки, които бягат и се крият. Има топки, които хапят. Те не са пасивни обекти, те отвръщат на удара. Те казват: „Не искам да участвам във вашето проучване“, като по този начин нарушават случайността. Следователно, в тесния смисъл на думата, представителността в масовите проучвания, разбира се, е невъзможна под каквато и да е форма.

Разработен е механизъм, чрез който обикновено се осигурява видимостта на представителността: подравняваме извадката в някои категории и се преструваме, че тя също е подравнена във всички други възможни категории. Всъщност нямаме причина да твърдим това. Но проблемът е, че това няма как да се провери - пак поради факта, че някои топки хапят. За да провери за пристрастност, изпитващият трябва да отиде при тези, които не сме интервюирали, и да ги интервюира. Но те, както си спомняме, изобщо не искат да бъдат разпитвани. Невъзможно е да се разпитват тези, които категорично не отговарят. Следователно всички работят с предположението, че ако подравним извадката по два или три параметъра, тя представлява цялата популация, въпреки че няма сериозна основа за това предположение.

Представителната извадка е технология, заимствана от социолозите от статистиката. Следователно то неизбежно носи елементи от математико-статистическата картина на света. Може би най-силното предположение е, че самото извадково изследване е политически и социологически неутрално: участието и неучастието в изследването не носи политически смисъл и не е свързано с други социологически важни параметри. Но днес анкетите се превърнаха в една от основните политически институции и се превърнаха в ключов посредник между големите корпорации и потребителите. При тези условия вече не е възможно да се вярва в тяхната политическа стерилност. Все още обаче знаем малко за това как се разбират анкетите модерни обществаи какво всъщност представляват.

Извадката в 1C 8.2 и 8.3 е специализиран начин за сортиране на записи на таблици на информационна база. Нека да разгледаме по-отблизо какво е вземането на проби и как да го използваме.

Какво е проба в 1C?

проба- начин за сортиране на информация в 1C, който се състои в последователно поставяне на курсора върху следващия запис. Избор в 1C може да бъде получен от резултата от заявката и от мениджъра на обекти, например документи или директории.

Пример за получаване и повторение от мениджър на обекти:

Избор = Директории. банки. Избирам() ; Докато селекцията. Next() Cycle EndCycle ;

Пример за получаване на селекция от заявка:

Вземете 267 1C видео урока безплатно:

Заявка = Нова заявка( „Изберете връзка, код, име от директория. Банки“) ; Проба = Заявка. Изпълни() . Избирам() ; Докато селекцията. Цикъл Next(). //извършва интересни действия с директорията "Банки".Краен цикъл;

И двата горни примера получават едни и същи набори от данни за повторение.

Методи за вземане на проби 1C 8.3

Изборът има голям брой методи, нека ги разгледаме по-подробно:

  • Избирам()- метод, чрез който се получава директно проба. От селекцията можете да получите друга, подчинена, селекция, ако е посочен типът заобикаляне "чрез групиране".
  • собственик ()е обратният метод на Select(). Позволява ви да получите избора на заявка "родител".
  • Следващия()- метод, който премества курсора към следващия запис. Връща True, ако записът съществува, False, ако няма повече записи.
  • Намери следващото()- много полезен метод, с който можете да обхождате само необходимите полета по стойност на селекцията (селекция - структура на полето).
  • NextByFieldValue()- позволява ви да получите следващия запис със стойност, различна от текущата позиция. Например, необходимо е да сортирате всички записи с уникална стойност на полето "Акаунт": Selection.NextBy FieldValue ("Акаунт").
  • Нулиране()- позволява ви да нулирате текущото местоположение на курсора и да го зададете в първоначалната му позиция.
  • Количество()- връща броя на записите в селекцията.
  • Вземи()- използвайки метода, можете да поставите курсора върху желания запис чрез стойността на индекса.
  • ниво () -ниво в йерархията на текущия запис (номер).
  • RecordType()— показва типа запис — DetailRecord, GroupTotal, HierarchyTotal или GrandTotal
  • групиране()- връща името на текущата групировка, ако записът не е групировка - празен низ.

Ако започвате да изучавате 1C програмиране, препоръчваме нашия безплатен курс(не забравяй

Често се случва да е необходимо да се анализира определено социално явление и да се получи информация за него. Такива работни места често се появяват...

Вземането на проби е ... Определение, видове, методи и резултати от вземането на проби

От Masterweb

09.04.2018 16:00

Често се случва да е необходимо да се анализира определено социално явление и да се получи информация за него. Такива задачи често възникват в статистиката и в статистически изследвания. Верификацията на напълно дефиниран социален феномен често е невъзможна. Например, как да разберете мнението на населението или на всички жители на даден град по всеки въпрос? Да попиташ абсолютно всички е почти невъзможно и много трудоемко. В такива случаи се нуждаем от проба. Това е точно концепцията, на която се основават почти всички изследвания и анализи.

Какво е проба

Когато се анализира конкретно социално явление, е необходимо да се получи информация за него. Ако вземем каквото и да е изследване, можем да видим, че не всяка единица от съвкупността на обекта на изследване подлежи на изследване и анализ. Само определена част от тази съвкупност се взема предвид. Този процес е вземане на проби: когато се изследват само определени единици от набора.

Разбира се, много зависи от вида на пробата. Но има и основни правила. Основният гласи, че изборът от популацията трябва да бъде абсолютно случаен. Единиците от съвкупността, които ще се използват, не трябва да се избират поради никакъв критерий. Грубо казано, ако е необходимо да се събере население от населението на определен град и да се изберат само мъже, тогава ще има грешка в изследването, тъй като подборът не е извършен на случаен принцип, а е избран според пола. Почти всички методи за вземане на проби се основават на това правило.

Правила за вземане на проби

За да може избраната съвкупност да отразява основните качества на цялото явление, тя трябва да бъде изградена по определени закони, като основното внимание трябва да се обърне на следните категории:

  • извадка (извадкова съвкупност);
  • общо население;
  • представителност;
  • грешка в представителността;
  • популационна единица;
  • методи за вземане на проби.

Характеристиките на селективното наблюдение и вземане на проби са следните:

  1. Всички получени резултати се основават на математически закони и правила, тоест с правилното провеждане на изследването и с правилните изчисления резултатите няма да бъдат изкривени на субективна основа
  2. Позволява да се получи резултат много по-бързо и с по-малко време и ресурси, като се изучава не целият набор от събития, а само част от тях.
  3. Може да се използва за изучаване на различни обекти: от конкретни въпроси, например възраст, пол на групата, която ни интересува, до изследване на общественото мнение или нивото на материална подкрепа на населението.

Селективно наблюдение

Селективно - това е такова статистическо наблюдение, при което не цялата изследвана популация е подложена на изследване, а само част от нея, избрана по определен начин, като резултатите от изследването на тази част се отнасят за цялата популация. Тази част се нарича рамка за вземане на проби. Това е единственият начин да се изследва голям масив от обекта на изследване.

Но селективното наблюдение може да се използва само в случаите, когато е необходимо да се изследва само малка група единици. Например, когато се изучава съотношението мъже и жени в света, ще се използва селективно наблюдение. По очевидни причини е невъзможно да се вземе предвид всеки жител на нашата планета.

Но при едно и също изследване, но не на всички жители на земята, а на определен 2 "А" клас в конкретно училище, определен град, определена държава, може да се откаже от избирателно наблюдение. В крайна сметка е напълно възможно да се анализира целият масив от обекта на изследване. Трябва да се преброят момчетата и момичетата от този клас - това ще бъде съотношението.


Извадка и популация

Всъщност не е толкова трудно, колкото звучи. Във всеки обект на изследване има две системи: генерална и извадкова съвкупност. Какво е? Всички единици принадлежат на генерала. И към извадката - онези единици от общата съвкупност, които са взети за извадката. Ако всичко е направено правилно, тогава избраната част ще бъде намалено оформление на цялата (обща) популация.

Ако говорим за генералната съвкупност, тогава можем да различим само две от нейните разновидности: определена и неопределена генерална съвкупност. Зависи от това дали общият брой единици на дадена система е известен или не. Ако това е определена популация, тогава вземането на проби ще бъде по-лесно поради факта, че се знае какъв процент от обща сумаединици ще бъдат взети проби.

Този момент е много необходим в изследването. Например, ако е необходимо да се изследва процентът на нискокачествени сладкарски изделия в конкретен завод. Да приемем, че населението вече е дефинирано. Известно е със сигурност, че това предприятие произвежда 1000 сладкарски изделия годишно. Ако от тази хиляда направим извадка от 100 произволни сладкарски изделия и ги изпратим на изследване, тогава грешката ще бъде минимална. Грубо казано, 10% от всички продукти са били обект на изследване и въз основа на резултатите, като се вземе предвид грешката в представителността, можем да говорим за лошо качество на всички продукти.

И ако направите извадка от 100 сладкарски продукта от неопределена обща съвкупност, където всъщност има, да речем, 1 милион единици, тогава резултатът от извадката и самото изследване ще бъдат критично неправдоподобни и неточни. Почувствай разликата? Следователно сигурността на общата популация в повечето случаи е изключително важна и силно влияе върху резултата от изследването.


Представителност на населението

И така, сега един от най-важните въпроси - каква трябва да бъде пробата? Това е най-важният момент от изследването. На този етап е необходимо да се изчисли извадката и да се изберат единици от нея общ бройв нея. Популацията е избрана правилно, ако някои характеристики и характеристики на генералната популация остават в извадката. Това се нарича представителност.

С други думи, ако след селекция една част запазва същите тенденции и характеристики като цялото количество изследвани, тогава такава популация се нарича представителна. Но не всяка конкретна извадка може да бъде избрана от представителна популация. Има и такива обекти на изследване, чиято извадка просто не може да бъде представителна. Оттук идва понятието грешка в представителността. Но нека поговорим малко повече за това.

Как се прави проба

И така, за да се постигне максимална представителност, има три основни правила за вземане на проби:

  1. Най-уникалният показател за броя на извадката се счита за 20%. Статистическа извадка от 20% почти винаги ще даде резултат, възможно най-близък до реалността. В същото време не е необходимо да се прехвърля към събраната по-голяма част от общата съвкупност. 20% от извадката е цифрата, разработена от много изследвания. Нека да разгледаме още малко теория. Колкото по-голяма е извадката, толкова по-малка е грешката на представителността и по-точен е резултатът от изследването. Колкото по-близо е извадковата съвкупност до генералната съвкупност по отношение на броя на единиците, толкова по-точни и правилни ще бъдат резултатите. В крайна сметка, ако изследвате цялата система, резултатът ще бъде 100%. Но тук няма селекция. Това са тези изследвания, в които се изследва целият масив, всички единици, така че това не ни интересува.
  2. В случай на нецелесъобразност на обработката на 20% от общата съвкупност е разрешено да се изучават единици от съвкупността в размер най-малко 1001. Това също е един от показателите за изследване на масива на обекта на изследване , която се е развила във времето. Разбира се, няма да даде точни резултати при големи масиви от изследвания, но ще ги доближи максимално до възможната точност на извадката.
  3. В статистиката има много формули и таблици. В зависимост от обекта на изследване и критерия за вземане на проби е целесъобразно да се избере една или друга формула. Но този елемент се използва в сложни и многоетапни изследвания.

Грешка (грешка) на представителността

Основната характеристика на качеството на избраната проба е понятието "грешка на представителността". Какво е? Това са известни несъответствия между показателите на избирателното и непрекъснатото наблюдение. Според показателите за грешки представителността се разделя на достоверна, обикновена и приблизителна. С други думи, допустими са отклонения съответно до 3%, от 3 до 10% и от 10 до 20%. Въпреки че в статистиката е желателно грешката да не надвишава 5-6%. В противен случай има основание да се говори за недостатъчна представителност на извадката. За да се изчисли грешката на представителността и как тя влияе върху извадка или популация, се вземат предвид много фактори:

  1. Вероятността, с която да се получи точен резултат.
  2. Брой единици за вземане на проби. Както бе споменато по-рано, колкото по-малък е броят на единиците в извадката, толкова по-голяма ще бъде грешката в представителността и обратно.
  3. Хомогенност на изследваната популация. Колкото по-хетерогенна е съвкупността, толкова по-голяма ще бъде грешката в представителността. Способността на една съвкупност да бъде представителна зависи от хомогенността на всички нейни съставни единици.
  4. Метод за подбор на единици в извадкова съвкупност.

При конкретни проучвания процентната грешка на средната стойност обикновено се определя от самия изследовател въз основа на програмата за наблюдение и според данни от предишни изследвания. По правило максималната грешка на извадката (грешка на представителност) в рамките на 3-5% се счита за приемлива.


Повече не винаги е по-добре

Също така си струва да запомните, че основното при организирането на селективно наблюдение е да се сведе обемът му до приемлив минимум. В същото време не трябва да се стремите към прекомерно намаляване на границите на грешката при вземане на проби, тъй като това може да доведе до неоправдано увеличаване на количеството данни от извадката и следователно до увеличаване на разходите за вземане на проби.

В същото време размерът на грешката в представителността не трябва да се увеличава прекомерно. В крайна сметка, в този случай, въпреки че ще има намаляване на размера на извадката, това ще доведе до влошаване на надеждността на получените резултати.

Какви въпроси обикновено се задават от изследователя?

Всяко изследване, ако се провежда, е с някаква цел и за получаване на някакви резултати. При провеждане на извадково проучване, като правило, първоначалните въпроси са:

  1. Определение необходимо количествоединици за вземане на проби, тоест колко единици ще бъдат изследвани. Освен това, за точно изследване, популацията трябва да е представителна.
  2. Изчисляване на грешката на представителност с установеното ниво на вероятност. Веднага трябва да се отбележи, че селективните изследвания не се провеждат със 100% вероятност. Ако органът, извършил изследването на конкретен сегмент, твърди, че техните резултати са точни с вероятност от 100%, тогава това е лъжа. Многогодишната практика вече е установила процента на вероятност за правилно проведено извадково изследване. Тази цифра е 95,4%.

Методи за подбор на изследователски единици в извадката

Не всяка извадка е представителна. Понякога един и същ знак е различно изразен в цялото и в част от него. За постигане на изискванията за представителност е препоръчително да се използва различни триковесъздаване на проба. Освен това използването на един или друг метод зависи от конкретните обстоятелства. Някои от тези методи за вземане на проби включват:

  • случаен избор;
  • механична селекция;
  • типична селекция;
  • сериен (вложен) избор.

Случайният подбор е система от дейности, насочени към случаен подбор на единици от съвкупността, когато вероятността да бъдат включени в извадката е еднаква за всички единици от генералната съвкупност. Тази техника е препоръчително да се прилага само в случай на хомогенност и малък брой присъщи характеристики. Иначе някои черти на характерарискуват да не бъдат включени в извадката. Характеристиките на случайния подбор са в основата на всички други методи за вземане на проби.

При механичен избор на единици се извършва на определен интервал. При необходимост от формиране на извадка от конкретни престъпления е възможно да се премахне всяка 5-та, 10-та или 15-та карта от всички статистически записи на регистрираните престъпления в зависимост от техния общ брой и наличните размери на извадката. Недостатъкът на този метод е, че преди селекцията е необходимо да има пълна сметка на единиците от съвкупността, след това е необходимо да се извърши класиране и едва след това е възможно да се направи извадка с определен интервал. Този метод отнема много време, така че не се използва често.


Типичният (регионален) подбор е вид извадка, при която генералната съвкупност се разделя на хомогенни групи по определен признак. Понякога изследователите използват други термини вместо "групи": "райони" и "зони". След това от всяка група произволно се избира определен брой единици, пропорционални на дела на групата в общата популация. Типичният подбор често се извършва на няколко етапа.

Серийната извадка е метод, при който подборът на единици се извършва в групи (серии) и всички единици от избраната група (серия) подлежат на изследване. Предимството на този метод е, че понякога е по-трудно да се изберат отделни единици, отколкото серии, например, когато се изучава лице, което излежава присъда. В рамките на избраните райони, зони се прилага изследване на всички звена без изключение, например изследване на всички лица, изтърпяващи присъди в определена институция.

Улица Киевян, 16 0016 Армения, Ереван +374 11 233 255

пробаили рамка за вземане на проби- набор от случаи (субекти, обекти, събития, проби), използвайки определена процедура, избрани от генералната съвкупност за участие в изследването.

Примерни характеристики:

§ Качествени характеристики на извадката – кого точно избираме и какви методи за изграждане на извадката използваме за това.

§ Количествени характеристики на извадката – колко случая избираме, с други думи, размера на извадката.

Необходимост от вземане на проби

§ Обектът на изследване е много обширен. Например, потребителите на продуктите на една глобална компания са огромен брой географски разпръснати пазари.

§ Има нужда от събиране на първична информация.

Размер на извадката

Размер на извадката- броя на случаите, включени в извадката. Поради статистически причини се препоръчва броят на случаите да бъде поне 30-35.

Зависими и независими проби

При сравняване на две (или повече) проби, тяхната зависимост е важен параметър. Ако е възможно да се установи хомоморфна двойка (тоест, когато един случай от проба X съответства на един и само един случай от проба Y и обратно) за всеки случай в две проби (и тази основа на връзка е важна за чертата измерени в пробите), такива проби се наричат зависим. Примери за зависими селекции:

§ двойки близнаци,

§ две измервания на всяка характеристика преди и след експериментална експозиция,

§ съпрузи и съпруги

Ако няма такава връзка между пробите, тогава тези проби се вземат предвид независима, например:

§ мъже и жени,

§ психолози и математици.

Съответно зависимите проби винаги имат еднакъв размер, докато размерът на независимите проби може да се различава.

Пробите се сравняват с помощта на различни статистически критерии:

§ t-тест на Стюдънт

§ Тест на Wilcoxon

§ U-тест на Ман-Уитни

§ Знаков критерий

Представителност

Извадката може да се счита за представителна или непредставителна.

Пример за непредставителна извадка

В Съединените щати един от най-известните исторически примери за непредставителна извадка се счита за инцидент, настъпил по време на президентски изборипрез 1936г. The Litrery Digest, който успешно предсказа събитията от няколко предишни избори, направи грешни изчисления, като изпрати десет милиона тестови бюлетини на своите абонати, както и на хора, избрани от телефонните указатели в цялата страна и хора от списъците с регистрация на автомобили. В 25% от върнатите бюлетини (близо 2,5 милиона) гласовете са разпределени както следва:

§ 57% подкрепят републиканския кандидат Алф Ландън

§ 40% избраха тогавашния президент демократ Франклин Рузвелт

Както е известно, Рузвелт печели реалните избори с повече от 60% от гласовете. Грешката на Litreary Digest беше следната: искайки да увеличат представителността на извадката - тъй като знаеха, че мнозинството от техните абонати се смятат за републиканци - те разшириха извадката с хора, избрани от телефонни указатели и регистрационни списъци. Те обаче не взеха предвид съвременните реалности и всъщност наеха още повече републиканци: по време на Голямата депресия предимно средната и висшата класа (т.е. повечето републиканци, а не демократи) можеха да си позволят да притежават телефони и коли.

Видове планове за изграждане на групи от образци

Има няколко основни типа план за изграждане на група:

1. Изследване с експериментални и контролни групи, които са поставени в различни условия.

§ Проучване с експериментални и контролни групи, като се използва стратегия за подбор на двойки

2. Изследване, използващо само една група - експериментална.

3. Изследване по смесен (факториален) план – всички групи са поставени в различни условия.

]Видове вземане на проби

Пробите са разделени на два вида:

§ вероятностни

§ невероятност

Вероятностни проби

1. Проста вероятностна извадка:

§ Просто повторно вземане на проби. Използването на такава извадка се основава на предположението, че всеки респондент е еднакво вероятно да бъде включен в извадката. Въз основа на списъка на генералната съвкупност се съставят карти с броя на респондентите. Те се поставят в тесте, разбъркват се и от тях се изважда карта на случаен принцип, записва се число, след което се връща обратно. Освен това процедурата се повтаря толкова пъти, колкото е необходимият размер на пробата. Минус: повторение на единиците за избор.

Процедурата за конструиране на проста произволна извадка включва следните стъпки:

1. трябва да се получи пълен списъкчленове на общото население и номерирайте този списък. Такъв списък, припомнете си, се нарича рамка за вземане на проби;

2. определяне на очаквания размер на извадката, т.е. очаквания брой респонденти;

3. извличаме толкова числа от таблицата със случайни числа, колкото са ни необходими примерни единици. Ако извадката трябва да включва 100 души, от таблицата се вземат 100 произволни числа. Тези произволни числа могат да бъдат генерирани от компютърна програма.

4. изберете от основния списък онези наблюдения, чиито номера отговарят на записаните произволни числа

§ Обикновеното произволно вземане на проби има очевидни предимства. Този метод е изключително лесен за разбиране. Резултатите от изследването могат да бъдат разширени до изследваната популация. Повечето подходи за статистически изводи включват събиране на информация с помощта на проста произволна извадка. Простият метод на произволна извадка обаче има поне четири съществени ограничения:

1. Често е трудно да се създаде рамка за вземане на проби, която би позволила проста произволна извадка.

2. Резултатът от използването на проста произволна извадка може да бъде голяма популация или популация, разпределена в голяма географска област, което значително увеличава времето и разходите за събиране на данни.

3. Резултатите от прилагането на проста случайна извадка често се характеризират с ниска точност и по-голяма стандартна грешка, отколкото резултатите от прилагането на други вероятностни методи.

4. В резултат на прилагането на СРС може да се образува непредставителна извадка. Въпреки че извадките, получени чрез обикновен случаен подбор, средно адекватно представят популацията, някои от тях изключително неправилно представят изследваната популация. Вероятността за това е особено висока при малък размер на извадката.

§ Обикновено неповтарящо се вземане на проби. Процедурата за конструиране на извадката е същата, само че картите с номерата на респондентите не се връщат обратно в тестето.

1. Систематична вероятностна извадка. Това е опростена версия на проста вероятностна извадка. Въз основа на списъка на генералната съвкупност се избират респонденти на определен интервал (K). Стойността на K се определя произволно. Най-надеждният резултат се постига с хомогенна генерална популация, в противен случай размерът на стъпката и някои вътрешни циклични модели на извадката може да съвпадат (смесване на извадката). Недостатъци: същото като при проста вероятностна извадка.

2. Серийно (вложено) вземане на проби. Извадковите единици са статистически серии (семейство, училище, екип и др.). Избраните елементи се подлагат на непрекъснато изследване. Изборът на статистически единици може да бъде организиран според вида на случайна или систематична извадка. Минуси: Възможност за по-голяма хомогенност, отколкото в общата популация.

3. Зонално вземане на проби. В случай на хетерогенна популация, преди да се използва вероятностна извадка с която и да е техника за подбор, се препоръчва популацията да се раздели на хомогенни части, такава извадка се нарича зонирана извадка. Групите за зониране могат да бъдат както природни образувания (например градски квартали), така и всяка характеристика, която е в основата на изследването. Признакът, въз основа на който се извършва разделянето, се нарича признак на стратификация и райониране.

4. "Удобен" избор. Процедурата за вземане на проби "удобство" се състои в установяване на контакти с "удобни" единици за вземане на проби - с група ученици, спортен отбор, с приятели и съседи. Ако е необходимо да се получи информация за реакциите на хората към нова концепция, такава извадка е напълно разумна. „Удобната“ извадка често се използва за предварително тестване на въпросници.

Невероятни мостри

Подборът в такава извадка се извършва не по принципите на случайността, а по субективни критерии - достъпност, типичност, равно представителство и др.

1. Квотна извадка - извадката се изгражда като модел, който възпроизвежда структурата на генералната съвкупност под формата на квоти (пропорции) на изследваните признаци. Броят на елементите на извадката с различна комбинация от изследваните характеристики се определя по такъв начин, че да съответства на техния дял (пропорция) в генералната съвкупност. Така например, ако имаме общо население от 5000 души, от които 2000 жени и 3000 мъже, тогава в квотната извадка ще имаме 20 жени и 30 мъже, или 200 жени и 300 мъже. Квотните извадки най-често се основават на демографски критерии: пол, възраст, регион, доход, образование и др. Минуси: обикновено такива проби не са представителни, т.к невъзможно е да се вземат предвид едновременно няколко социални параметъра. Плюсове: лесно достъпен материал.

2. Метод на снежната топка. Пробата е конструирана по следния начин. Всеки респондент, като се започне от първия, е помолен да се свърже със своите приятели, колеги, познати, които отговарят на условията за подбор и биха могли да участват в проучването. Така, с изключение на първата стъпка, извадката се формира с участието на самите обекти на изследване. Методът често се използва, когато е необходимо да се намерят и интервюират труднодостъпни групи от респонденти (например респонденти с високи доходи, респонденти, принадлежащи към същата професионална група, респонденти, които имат сходни хобита / страсти и др. )

3. Спонтанно вземане на проби - вземане на проби от т. нар. "първият попаднал". Често се използва в телевизионни и радио анкети. Размерът и съставът на случайните извадки не е известен предварително и се определя само от един параметър – активността на респондентите. Недостатъци: невъзможно е да се определи каква обща съвкупност представляват респондентите и в резултат на това е невъзможно да се определи представителността.

4. Маршрутно проучване - често се използва, ако единицата на изследване е семейството. На картата местносткъдето ще се извършва проучването всички улици са номерирани. С помощта на таблица (генератор) се избират произволни числа големи числа. Всяко голямо число се счита за състоящо се от 3 компонента: номер на улица (2-3 първи числа), номер на къща, номер на апартамент. Например числото 14832: 14 е номерът на улицата на картата, 8 е номерът на къщата, 32 е номерът на апартамента.

5. Зонирано вземане на проби с избор на типични обекти. Ако след райониране от всяка група се избере типичен обект, т.е. обект, който според повечето от характеристиките, изследвани в изследването, се доближава до средния, такава извадка се нарича зонирана с подбор на типични обекти.

6.Модален избор. 7. експертна проба. 8. Хетерогенна проба.

Стратегии за изграждане на група

Подбор на групи за тяхното участие психологически експериментсе извършва с помощта на различни стратегии, които са необходими, за да се осигури възможно най-високо съответствие с вътрешната и външната валидност.

§ Рандомизация (случаен избор)

§ Избор по двойки

§ Стратометрична селекция

§ Приблизително моделиране

§ Ангажиране на реални групи

Рандомизиране

Рандомизиране, или случаен избор, се използва за създаване на прости произволни проби. Използването на такава извадка се основава на предположението, че всеки член на популацията е еднакво вероятно да бъде включен в извадката. Например, за да направите произволна извадка от 100 студенти, можете да поставите парчета хартия с имената на всички студенти в шапка и след това да извадите 100 листа хартия от нея - това ще бъде случаен избор (Гудуин Дж. , стр. 147).

Избор по двойки

Избор по двойки- стратегия за конструиране на извадкови групи, при която групи от субекти са съставени от субекти, еквивалентни по странични параметри, значими за експеримента. Тази стратегия е ефективна за експерименти, използващи експериментални и контролни групи с най-добрия вариант - привличане на двойки близнаци (моно- и дизиготни), тъй като ви позволява да създадете ...

Стратометрична селекция

Стратометрична селекция- рандомизиране с разпределяне на страти (или клъстери). При този методизвадка, генералната съвкупност се разделя на групи (страти), които имат определени характеристики (пол, възраст, политически предпочитания, образование, ниво на доходи и т.н.), и се избират субекти със съответните характеристики.

Приблизително моделиране

Приблизително моделиране- изготвяне на ограничени извадки и обобщаване на заключенията за тази извадка за по-широка популация. Например, когато участвате в проучване на студенти от 2-ра година на университета, данните от това проучване се разширяват до „хора на възраст от 17 до 21 години“. Допустимостта на подобни обобщения е изключително ограничена.

Приблизителното моделиране е формирането на модел, който за ясно дефиниран клас системи (процеси) описва неговото поведение (или желани явления) с приемлива точност.

Един от основните компоненти на добре проектираното изследване е дефиницията на извадката и какво е представителна извадка. Това е като примера с тортата. В крайна сметка не е необходимо да изядете целия десерт, за да разберете вкуса му? Малка част е достатъчна.

И така, тортата е население (т.е. всички респонденти, които отговарят на условията за проучването). Може да се изрази териториално, например само жители на Московска област. Пол - само жени. Или има възрастови ограничения - руснаците са над 65 години.

Трудно е да се изчисли населението: трябва да имате данни от преброяване на населението или предварителни проучвания за оценка. Следователно обикновено генералната съвкупност се „оценява“ и от полученото число се изчислява рамка за вземане на пробиили вземане на проби.

Какво е представителна извадка?

пробае точно определен брой респонденти. Неговата структура трябва да съвпада възможно най-много със структурата на генералната съвкупност по отношение на основните характеристики на селекцията.

Например, ако потенциалните респонденти са цялото население на Русия, където 54% ​​са жени и 46% са мъже, тогава извадката трябва да съдържа точно същия процент. Ако параметрите съвпадат, тогава извадката може да се нарече представителна. Това означава, че неточностите и грешките в изследването са сведени до минимум.

Размерът на извадката се определя, като се вземат предвид изискванията за точност и икономичност. Тези изисквания са обратно пропорционални едно на друго: колкото по-голям е размерът на извадката, толкова по-точен е резултатът. Освен това, колкото по-висока е точността, толкова повече разходи са необходими за изследването. И обратното, колкото по-малка е извадката, толкова по-малко струва, толкова по-малко точно и по-случайно се възпроизвеждат свойствата на генералната съвкупност.

Ето защо, за да изчислят размера на избора, социолозите измислиха формула и създадоха специален калкулатор:

Вероятност за довериеи грешка на доверието

Какво означават условията " ниво на увереност" и " грешка на доверието"? Нивото на достоверност е мярка за точността на измерванията. Грешка на доверието е възможна грешка в резултатите от изследването. Например, с обща съвкупност от повече от 500,00 души (например, живеещи в Новокузнецк), извадката ще бъде 384 души с ниво на достоверност от 95% и грешка от 5% ИЛИ (с доверителен интервал от 95 ± 5%).

Какво следва от това? При провеждане на 100 проучвания с такава извадка (384 души), в 95 процента от случаите, получените отговори, според законите на статистиката, ще бъдат в рамките на ± 5% от оригинала. И ще получим представителна извадка с минимална вероятност за статистическа грешка.

След като изчислението на размера на извадката е направено, можете да видите дали има достатъчно респонденти в демо версията на панела с въпросници. Можете да научите повече за това как да проведете панелно проучване.