Избирателно наблюдение в статистиката

Проба

Пробаили пробна популация- много случаи (субекти, обекти, събития, мостри), използващи определена процедура, избрани от общата популация за участие в изследването.

Примерни характеристики:

  • Качествени характеристики на извадката - кого точно избираме и какви методи за конструиране на извадката използваме за това.
  • Количествената характеристика на извадката - колко случая избираме, с други думи, размерът на извадката.

Необходимостта от вземане на проби

  • Темата на изследването е много обширна. Например, потребителите на продуктите на глобална компания са огромен брой географски разпръснати пазари.
  • Необходимо е да се събере първична информация.

Размер на пробата

Размер на пробата- броя на случаите, включени в извадката. По статистически причини се препоръчва броят на случаите да бъде най-малко 30-35.

Зависими и независими извадки

При сравняване на две (или повече) проби тяхната зависимост е важен параметър. Ако е възможно да се установи хомоморфна двойка (т.е. когато един случай от извадка X съответства на един и само един случай от извадка Y и обратно) за всеки случай в две проби (и тази основа на връзката е важна за характеристика, измерена върху пробите), такива проби се наричат зависим... Примери за зависими селекции:

  • двойки близнаци,
  • две измервания на всеки знак преди и след експерименталната експозиция,
  • съпрузи и съпруги
  • и т.н.

Ако няма такава връзка между пробите, тогава тези проби се разглеждат независими, Например:

Съответно, зависимите проби винаги имат еднакъв размер, докато обемът на независимите проби може да се различава.

Пробите се сравняват, използвайки различни статистически критерии:

  • и т.н.

Представителност

Пробата може да се счита за представителна или непредставителна.

Пример за непредставителна извадка

  1. Изследвания с експериментални и контролни групи, които са поставени в различни условия.
    • Проучете с експериментални и контролни групи, като използвате стратегия за подбор по двойки
  2. Изследвания, използващи само една група - експериментални.
  3. Изследвания, използващи смесен (факториален) дизайн - всички групи са поставени в различни условия.

Примерни типове

Пробите са разделени на два вида:

  • вероятност
  • невероятно

Вероятни проби

  1. Проста вероятностна извадка:
    • Просто повторно вземане на проби. Използването на такава извадка се основава на предположението, че всеки респондент е еднакво вероятно да бъде включен в извадката. Въз основа на списък общото населениесе изготвят карти с номера на респондентите. Те се поставят в тесте, разбъркват се и картата се изважда от тях на случаен принцип, записва се номер, след което се връща обратно. След това процедурата се повтаря толкова пъти, колкото ни е необходим размерът на извадката. Минус: повторение на единици за подбор.

Процедурата за изграждане на проста случайна извадка включва следните стъпки:

1. трябва да получите пълен списъкчленове на населението и номерирайте списъка. Припомнете си, че такъв списък се нарича рамка за вземане на проби;

2. определя очаквания размер на извадката, тоест очаквания брой респонденти;

3. извлечете от таблицата на случайни числа толкова числа, колкото са ни необходими примерни единици. Ако в извадката трябва да има 100 души, 100 случайни числа се вземат от таблицата. Тези случайни числа могат да бъдат генерирани от компютърна програма.

4. изберете от базовия списък онези наблюдения, чиито номера съответстват на изписаните случайни числа

  • Простото случайно вземане на проби има очевидни предимства. Този метод е изключително лесен за разбиране. Резултатите от изследването могат да бъдат разширени до целевата популация. Повечето подходи за получаване на статистически изводи включват събиране на информация, използвайки проста случайна извадка. Простият метод на произволна извадка обаче има поне четири значителни ограничения:

1. Често е трудно да се създаде рамка за вземане на проби, която позволява просто произволно вземане на проби.

2. Една проста случайна извадка може да доведе до голяма популация или до популация, разпространена в голяма географска област, което значително увеличава времето и разходите за събиране на данни.

3. Резултатите от използването на обикновена случайна извадка често се характеризират с ниска точност и по -висока стандартна грешкаотколкото резултатите от прилагането на други вероятностни методи.

4. Прилагането на СРС може да доведе до непредставителна извадка. Въпреки че пробите, получени чрез обикновен случаен подбор, средно адекватно представляват цялата популация, някои от тях са изключително неточно представителни за изследваната популация. Това е особено вероятно при малък размер на извадката.

  • Просто, неповтарящо се вземане на проби. Процедурата за вземане на проби е същата, с изключение на това, че картите с номера на респондента не се поставят обратно в тестето.
  1. Систематично вземане на проби от вероятности. Това е опростена версия на проста вероятностна извадка. Въз основа на списъка на общата популация респондентите се избират на определен интервал (K). Стойността на K се определя случайно. Най -надеждният резултат се постига с хомогенна обща популация, в противен случай размерът на стъпката и някои вътрешни циклични модели на пробата могат да съвпаднат (смесване на пробата). Недостатъци: Същото като за проста вероятностна извадка.
  2. Серийно (вложено) вземане на проби. Измервателните единици са статистически серии (семейство, училище, екип и т.н.). Избраните елементи се подлагат на непрекъснато изследване. Изборът на статистически единици може да бъде организиран според типа на случайна или систематична извадка. Недостатъци: Възможност за по -голяма хомогенност, отколкото в общата популация.
  3. Регионално вземане на проби. В случай на хетерогенна популация, преди да се използва вероятностна извадка с която и да е техника за подбор, се препоръчва да се раздели популацията на хомогенни части, такава извадка се нарича зонирана. Зониращите групи могат да бъдат както естествени образувания (например градски квартали), така и всяка характеристика в основата на изследването. Характеристиката, въз основа на която се извършва разделянето, се нарича характеристика на стратификация и регионализация.
  4. "Удобен" избор. Процедурата за вземане на проби „удобство“ се състои в установяване на контакти с „удобни“ звена за вземане на проби - група ученици, спортен екип, приятели и съседи. Ако е необходимо да се получи информация за реакцията на хората към нова концепция, такава извадка е напълно разумна. Удобната извадка често се използва за предварително тестване на въпросници.

Невероятни проби

Подборът в такава извадка се извършва не според принципите на случайността, а според субективните критерии - наличност, типичност, равно представителство и т.н.

  1. Квотна извадка - извадката е изградена като модел, който възпроизвежда структурата на общата популация под формата на квоти (пропорции) на изследваните характеристики. Броят на пробните елементи с различна комбинация от изследваните характеристики се определя така, че да съответства на техния дял (дял) в общата популация. Така например, ако общото население е представено от 5000 души, от които 2000 са жени и 3000 са мъже, тогава в квотната извадка ще имаме 20 жени и 30 мъже, или 200 жени и 300 мъже. Квотните извадки най -често се основават на демографски критерии: пол, възраст, регион, доход, образование и други. Против: Обикновено такива проби са непредставителни. няколко социални параметъра не могат да бъдат взети предвид едновременно. Плюсове: леснодостъпен материал.
  2. Метод на снежна топка. Пробата се конструира по следния начин. Всеки респондент, започвайки от първия, е помолен за контакти на своите приятели, колеги, познати, които биха отговаряли на условията за подбор и биха могли да участват в проучването. Така, с изключение на първата стъпка, извадката се формира с участието на самите обекти на изследване. Методът често се използва, когато е необходимо да се намерят и интервюират труднодостъпни групи респонденти (например респонденти с високи доходи, респонденти, принадлежащи към една и съща професионална група, респонденти с подобни хобита / хобита и др.)
  3. Спонтанно вземане на проби - вземане на проби от т. Нар. "Първи дошъл". Често се използва при разпити по телевизията и радиото. Размерът и съставът на спонтанните проби не е известен предварително и се определя само от един параметър - активността на респондентите. Против: невъзможно е да се установи каква обща популация представляват респондентите и в резултат на това е невъзможно да се определи представителността.
  4. Маршрутно проучване - често се използва, когато учебната единица е семейството. На картата селище, в която ще се извършва проучването, всички улици са номерирани. Големите числа се избират с помощта на таблица (генератор) на случайни числа. Всеки голямо числосе счита за състоящ се от 3 компонента: номер на улица (първите 2-3 номера), номер на къща, номер на апартамент. Например числото 14832: 14 е номерът на улицата на картата, 8 е номерът на къщата, 32 е номерът на апартамента.
  5. Регионална извадка с подбор на типични обекти. Ако след регионализация от всяка група е избран типичен обект, т.е. обект, който според повечето от характеристиките, изследвани в изследването, се доближава до средните показатели, такава извадка се нарича зонирана с подбор на типични обекти.

6. Модални проби. 7. експертен подбор. 8. Хетерогенно вземане на проби.

Стратегии за изграждане на групи

Подборът на групи за тяхното участие в психологическия експеримент се извършва с помощта на различни стратегии, които са необходими, за да се гарантира максимално възможното спазване на вътрешната и външната валидност.

Рандомизация

Рандомизация, или случаен подбор, се използва за създаване на прости случайни извадки. Използването на такава извадка се основава на предположението, че всеки член на популацията може да бъде включен в извадката с еднаква вероятност. Например, за да направите случайна извадка от 100 студенти, можете да поставите парчета хартия с имената на всички студенти в шапка и след това да извадите 100 парчета хартия от нея - това ще бъде случаен подбор (Goodwin J , стр. 147).

Избор по двойки

Избор по двойки- стратегия за изграждане на групи от извадката, в която групите от субекти са съставени от субекти, еквивалентни по странични параметри, които са значими за експеримента. Тази стратегия е ефективна за експерименти, използващи експериментални и контролни групи с най -добрият вариант- привличане на двойки близнаци (моно- и дизиготни), тъй като ви позволява да създавате ...

Стратометрично вземане на проби

Стратометрично вземане на проби- рандомизация с разпределението на страти (или клъстери). С този метод на извадка общата популация се разделя на групи (прослойки) с определени характеристики (пол, възраст, политически предпочитания, образование, ниво на доходи и т.н.) и се избират субекти със съответните характеристики.

Приблизително моделиране

Приблизително моделиране- съставяне на ограничени извадки и обобщаване на заключенията за тази извадка до по -широка популация. Например, когато студенти от втората им година в университет участват в проучване, данните от това проучване са разширени до „хора на възраст от 17 до 21 години“. Допустимостта на такива обобщения е изключително ограничена.

Приблизителното моделиране е формирането на модел, който за ясно определен клас системи (процеси) описва поведението му (или необходимите явления) с приемлива точност.

Бележки (редактиране)

Литература

А. Д. НаследовМатематически методи за психологическо изследване. - СПб.: Реч, 2004.

  • Илясов Ф. Н. Представителност на резултатите от проучванията в маркетинговите изследвания // Социологически изследвания. 2011. No 3. С. 112-116.

Вижте също

  • В някои видове изследвания извадката е разделена на групи:
    • експериментален
    • контрол
  • Кохорта

Връзки

  • Концепция за вземане на проби. Основните характеристики на пробата. Примерни типове

Фондация Уикимедия. 2010 г.

Синоними:
  • Щепкин, Михаил Семьонович
  • Общо население

Вижте какво представлява „Избор“ в други речници:

    проба- група субекти, представляващи конкретна популация и избрани за експеримент или проучване. Обратното понятие е общ агрегат. Пробата е част от общата популация. Речник на практическия психолог. М.: AST, ... ... Страхотна психологическа енциклопедия

    проба- извадка Частта от общата популация от елементи, която е обхваната от наблюдението (често се нарича пробна популация, а извадката е самият метод за вземане на проби). В математическата статистика, приета ... ... Ръководство за технически преводач

    Проба- (проба) 1. Малко количество продукт, избрано да представлява цялото му количество. Вижте: продажба по образец. 2. Малко количество стоки, прехвърлени на потенциални купувачи, за да могат да ги изразходват ... ... Бизнес речник

    Проба- частта от общата популация от елементи, която е обхваната от наблюдението (често се нарича пробна популация, а извадката е самият метод за вземане на проби). В математическата статистика се възприема принципът на случаен подбор; Това… … Икономически и математически речник

    ПРИМЕР- (извадка) Произволен подбор на подмножество от елементи от основна популация, чиито характеристики се използват за оценка на цялата популация като цяло. Избирателен методизползва се, когато е твърде дълго или твърде скъпо за изследване на цялото население ... Икономически речник

    проба- См … Речник на синоними

Изследванията обикновено започват с някакво предположение, което изисква проверка с помощта на факти. Това предположение - хипотеза - е формулирано във връзка с връзката на явления или свойства в определен набор от обекти.

За да се проверят такива предположения върху факти, е необходимо да се измерват съответните свойства на техните носители. Но е невъзможно да се измери безпокойството при всички жени и мъже, както е невъзможно да се измери агресивността при всички подрастващи. Следователно, когато провеждат изследвания, те се ограничават само до относително малка група от представители на съответните популации хора.

Общо население- това е целият набор от обекти, по отношение на който е формулирана изследователска хипотеза.

Например всички мъже; или всички жени; или всички жители на град. Общото население, по отношение на което изследователят ще направи изводи въз основа на резултатите от изследването, може да бъде по-скромно по брой, например всички първокласници на дадено училище.

По този начин общата популация е, макар и не безкрайна на брой, но като правило множество потенциални субекти са недостъпни за непрекъснати изследвания.

Проба или проба- това е група обекти с ограничен брой (в психологията - субекти, респонденти), специално подбрани от общата популация за изучаване на нейните свойства. Съответно се нарича изследването върху извадка от свойствата на общата популация селективно изследване. Почти всички психологически изследвания са селективни и техните констатации се отнасят за общото население.

По този начин, след като се формулира хипотезата и се определят съответните общи популации, изследователят се сблъсква с проблема за организиране на извадката. Извадката трябва да бъде такава, че обосноваването на заключенията от извадковото изследване да е обосновано - обобщение, разпределението им към общата популация. Основните критерии за валидност на заключенията от изследванетотова е представителността на извадката и статистическата надеждност на (емпиричните) резултати.

Представителност на извадката- с други думи, нейната представителност е способността на извадката да представи напълно изследваните явления - от гледна точка на тяхната променливост в общата популация.

Разбира се, само общата популация може да даде пълна картина на изследваното явление, във всичките му обхвати и нюанси на променливост. Следователно представителността винаги е ограничена до степента, в която извадката е ограничена. И именно представителността на извадката е основният критерий при определяне на границите на обобщаване на резултатите от изследванията. Въпреки това има техники, които ви позволяват да получите достатъчна представителност на извадката за изследователя (Тези техники се изучават в курса „Експериментална психология“).


Първата и основна техника е проста случайна извадка. Тя включва гарантиране, че всеки представител на общата популация има равен шанс да бъде включен в извадката. Случайният подбор гарантира, че най -разнообразните представители на общата популация могат да бъдат включени в извадката. В този случай се вземат специални мерки, за да се изключи появата на някаква закономерност при подбора. И това ни позволява да се надяваме, че в крайна сметка в извадката изследваното свойство ще бъде представено, ако не във всичко, то в максимално възможното му разнообразие.

Вторият начин за осигуряване на представителност е стратифициран случаен подбор или подбор според свойствата на общата популация. Той предполага предварителна дефиниция на онези качества, които могат да повлияят на променливостта на изследваната собственост (това може да бъде пол, ниво на доход или образование и т.н.). След това се определя процентът от броя на групите (страти), различаващи се по тези качества в общата популация и се предоставя идентичен процент от съответните групи в извадката. Освен това във всяка подгрупа от извадката субектите се подбират съгласно принципа на простия случаен подбор.

Статистическа надеждност,или статистическа значимост, резултатите от изследванията се определят с помощта на методите на статистически изводи.

Застраховани ли сме от грешки при вземане на решения, с определени изводи от резултатите от изследването? Разбира се, че не. В крайна сметка нашите решения се основават на резултатите от изследването на извадката от населението, както и на нивото на нашите психологически познания. Не сме напълно имунизирани от грешки. В статистиката такива грешки се считат за допустими, ако възникнат не по -често, отколкото в един случай от 1000 (вероятността за грешка α = 0,001 или свързаната стойност на вероятността за достоверност на правилното заключение р = 0,999); в един случай от 100 (вероятността за грешка α = 0,01 или свързаната стойност на доверителната вероятност за правилното заключение p = 0,99) или в пет случая от 100 (вероятността за грешка α = 0,05 или свързаният изход p = 0,95). Именно на последните две нива се вземат решения в психологията.

Понякога, когато се говори за статистическа надеждност, се използва понятието „ниво на значимост“ (означено като α). Числови стойности p и α се допълват взаимно до 1000 - пълен набор от събития: или направихме правилното заключение, или сбъркахме. Тези нива не се изчисляват, те се задават. Нивото на значимост може да се разбира като един вид „червена“ линия ”, пресичането на която ще направи възможно да се говори за това събитие като неслучайно. Във всеки компетентен научен доклад или публикация изводите трябва да бъдат придружени от посочване на стойностите p или α, при които са направени заключенията.

Методите на статистически изводи са обсъдени подробно в курса "Математическа статистика". Засега само отбелязваме, че те налагат определени изисквания към броя, или размер на извадката.

За съжаление, няма строги насоки за предварително определяне на необходимия размер на извадката. Освен това изследователят обикновено получава отговора на въпроса за необходимия и достатъчен брой от тях твърде късно - едва след като анализира данните от вече изследваната извадка. Независимо от това, най -общите препоръки могат да бъдат формулирани:

1. Най -големият размер на извадката се изисква при разработването на диагностична техника - от 200 до 1000-2500 души.

2. Ако е необходимо да се сравнят 2 проби, общият им брой трябва да бъде най -малко 50 души; броят на сравнените проби трябва да бъде приблизително еднакъв.

3. Ако се изследва връзката между някакви имоти, тогава размерът на извадката трябва да бъде най-малко 30-35 души.

4. Колкото повече променливостизследваното свойство, колкото по -голям трябва да бъде размерът на извадката. Следователно променливостта може да бъде намалена чрез увеличаване на хомогенността на извадката, например по пол, възраст и т. Н. Това, естествено, намалява възможностите за обобщение на заключенията.

Зависими и независими извадки.Типична изследователска ситуация е, когато свойство, интересуващо изследователя, се изследва върху две или повече проби с цел по -нататъшното им сравнение. Тези проби могат да бъдат в различни пропорции - в зависимост от процедурата за тяхната организация. Независими проби характеризиращ се с факта, че вероятността за избор на всеки субект от една извадка не зависи от избора на някой от субектите от друга извадка. Срещу, зависими пробихарактеризиращ се с това, че на всеки субект от една извадка се присвоява субект от друга извадка според определен критерий.

В общия случай зависимите проби включват поотделно подбор на субекти в сравнени проби, а независими проби - независим подбор на субекти.

Трябва да се отбележи, че случаите на „частично зависими“ (или „частично независими“) проби са неприемливи: това нарушава тяхната представителност по непредсказуем начин.

В заключение отбелязваме, че могат да се разграничат две парадигми на психологическите изследвания.

Т.нар R-методологиявключва изследване на променливостта на някое свойство (психологическо) под влияние на някакво влияние, фактор или друго свойство. Пробата е набор от субекти.

Друг подход, Q-методология,включва изследване на променливостта на субекта (индивида) под въздействието на различни стимули (условия, ситуации и т.н.). Съответства на ситуацията, когато извадката е набор от стимули.

Процедурата за план за вземане на проби включвапоследователно решение на следните три задачи:

Определяне на обекта на изследване;

Определяне на структурата на пробата;

Определяне на размера на пробата.

Обикновено, обект на маркетингово проучванее съвкупност от обекти на наблюдение, които могат да бъдат потребители, служители на компанията, посредници и др. Ако тази популация е толкова малка, че изследователската група има необходимите трудови, финансови и времеви възможности за установяване на контакт с всеки от нейните елементи, тогава е напълно възможно да се проведе непрекъснато проучване на цялото население. В този случай, след като сте идентифицирали обекта на изследване, можете да преминете към следната процедура (изборът на метода за събиране на данни, изследователския инструмент и метода на комуникация с публиката).

На практика обаче много често не е възможно или препоръчително да се провежда непрекъснато проучване на цялото население. За това може да има следните причини:

Невъзможност за установяване на контакт с някои елементи на съвкупността;

Неоправдано високи разходи за провеждане на непрекъснато проучване или наличие на финансови ограничения, които не позволяват провеждането на непрекъснато проучване;

Краткото време, отделено за изследването, поради загубата с течение на времето на значимостта на информацията или други причини, и не позволява събирането, систематизирането и анализа на обширни данни за цялото население.

Следователно, големи и разпръснати популации често се изследват с помощта на извадка, за която е известно, че означава част от популацията, предназначена да представя населението като цяло.

Точността, с която една извадка отразява популацията като цяло, зависи от структура и размер на извадката.

Има два подхода за проектиране на извадката- вероятностни и детерминистични.

Вероятностен подход към дизайна на извадкатаприема, че всеки елемент от популацията може да бъде избран с определена (не нулева) вероятност. Съществуват различни видовепроби, базирани на теорията на вероятностите (типични, вложени и т.н.). Най -простият и най -разпространен в практиката е простата случайна извадка, при която всеки елемент от популацията има еднаква вероятност да бъде избран за изследване.

Вероятността за вземане на проби е по -точна, тя позволява на изследователя да оцени степента на надеждност на данните, които е събрал, въпреки че е по -сложна и по -скъпа от детерминистичната извадка.

Детерминистки подход към структурата на пробатаприема, че подборът на елементите от популацията се извършва по методи, основани или на съображения за удобство, или на решение на изследователя, или на условни групи.

от съображения за удобство, се състои в избора на всякакви елементи от множеството въз основа на лекотата на установяване на контакт с тях. Несъвършенството на този метод вероятно се дължи на ниската представителност на получената проба, тъй като елементите на съвкупността, удобни за изследователя, могат да бъдат недостатъчно характерни представители на съвкупността поради техния не случаен и необоснован подбор.

От друга страна, простотата, рентабилността и ефективността на изследванията, проведени по този метод, го спечелиха доста широко разпространено в практиката и най-вече по време на предварителни изследвания, насочени към изясняване на основните проблеми.

Въз основа на метода за вземане на проби по решение на изследователя, се състои в избора на елементите от множеството, които според него са неговите характерни представители. Този метод е по -съвършен от предишния, тъй като се основава на ориентация към характерните представители на изследваната популация, въпреки че те са подбрани въз основа на субективните представи на изследователите за него.

Метод за вземане на проби въз основа на условни ставки, се състои в подбора на характерни елементи на множеството в съответствие с получените по -рано характеристики на множеството като цяло. Тези характеристики могат да бъдат получени чрез предварителни изследвания и за разлика от предишния метод не са субективни. Следователно този метод е по -усъвършенстван, той ви позволява да получите рамки за извадки, които са не по -малко представителни от вероятните проби при много по -ниска цена за провеждане на проучване.

След като е избрал структурата на извадката (подхода за нейното формиране, типа на вероятността или мисленето за формирането на детерминирана извадка), изследователят трябва да определи обема, т.е. броя на елементите в извадката.

Размер на пробата определя надеждността на информациятаполучени в резултат на неговото изследване, както и разходите, необходими за провеждането на изследването. Размерът на пробата зависина нивото на хомогенност или разнообразие от обекти, които се изследват.

Колкото по -голям е размерът на извадката, толкова по -висока е нейната точност и по -големи разходи за провеждане на нейното проучване. С вероятностен подход към структурата на извадката, нейният размер може да бъде определен с помощта на добре известни статистически формули, въз основа на посочените изисквания за нейната точност.

На практика се използват няколко подхода за определяне на размера на извадката:

1. Произволен подход въз основа на прилагането на „правилото на палеца“. Например, без доказателства се приема, че извадката трябва да бъде 5% от популацията, за да се получат точни резултати. Този подход е прост и лесен за изпълнение, но не е възможно да се установи точността на получените резултати. С достатъчно голямо население може да бъде и доста скъпо.

Размерът на извадката може да бъде зададен въз основа на някои предварително договорени условия. Например, клиент на маркетингово проучване знае, че при изследване на общественото мнение извадката обикновено е 1000-1200 души, затова препоръчва изследователят да се придържа към тази цифра. Ако годишни проучвания се извършват на определен пазар, тогава всяка година се използва извадка със същия размер. За разлика от първия подход, тук при определяне на размера на извадката се използва добре известна логика, която обаче е много уязвима.

Например, някои изследвания може да изискват по -малка точност от изследването на общественото мнение, а размерът на населението може да бъде многократно по -малък от този на изследване на общественото мнение. По този начин този подход не взема предвид текущите обстоятелства и може да бъде доста скъп.

В някои случаи цената на проучването се използва като основен аргумент при определяне на размера на извадката. По този начин бюджетът за маркетингови изследвания предвижда разходите за определени проучвания, които не трябва да се надвишават. Очевидно стойността на получената информация не се взема предвид. В някои случаи обаче дори малка проба може да даде доста точни резултати.

Изглежда разумно да се разглеждат разходите не в абсолютно изражение, а във връзка с полезността на информацията, получена от проучванията. Клиентът и изследователят трябва да обмислят различни размери на извадката и методи за събиране на данни, разходи, да вземат предвид други фактори

2. Размерът на извадката от нивото на доверителния интервал на допустимата грешка, което, както вече беше споменато, се задава от подходящата точност на крайните обобщения: от увеличена до приблизителна. Това обаче се отнася до т. Нар. Случайни грешки, свързани с естеството на всякакви статистически грешки. Те се изчисляват като грешки на представителността на вероятностните извадки.

V. I. Paniotto дава следните изчисления на представителна извадка с грешка от 5% (таблица 4.2).

Таблица 4.2

Примерна таблица за изчисление

За популация над 100 000 извадката е 400 единици. Ако имаме предвид общите популации от 5 хиляди и повече, тогава, според изчисленията на същия автор, е възможно да се посочи големината на действителната грешка при извадката в зависимост от нейния размер, което е много важно за нас, като се има предвид имайте предвид, че големината на допустимата грешка зависи от целта на изследването и не трябва да е близо до нивото от 5 процента.

Таблица 4.3

Изчислителна таблица

Размер на извадката, ако общата популация е 5000

Действителна грешка за даден размер на извадката,%

Заедно със случайни грешки са възможни систематични грешки. Те зависят от организацията на извадковото проучване. Това са различни отклонения на извадката към един от полюсите на извадрения параметър.

3. Размер на извадката въз основа на статистически анализ ... Този подход се основава на определяне на минималния размер на извадката въз основа на определени изисквания за надеждността и надеждността на получените резултати. Използва се и за анализ на получените резултати за отделни подгрупи, формирани в извадката, по пол, възраст, образователно ниво и др. Изискванията за надеждност и точност на резултатите за отделни подгрупи диктуват определени изисквания за размера на извадката като цяло.

Най -теоретично обоснованият и правилен подход за определяне на размера на извадката се основава на изчисляването на надеждни интервали. Концепцията за вариация характеризира степента на различие (сходство) в отговорите на респондентите на определен въпрос. По -строго, промяната в стойностите на даден елемент в набор е разликата в неговите стойности за различни единици на даден набор в един и същ период или момент във времето. Резултатите от отговорите на въпросите от анкетата обикновено се представят под формата на крива на разпределение (фиг. 4.1). При голямо сходство на отговорите се говори за малка вариация (тясна крива на разпределение) и при ниско сходство на отговорите, висока вариация (широка крива на разпределение).

Като мярка за вариация обикновено се взема стандартното отклонение, което характеризира средното разстояние от средната оценка на отговорите на всеки респондент на определен въпрос.

Малка вариация

Голяма вариация

Ориз. 4.1. Криви на вариация и разпределение

Тъй като всички маркетингови решения се вземат в условия на несигурност, препоръчително е да се вземе предвид това обстоятелство при определяне на размера на извадката. Тъй като определянето на изследваните стойности за популацията в тясна се извършва въз основа на статистика на извадката, е необходимо да се установи диапазонът (доверителен интервал), в който се очаква оценките за населението като цяло да падане и грешката в тяхното определяне.

Доверителният интервал е диапазон, крайните точки на който съответстват на определен процент от определени отговори на въпрос. Доверителният интервал е тясно свързан със стандартното отклонение на изследваната черта в общата популация: колкото по -голям е той, толкова по -широк трябва да бъде доверителният интервал, за да се включи определен процент от отговорите.

Доверителен интервал от 95% или 99% е стандартен в маркетинговите изследвания. Нито една фирма не провежда маркетингови изследвания, използвайки множество проби. А математическата статистика дава възможност да се получи известна информация за разпределението на извадката, притежаваща само данни за вариациите на една -единствена извадка.

Индикатор за степента, в която оценката, която е вярна за населението като цяло, се различава от оценката, която се очаква за типична извадка, е средната квадратна грешка. Освен това, колкото по -голям е размерът на извадката, толкова по -малка е грешката. Високата стойност на вариацията води до висока стойност на грешката и обратно.

Когато има само два възможни отговора на въпрос, изразени като процент (използва се процент), размерът на извадката се определя по следната формула:

където n е размерът на извадката; z - нормализирано отклонение, определено въз основа на избраното ниво на доверие; p е намерената вариация за пробата; g - (100 -p); e е допустима грешка.

При определяне на показателя за вариация за определена популация е препоръчително преди всичко да се извърши предварителен качествен анализ на изследваната популация, на първо място, за да се установи сходството на единиците от населението в демографско, социално и друго отношение интерес за изследователя. Възможно е да се проведе пилотно проучване, да се използват резултатите от подобни проучвания, проведени в миналото. При използване на процентната мярка на променливостта се взема предвид, че максималната променливост се постига за p = 50%, което е най -лошият случай. Освен това този показател не влияе радикално върху размера на извадката. Взема се предвид и мнението на клиента на изследването относно размера на извадката.

Възможно е да се определи размера на извадката въз основа на използването на средни стойности, а не на проценти.

където s е стандартното отклонение.

На практика, ако извадката се формира отново и не са проведени подобни проучвания, s не е известно. В този случай е препоръчително да зададете грешката e на части от стандартното отклонение. Формулата за изчисление се трансформира и приема следната форма:

където .

По -горе говорихме за много големи агрегати. В някои случаи обаче популациите не са големи. Обикновено, ако извадката е по -малка от пет процента от популацията, тогава популацията се счита за голяма и изчисленията се правят съгласно горните правила. Ако размерът на извадката надвишава 5% от съвкупността, последната се счита за малка и в горните формули се въвежда корекционен коефициент.

В този случай размерът на извадката се определя, както следва:

,

където n е размерът на извадката за малка популация; n 0 - размер на извадката, изчислен съгласно горните формули; N е обемът на общото население.

Очевидно използването на по -малки размери на извадката ще спести време и пари.

Формулите за изчисляване на размера на извадката се основават на предположението, че са спазени всички правила за вземане на проби и единствената грешка при извадката е грешката поради нейния размер. Трябва обаче да се помни, че размерът на извадката определя точността на получените резултати, но не и тяхната представителност.

Последното се определя чрез метода за вземане на проби. Всички формули за изчисляване на размера на извадката приемат, че представителността е гарантирана, като се използват правилни процедури за вероятностна извадка.

Обемът на извадката се определя от аналитичните задачи на изследването, а нейната представителност се определя от целевата настройка на програмата. Програмата определя образа на необходимата обща популация за вземане на проби. Независимо дали това ще бъде цялото население или неговите специални структурни образувания, всички елементи на обекта, който се изследва, или само разпределени според критериите, определени от програмата, общата популация се състои от всички единици на обекта, определени в програмата .

При детерминиран подход към структурата на извадката в общия случай не е възможно чрез изчисление да се определи точно нейният обем в съответствие с даден критерий за надеждност на получената информация. В този случай размерът на извадката може да бъде определен емпирично. Опитът в провеждането на маркетингови изследвания в чужбина може да служи като отправна точка тук. Така че при анкетирането на купувачите се осигурява висока точност на извадката, дори ако нейният обем не надвишава 1% от общата популация при провеждане на анкети на купувачи на средни и големи фирми за търговия на дребно, броят на респондентите (размер на извадката), като правило , варира от 500 до 1000 души.

Значението на процедурата за избор на метод за събиране на първична информация и инструменти за изследване е, че резултатите от този избор определят както надеждността и точността на информацията, която ще се събира, така и продължителността и високата цена на нейното събиране.

Емпиричните се считат за едно от основните средства за изучаване на социалните отношения и процеси. Те предоставят надеждна, пълна и представителна информация.

Специфика на техниката

Емпиричните осигуряват придобиване на факти за установяване на факти. Те допринасят за установяването и обобщаването на обстоятелства поради непрякото или прякото регистриране на събития, присъщи на изследваните отношения, обекти, явления. Емпиричните методи се различават от теоретичните по това, че предмет на анализ е:

  1. Поведението на индивидите и техните групи.
  2. Продукти от човешката дейност.
  3. Вербални действия на индивиди, техните преценки, възгледи, мнения.

Примерни проучвания

Емпиричното изследване винаги е насочено към получаване на обективна и точна информация, количествени данни. В тази връзка по време на нейното прилагане е необходимо да се гарантира представителността на информацията. Съответно правилното пробна популация. Това еозначава, че подборът трябва да се извърши по такъв начин, че получените данни от тясна група да отразяват тенденциите, които се случват в общата маса на респондентите. Например, при интервюиране на 200-300 души, получените данни могат да бъдат екстраполирани към всички градско население... Показателите от извадката позволяват различен подход към изследването на социално-икономическите процеси в региона, в страната като цяло.

Терминология

За по -добро разбиране на въпросите, свързани с извадковото изследване, е необходимо да се изяснят някои определения. Единицата за наблюдение е прекият източник на информация. Това може да бъде отделен човек, група, документ, организация и т.н. Общото население екомплекс от единици за наблюдение. Всички те трябва да имат отношение към изучавания проблем. Той подлежи на директен анализ. Изследването се извършва в съответствие с разработените методи за събиране на информация. За да определите този дял от целия набор от респонденти, използвайте концепцията за "извадка от населението". Неговото свойство да отразява ключовите параметри на общата маса хора се нарича представителност. В някои случаи няма съвпадения. Тогава се говори за грешката на представителността.

Осигуряване на представителност

Въпросите, свързани с него, се обсъждат подробно в рамките на статистиката. Проблемите са сложни, тъй като, от една страна, говорим за осигуряване на количествено представяне, което дава общо население. Това еозначава по -специално, че групите респонденти трябва да бъдат представени в оптимален брой. Количеството трябва да е достатъчно за нормално представяне. От друга страна, имаме предвид и висококачествено представяне. Той приема определен субективен състав, който се формира пробна популация. Това еозначава, че например представителността не може да се обсъжда, ако се изследват само мъже или само жени, възрастни хора или млади хора. Проучването трябва да се проведе във всички представени групи.

Характеристики на пробата

Този термин се разглежда в два аспекта. На първо място, той се определя като комплекс от елементи от общия масив от хора, чието мнение се изучава - това е пробна популация. Това есъщо така процесът на създаване на определена категория респонденти с необходимата предоставяне на представителност. На практика има няколко вида и видове подбор. Нека ги разгледаме.

Видове

Има три от тях:

  1. Спонтанен пробна популация. Това енабиране на респонденти, избрани на доброволни начала. Заедно с това се гарантира наличието на влизане на единици от общата маса хора в конкретна учебна група. На практика спонтанният подбор се използва доста често. Например при гласуване в пресата, по пощата. Тази техника обаче има значителен недостатък. Невъзможно е качествено да се представи целият обем на общата извадка. Тази техника се прилага, като се отчита икономиката. В някои проучвания тази опция е единствената.
  2. Спонтанен пробна популация. Това еедна от основните техники, използвани в изследването. Ключовият принцип на такъв подбор е предоставянето на възможност на всяка единица за наблюдение да се превърне от общата маса от индивиди в тясна група. За това се използват различни техники. Например, това може да бъде лотария, механичен подбор, таблица със случайни числа.
  3. Стратифицирано (квотно) вземане на проби. Тя се основава на формирането на качествен модел на общата маса на респондентите. След това се извършва подбор на единици в пробата. Например, тя се извършва според възрастта или пола, според слоевете на населението и т.н.

Изгледи

Съществуват следните проби:

Допълнително

Пробите също могат да бъдат зависими и независими. В първия случай процедурата на експеримента и резултатите, които ще бъдат получени в хода на една група респонденти, имат определено влияние върху другата. Съответно независимите проби не предполагат такова въздействие. Тук обаче трябва да се отбележи един важен момент. Една група субекти, по отношение на която психологическият преглед е извършен два пъти (дори и да е насочен към изучаване на различни качества, характеристики, признаци), ще се счита за зависима по подразбиране.

Вероятни селекции

Нека разгледаме някои видове проби:

  1. Случайно. Той предполага хомогенност на общата популация, една вероятност за наличност на всички компоненти, както и наличието на пълен списък с елементи. По правило процесът на подбор използва таблица със случайни числа.
  2. Механични. Този тип произволна извадка предполага подреждане според определена характеристика. Например по телефонен номер, по азбучен ред, по дата на раждане и т.н. Първият компонент е избран на случаен принцип. След това всеки k елемент се избира със стъпка n. Общото население ще бъде N = k * n.
  3. Стратифициран. Тази извадка се използва, когато общата популация е хетерогенна. Последният е разделен на слоеве (групи). Във всеки от тях подборът се извършва механично или произволно.
  4. Сериен. Изборът на групи се извършва на случаен принцип. В тях обектите се изучават в твърда форма.

Невероятни селекции

Те предполагат извадката не според принципа на случайността, а според субективните критерии: типичност, наличност, равно представителство и т.н. Тази категория включва селекции:

Нюанс

За да се осигури представителност, е необходим точен и пълен списък на населените единици. Обектите на наблюдение, като правило, са един човек. Изборът от списъка се извършва най -добре чрез номериране на единици и използване на таблица със случайни числа. Но квазислучайният метод също се използва доста често. Той предполага избор от списъка на всеки n елемент.

Въздействащи фактори

Обемът на населението е броят на неговите единици. Според експерти не е задължително да е голям. Несъмнено от повече номерот респондентите, толкова по -точен е резултатът. Въпреки това, в същото време, голям обем не винаги гарантира успех. Например, това се случва, когато общият брой на респондентите е хетерогенен. Такава популация ще се счита за хомогенна, където контролираният параметър, например нивото на грамотност, се разпределя равномерно, т.е. няма празнини или конденз. В този случай ще бъде достатъчно да интервюирате няколко души. Въз основа на резултатите от проучването ще бъде възможно да се заключи, че по -голямата част от хората имат нормално ниво на грамотност. От това следва, че представителността на информацията се влияе не от количествени характеристики, а от качествените характеристики на популацията - в частност от нивото на нейната хомогенност.

Грешки

Те представляват отклонението на средните параметри на извадката от стойностите на общата маса на респондентите. На практика грешките се идентифицират чрез съвпадение. При изследване на възрастни обикновено се използват данни от преброяването, статистически записи, както и резултатите от минали проучвания. Контролните параметри обикновено са сравнението на средните стойности на популациите (общо и извадково), определянето на грешката в съответствие с това и намаляването на това отклонение се нарича контрол на представителността.

изводи

Извадката е начин за събиране на данни за нагласите и поведението на хората чрез проучване на специално подбрани групи от респонденти. Тази техника се счита за надеждна и икономична, въпреки че изисква известна техника. Пробата се взема като основа. Тя действа като определена част от общата маса на хората. Изборът се извършва с помощта на специални техники и е насочен към получаване на информация за цялото население. Последният от своя страна е представен от всички възможни публични обекти или тази група от тях, които ще бъдат изследвани. Често населението е толкова голямо, че ще бъде доста скъпо и тромаво да се проведе проучване на всеки от неговите представители. Следователно се използва намален модел. Извадката включва всички онези, които получават въпросниците, които се наричат ​​респонденти, които всъщност действат като обект на изследване. Просто казано, той се състои от множеството интервюирани хора.

Заключение

Целите на проучването са определени за конкретни категории в общата популация. Що се отнася до специфичния дял от общата маса на хората, той се състои от субектите, включени в групите, използващи математически изчисления. За избора на единици е необходимо описание на обекта на първоначалната популация. След определяне на броя на субектите се определя методът или методът за формиране на група. Резултатите от проучването ще позволят да се опише изследваната черта по отношение на всички представители на общата маса хора. Както показва практиката, се провеждат предимно селективни, а не непрекъснати проучвания.

Тема: Избирателен метод в статистиката

1. Понятието за селективно наблюдение, неговите задачи

Статистическото наблюдение може да бъде организирано непрекъснато и прекъснато. Непрекъснато наблюдениепредвижда проучване на всички единици от изследваното население и е свързано с високи разходи за труд и материали. Може да се извърши изследването не на всички единици на съвкупността, а само на определена част, по която трябва да се прецени свойствата на целия агрегат като цяло прекъснатонаблюдение. В статистическата практика най -често срещаният е селективно наблюдение.

Избирателно наблюдение - това е вид непрекъснато наблюдение, при което подборът на единиците за изследване се извършва в случаен ред, избраната част се изучава и резултатите се разширяват до цялата първоначална популация. Наблюдението е организирано по такъв начин, че тази част от избраните единици в намален мащаб представлява(представлява) цялото население.

Извиква се множеството, от което е направен подборът общ, общ.

Наборът от избрани единици се извиква извадка от населението,и всичките му обобщаващи показатели - избирателен.

Има редица причини, поради които в много случаи селективното наблюдение се предпочита пред непрекъснатото наблюдение. Най -значимите от тях са следните:

Спестяване на време и пари в резултат на намалено натоварване;

Минимизиране на повредата или унищожаването на обектите, които се изследват (определяне на здравината на преждата при скъсване, изпитване на крушки за продължителността на горене, проверка на консервите за добро качество);

Необходимостта от подробно проучване на всяка единица за наблюдение, когато е невъзможно да се обхванат всички единици (при изучаване на семейния бюджет);

Постигане на висока точност на резултатите от проверката поради намаляване на грешките, възникнали по време на регистрацията.

Предимството на селективното наблюдение пред непрекъснатото наблюдение може да се реализира, ако то е организирано и проведено в строго съответствие с научни принципи теория на извадката.Тези принципи са: осигуряване инциденти(равни шансове за попадане в извадката) избор на единици и достатъчен брой от тях.Спазването на тези принципи ви позволява да получите обективна гаранция за представителността на получената извадка. Концепция представителностИзбраната популация не трябва да се разбира като нейно представяне за всички характеристики на изследваната популация, а само по отношение на тези характеристики, които се изучават или имат значително влияние върху формирането на обобщаващи обобщаващи характеристики.

Основната задача на извадковото наблюдение в икономиката е да получи надеждни преценки относно показателите за средната стойност и дела в общата популация въз основа на характеристиките на извадката (средна стойност и дял). Трябва да се има предвид, че при всяко статистическо изследване (непрекъснато и селективно) има два вида грешки: регистрация и представителност.

Грешки при регистрация мога да имам случаен(неволно) и систематичен(тенденциозен) характер. Случайни грешкиобикновено се уравновесяват, тъй като нямат преобладаваща посока в посока на преувеличаване или подценяване на стойността на изследвания показател. Систематични грешкинасочени в една посока поради умишлено нарушение на правилата за подбор (предварително заложени цели). Те могат да бъдат избегнати с подходяща организация и наблюдение.

Представителни грешки са присъщи само на селективно наблюдение и възникват поради факта, че извадката не възпроизвежда напълно общата популация. Те представляват несъответствието между стойностите на показателите, получени от извадката, и стойностите на показателите със същите стойности, които биха били получени при непрекъснато наблюдение, извършвано със същата степен на точност, т.е. , между стойностите на избираемите и съответните общи показатели.

За всяко конкретно извадково наблюдение стойността на грешката на представителността може да бъде определена чрез подходящите формули, които зависят от вид, методи начинобразуването на пробата.

С поглед прави разлика между индивидуална, групова и комбинирана селекция. При индивидуален подборв извадката се избират отделни единици от общата популация; при избор на група- качествено хомогенни групи или серии от изследваните единици; комбиниран подборпредполага комбинация от първия и втория тип.

По метода на подбор различавам повтории непрекъснато вземане на проби.

При повторно вземане на пробиобщият брой единици в общата популация в процеса на вземане на проби остава непроменен. Една или друга единица, включена в извадката, се връща на общата популация след регистрацията и тя запазва равна възможност с всички останали единици при повторно подбиране на единици, за да влезе в извадката („подбор според върнатата топка схема“ ). Преизбирането е рядкост в социално-икономическия живот. Вземането на проби обикновено се извършва по нереплицирана схема за вземане на проби.

При непрекъснато вземане на пробиединицата от популацията, включена в извадката, не се връща към общата популация и не участва в извадката в бъдеще; тоест, последващата извадка се прави от общата популация вече без предварително избраните единици („подбор по схемата за невъзвратена топка“). По този начин, с неповторима извадка, броят на единиците в общата популация намалява в хода на изследването.

Метод на подбор дефинира специфичен механизъм или процедура за вземане на проби от общата популация.

Според степента на обхващане на населените единици има голями малък (н <30) выборки.

В практиката на извадковото изследване следните видове извадки са най -разпространени: всъщност произволен, механичен, типичен, сериен, комбиниран.

Основните характеристики на параметрите на общата и пробна популация са обозначени със символи:

N-обем на общото население (броят на включените в него единици);

NS -размер на извадката (брой на изследваните единици);

- обща средна стойност (средна стойност на черта в общата популация);

- средна стойност на извадката;

P- общият дял (делът на единици с дадена стойност на атрибута в общия брой единици на общата популация);

w - избирателен дял;

- обща вариация (вариация на черта в общата популация);

С 2 - примерна дисперсия на една и съща характеристика;

- стандартно отклонение в общата популация;

Се стандартното отклонение в пробата.

2. Грешки при вземане на проби

По време на селективно наблюдение трябва да се гарантира случайностизбор на единици. Всяка единица трябва да има равна възможност да бъде избрана с останалите. Точно на това се основава случайната извадка.

ДА СЕ подходяща произволна извадка се отнася до подбора на единици от цялата обща популация (без предварително разделяне на групи) чрез теглене на жребий (главно) или друг подобен метод, например, като се използва таблица със случайни числа. Случайна селекция -този избор не е случаен. Принципът на случайността предполага, че включването или изключването на обект от извадката не може да бъде повлияно от друг фактор, различен от случай. Пример правилно случайнотегленето на печалби може да служи като селекция: от общия брой на издадените билети определена част от числата, на които попадат печалбите, се избира на случаен принцип. Освен това всички числа имат еднаква възможност да бъдат включени в извадката. В този случай броят на избраните единици за пробата обикновено се определя въз основа на приетата пропорция на пробата.

Споделяне, мостри е съотношението на броя единици в извадката към броя единици в общата популация:

И така, с 5% проба от партида части в 1000 единици. размер на извадката NSе 50 единици, а с 10% проба -100 единици. и т.н. С правилната научна организация на извадката грешките на представителността могат да бъдат намалени до минимални стойности, в резултат на което селективното наблюдение става достатъчно точно.

Всъщност случаен подбор „в чист вид“ рядко се използва в практиката на селективно наблюдение, но той е първоначалният измежду всички останали видове подбор, съдържа и прилага основните принципи на селективното наблюдение.

Нека разгледаме някои въпроси от теорията на метода на извадката и формулата за грешка за проста случайна извадка.

При прилагане на метода на извадката в статистиката обикновено се използват два основни типа обобщаващи показатели: средна стойност на количествена характеристикаи относителната стойност на алтернативната характеристика(съотношението или специфичното тегло на единици в статистическа популация, които се различават от всички други единици от тази популация само по наличието на изследвания атрибут).

Избран дял ( w ), или честота, се определя от съотношението на броя единици с изследваната характеристика T,към общия брой единици в извадката НС: