Общ агрегат и селективен метод. Интервална оценка на общия дял

Често се случва, че е необходимо да се анализира конкретно социално явление и да се получи информация за него. Такива задачи често се срещат в статистиката и статистически изследвания. Проверете напълно сигурността на социалния феномен най-често е невъзможен. Например, как да разберем мнението на населението или всички жители на определен град по всеки въпрос? Попитайте абсолютно всички - случаят е почти невъзможен и много труден. В такива случаи се нуждаем от извадка. Това е точно концепцията, на която се основават почти всички изследвания и тестове.

Какво е проба

При анализиране на специфичен социален феномен е необходимо да се получи информация за него. Ако вземете едно изследване, тогава може да се отбележи, че проучването и анализът не подлежи на всяка единица на набор от изследователски обект. Взема се предвид само определена част от цялата съвкупност. Този процес е пробата: когато се изследват само определени единици от комплекта.

Разбира се, много зависи от вида на вземане на проби. Но има основни правила. Основното е, че изборът на агрегата трябва да бъде абсолютно случаен. Единиците на агрегат, които ще бъдат използвани, не трябва да се избират поради всеки критерий. Грубо казано, ако трябва да съберете цялостна популация от определен град и да вземете само мъже, тогава проучването ще бъде грешка, защото изборът не случайно изразходва, но избран по пол. Почти всички примерни методи се основават на това правило.

Правила за подбор

За да може избраният агрегат да се отразят основните качества на целия феномен, тя трябва да бъде изградена съгласно специфични закони, където е необходимо да се съсредоточи върху следните категории:

проба (селективен агрегат);
общо население;
представителност;
представителна грешка;
единица агрегат;
методи за изграждане на проба.

Характеристика селективно наблюдение И пробата се състои от:

Всички получени резултати се основават на математически закони и правила, т.е. с правилното изследване и при правилните изчисления резултатите няма да бъдат изкривени на субективна основа.
Тя дава възможност много по-бързо и с по-малко време и ресурси, за да получат резултата, изучаването на цялото множество събития, но само тяхната част.
Тя може да бъде приложена за изучаване на различни обекти: от конкретни въпроси, например, възрастта на групата, която ви интересува, до проучването обществено мнение или нивото на материална подкрепа на населението.

Селективно наблюдение

Проба - тя е статистическо наблюдениеВ което проучването не подлежи на цялата съвкупност, но само някои, избрани по определен начин, и резултатите от изследването на тази част се разпределят към целия комплект. Тази част се нарича селективен комплект. Това е единственият начин да изучавате голям набор от обект на изследването.

Но селективното наблюдение може да се използва само в случаите, когато е необходимо да се изследва само малка група единици. Например, когато изучавате съотношението на мъжете на жените в света, ще се използва селективно наблюдение. По очевидни причини е невъзможно да се вземе предвид всеки жител на нашата планета.

Но със същото проучване, но не всички жители на земята, а някои 2 "а" клас в конкретно училище, определен град, определена страна, може да направи без селективно наблюдение. В края на краищата, за да се анализира цялата гама от обекта на проучването - е напълно възможно. Необходимо е да се изчислят момчетата и момичетата от този клас - това ще бъде съотношението.

Селективен и общ агрегат

Всъщност всичко не е толкова трудно, както звучи. Във всеки обект на обучение има две системи: общ и селективен агрегат. Какво е? Всички единици се отнасят до общо. И за селективни - тези единици на общия агрегат, които са взети за пробата. Ако всичко е направено правилно, избраната част ще бъде намалено оформление на целия (общ) набор.

Ако говорим за общия агрегат, тогава могат да се разграничат само два вида: определен и неопределен общ общ агрегат. Това зависи от това дали общият брой на единиците на тази система е известен или не. Ако това е определен общ набор, тогава пробата ще се потисне поради това, което е известно кой процент от общия брой единици ще бъде проба.

Този момент е много необходим в изследванията. Например, ако трябва да проучите процента на сладкишните продукти с лошо качество в определена фабрика. Да предположим, че общият агрегат вече е дефиниран. Известно е, че на година тази компания произвежда 1000 сладкарски изделия. Ако направите извадка от 100 случайни сладкарски изделия от тази хиляда и ги изпратете на изпита, грешката ще бъде минимална. Грубо казано, проучване е отнесено 10% от всички продукти, а при резултатите можем, като вземем предвид грешката на представителността, да говорим за лошото качество на всички продукти.

И ако имате извадка от 100 сладкарски изделия от неопределен общ агрегат, където те всъщност са признали, 1 милион единици, резултатът от извадката и самият изследвания ще бъдат критични и неточни. Чувствате ли разликата? Следователно сигурността на общото население в повечето случаи е изключително важна и значително засяга резултата от проучването.

Представителност на агрегата

Така че, сега един от най-важните въпроси - какво трябва да бъде пробата? Това е основният момент на изследването. На този етап е необходимо да се изчисли пробата и да се изберат единици от обща сума в него. Комплектът беше избран правилно, ако някои характеристики и характеристики на общото население остават в селективно. Това се нарича представител.

С други думи, ако след подбора, частта запазва същите тенденции и характеристики, че цялата сума на разследваната, така че такъв комплект се нарича представител. Но не всяка конкретна извадка може да бъде избрана от представителна съвкупност. Има такива обекти на проучването, пробата от която просто не може да бъде представителна. Оттук и концепцията за грешка при представителност. Но ще говорим за това малко повече.

Как да направите проба

Така че, че представителността е максимална, разпределя три основни правила за извадката:

Грешка (грешка) Представителност

Основната характеристика на качеството на избраната проба е концепцията за "представителна грешка". Какво е? Това са определени несъответствия между показателите за селективно и солидно наблюдение. По отношение на грешката, представителността е разделена на надеждна, обикновена и приблизителна. С други думи, допустимите отклонения в размер до 3%, съответно от 3 до 10% и от 10 до 20%. Въпреки че е желателно в статистиката, грешката не надвишава 5-6%. В противен случай има причина да се говори за недостатъчната представителност на извадката. За да се изчисли спешността на представителността и как тя засяга селективното или общото население, се вземат предвид много фактори:

Вероятността, с която е необходимо да се получи точен резултат.
Броя на единиците на селективен агрегат. Както бе споменато по-рано, по-малките единици ще бъдат проба, толкова по-голяма ще има грешка при представителност и обратно.
Еднообразието на изучаването на съвкупността. Колкото по-хетерогенна е съвкупност, толкова по-голяма е несигурността на представителността. Възможността за съвкупност да бъде представителна зависи от еднородността на всички негови компоненти.
Метода за избор на единици в селективния комплект.

В специфични проучвания, процентът на средната грешка обикновено се определя от самия изследовател въз основа на програмата за наблюдение и според данните на проведените по-рано проучвания. Като правило, валидна грешка в извадката се счита за допустима грешка (представителност) в рамките на 3-5%.

Повече - не винаги по-добре

Също така си струва да се припомнят, че основното нещо в организацията на селективното наблюдение е да доведе своя обем на допустим минимум. Тя не трябва да се стреми да намалява границите на грешката за вземане на проби, тъй като това може да доведе до неоправдано увеличение на размера на тези проби и следователно до увеличаване на разходите за селективно наблюдение.

В същото време е невъзможно да се увеличи размерът на спешността на представителността. Всъщност, в този случай, въпреки че ще има намаление на количеството селективен агрегат, това ще доведе до влошаване на точността на получените резултати.

Какви въпроси обикновено се поставят пред изследователя

Всяко проучване, ако се извършва, тогава за някаква цел и да получи някои резултати. При провеждането на пробно проучване, като правило, първоначалните въпроси се поставят:

Методи за избор на единици от изследвания в извадката

Не е представена всяка проба. Понякога същият знак е различен като цяло като цяло и в нейните части. За да се постигнат изисквания за представителност, е препоръчително да се използват различни техники за вземане на проби. Освен това използването на един или друг метод зависи от специфичните обстоятелства. Сред тези техники за създаване на проба се отличават:

случайна подбор;
механичен избор;
типичен избор;
сериен (гнездо) избор.

Случайната подбор е система от мерки, насочени към случайна подбор на единици агрегат, когато вероятността за влизане в извадката е равна на всички единици на общата популация. Препоръчително е да се приложи тази техника само в случай на хомогенност и малък брой признаци, присъщи на него. В противен случай някои характерни характеристики рискуват, които не се отразяват в извадката. Признаците на случаен подбор се основават на всички други начини за изграждане на проба.

С механична селекция на единици се извършва чрез определен интервал. Ако трябва да формирате извадка от специфични престъпления, можете да се оттеглите от всички статистически счетоводни карти на регистрирани престъпления на всяка 5, 10 или 15-та карта, в зависимост от общия им брой и размера на извадката. Недостатъкът на този метод е, че преди подбора е необходимо да има пълно счетоводство на единици агрегат, след това да се класират и само след това е възможно да се пробва с определен интервал. Този метод отнема много време, така че често се използва.

Типичният (зониран) селекция е вид вземане на проби, в която общата популация е разделена на хомогенни групи на определен знак. Понякога изследователите използват други термини вместо групи: "области" и "зони". След това, от всяка група в произволен ред, определен брой единици се избират пропорционално на специфичното тегло на групата в общия агрегат. Типичният избор често се извършва на няколко етапа.

Сериен избор е метод, при който изборът на единици се извършва от групи (серии) и всички единици от избраната група (серия) са обект на проучването. Предимството на този метод е, че понякога избират отделни единици по-сложни от серия, например при изучаване на човек, който служи на изречение. В рамките на избрани райони зоните прилагат изследването на всички единици без изключение, например, проучването на всички лица, които служат на присъда в някаква конкретна институция.

Статистически агрегат- Много звена с масист, типична, висококачествена хомогенност и наличие на вариант.

Статистическият агрегат се състои от материални обекти (служители, предприятия, страни, региони), е обект.

Единица агрегат - всяка отделна единица статистически агрегат.

Същият статистически агрегат може да бъде хомогенен един знак и хетерогенен по различен начин.

Качествена хомогенност - прилики от всички звена на агрегат при всеки знак и кърмене на всички останали.

В статистическия агрегат на разграничението на една единица на съвкупността по-често има количествен характер. Количествените промени в стойностите на знака на различни единици агрегат се наричат \u200b\u200bвариант.

Вариант на знак - количествена промяна в функцията (за количествена основа) по време на прехода от една единица на съвкупността към друга.

Знак- Това свойство, характерна или друга характеристика на единици, обекти и явления, които могат да бъдат наблюдавани или измерени. Знаците се разделят на количествено и качествено. Разнообразието и променливостта на знака на знака в отделни единици от комплекта се нарича Вариантност.

Атрибут (качествени) знаците не са податливи на цифров израз (състав на населението на пода). Количествените признаци имат цифров израз (състав на населението по възраст).

Показател - Това обобщава количествено квалифицираните характеристики на всяко собственост на единици или цялостно в обратен вид в специфични условия и пространство.

Система от индикатори - Това е комбинация от показатели, които изцяло отразяват изследваното явление.

Например, заплатата се изучава:

Знак - заплата
Статистически общ агрегат - всички служители
Единица агрегат - всеки служител
Качествена хомогенност - начислена заплата
Вариант на сигнала - редица числа

Общ агрегат и проба от нея

Основата представлява много данни, получени в резултат на измерване на един или повече признаци. Действително наблюдаван набор от обекти, статистически представен брой наблюдения на случайна променлива е пробаи хипотетично съществуват (презряни) - общо разглеждане. Общото население може да бъде окончателното (брой наблюдения N \u003d const.) или безкрайни ( N \u003d ∞.) и извадка от общото население винаги е резултат от ограничен брой наблюдения. Нарича се броят на наблюденията, образуващи пробата вземане на проби. Ако размерът на пробата е достатъчно голям ( n → ∞.) Пробата се разглежда голямв противен случай се нарича вземане на проби ограничен обем. Пробата се разглежда малаяАко при измерването на едноизмерна случайна променлива, размерът на пробата не надвишава 30 ( н.<= 30 ) и при измерване едновременно няколко ( к.) Признаци в многоизмерно пространство за пространство н.да се К.по-малко от 10 (n / k< 10) . Примерни форми вариантна серияАко членовете й са ординална статистика, т.е. селективни стойности на случайната променлива Х. Поръчани възходящи (класирани), стойностите на знака се наричат настроики.

Пример. Почти един и същ случайно подбран набор от обекти - търговски банки на един административен район на Москва, може да се счита за извадка от населението на всички търговски банки на този район, и като извадка от общото население на всички търговски банки в Москва, както и извадка от търговските банки в страната и др.

Основни начини за организиране на вземане на проби

Точността на статистическите заключения и смисленото тълкуване на резултатите зависи от това представителност проби, т.е. Пълнотата и адекватността на представянето на свойствата на общото население, по отношение на която тази извадка може да се счита за представителна. Проучването на статистическите свойства на комплекта може да бъде организирано по два начина: с твърд и неплатен. Солидно наблюдениепредоставя проучване на всички единици изучавам обща сума, но небластично (селективно) наблюдение - само нейните части.

Има пет основни начина за организиране на селективно наблюдение:

1. прост случаен подборВ какви обекти са произволно извлечени от общия набор от обекти (например, като се използва таблица или сензор за случайни числа), всяка от възможните проби има еднаква вероятност. Такива проби се наричат всъщност случайно;

2. прост избор с помощта на редовна процедура Той се извършва с помощта на механичен компонент (например, дати, ден от седмицата, апартаменти, буквите на азбуката и т.н.) и пробата, получена по този начин, се нарича механични;

3. стратифициран Изборът е, че общият набор от обем е разделен на обем на дъщерния или слоеве (слоеве). Strats са хомогенни обекти от гледна точка на статистическите характеристики (например населението е разделено на слоеве във възрастовите групи или социална принадлежност; предприятия - от индустрията). В този случай пробите се наричат стратифициран (в противен случай склонни, типични, зонирани);

4. Методи сериен Подбор се използва за формиране сериен или гнездови проби. Те са удобни, ако трябва да разгледате "блока" или поредица от обекти (например партида стоки, продукти от определена серия или население с териториалното административно деление на страната). Изборът на серията може да се извършва чрез случаен или механичен начин. Едновременно непрекъснато проучване на определена партида или цяла териториална единица (жилищна сграда или тримесечие);

5. комбиниран Изборът на (стъпалото) може да комбинира няколко метода за подбор едновременно (например стратифицирани и случайни или случайни и механични); Тази проба се нарича комбиниран.

Видове селекция

До вж Индивидуалната, група и комбиниран избор се различават. За индивидуален избор В селективния комплект са избрани отделни единици от общия агрегат, групов избор - качествено хомогенни групи (серии) на единици и комбиниран избор Прекарва комбинация от първи и втори вид.

До метод.избор се отличава многократно и небрежно проба.

Улавянеизборът се нарича, в който единицата, която е попаднала в извадката, не се връща към първоначалния набор и в бъдеще изборът не е замесен; В същото време броят на единиците на населението Н. По време на процеса на подбор. За повторение Избор улов В извадката единицата след регистрация се връща на общия набор и по този начин запазва равни възможности, заедно с други единици, които трябва да се използват в по-нататъшната процедура за подбор; В същото време броят на единиците на населението Н. Тя остава непроменена (методът в социално-икономическите изследвания рядко се прилага). Въпреки това, с голям N (n → ∞) Формули за гладен селекцията се приближава подобна на повторение Подбор и практически по-често се използва ( N \u003d const.).

Основните характеристики на параметрите на общия и селективен агрегат

В основата на статистическите заключения на проучването е в основата на разпределението на случайната променлива, наблюдаваните ценности (x 1, x 2, ..., x n) наречени случайни променливи Х. (n - вземане на проби). Разпределението на случайна променлива в общото население е теоретично, идеалното естество и неговият селективен аналог е емпиричен разпространение. Някои теоретични разпределения се определят аналитично, т.е. тях параметри Определете стойността на разпределителната функция във всяка точка на възможните стойности на случайната променлива. За пробата, функцията за разпространение е трудно да се определи, а понякога е невъзможно параметри Оценени според емпирични данни, а след това те са заменени в аналитичен израз, описващ теоретичното разпределение. В същото време, предположението (или. \\ T хипотеза) Видът на разпространение може да бъде както статистически вярно и погрешно. Но във всеки случай емпиричното разпределение се възстановява само грубо характеризира. Най-важните параметри на разпределенията са очаквана стойност и дисперсия.

По природа, разпределението е непрекъснато и отделен. Най-известното непрекъснато разпространение е нормално. Селективни аналози на параметрите на IDL са: средна стойност и емпирична дисперсия. Най-често се прилагат сред дискретни в социално-икономическите изследвания алтернатива (дихотомна) разпространение. Параметърът на математическото очакване на това разпространение изразява относителната стойност (или. \\ T дял) единици агрегат, които имат изучен атрибут (той е посочен с писмото); Делът на агрегата, който не притежава тази функция, е посочен от писмото q (Q \u003d 1 - p). Дисперсията на същото алтернативно разпределение също има емпиричен аналог.

В зависимост от вида на разпределението и върху метода на избора на единици на комплекта различно изчислени характеристиките на разпределителните параметри. Основните за теоретични и емпирични разпределения са показани в таблица. 9.1.

Вземане на проби K N. Съотношението на броя на единиците на селективния набор към броя на общите агрегирани единици се нарича:

k n \u003d n / n.

Селективен дял на W. - Това е връзката на единици с изучен знак х. към обема на пробата н.:

w \u003d n n / n.

Пример. В партидата стоки, съдържащи 1000 единици, с 5% проба вземане на проби K N. В абсолютна стойност е 50 единици. (n \u003d n * 0.05); Ако в тази проба са открити 2 дефектни продукта селективен брак W. ще бъде 0.04 (W \u003d 2/50 \u003d 0.04 или 4%).

Тъй като селективният комплект е отличен от генерал, тогава има грешки в извадката.

Таблица 9.1 Основни параметри на общи и селективни комплекти

Грешки в извадката

За всеки (твърд и селективен) може да има грешки в два вида: регистрация и представителност. Грешки регистрация мога да имам случайно и систематичен характер. Случайно Грешки, сгънати от различни различни неконтролируеми причини, са непреднамерен характер и обикновено се балансират помежду си (например промени в инструменталните индикатори при температурни колебания в помещението).

Систематичен Грешките са тенденциозни, тъй като нарушавате правилата за избор на обекти към избора (например отклонения в измервания, когато измервателният уред е променен).

Пример. За да се оцени социалното положение на населението в града, планира се да се разгледа 25% от семействата. Ако в същото време изборът на всеки четвърти апартамент се базира на номера му, тогава има опасност да се изберат всички апартаменти само от един тип (например една стая), която ще осигури системна грешка и ще изкриви резултатите; Изборът на броя на апартамента в партиди е по-предпочитан, тъй като грешката ще бъде случайна.

Представителни грешки Присъщи само чрез селективно наблюдение, те не могат да бъдат избегнати и те възникват в резултат на факта, че селективният комплект напълно не възпроизвежда генерала. Стойностите на показателите, получени от пробата, се различават от показателите за същите стойности в общата популация (или получени със солидно наблюдение).

Грешка селективно наблюдение Има разлика между стойността на параметъра в общото население и неговата селективна стойност. За средния количествен знак, той е равен на: и за акция (алтернативен характер) -.

Примерните грешки се характеризират само с селективни наблюдения. Колкото повече тези грешки са, толкова по-голямо е емпиричното разпределение, което се различава от теоретичната. Следователно параметрите на емпиричното разпределение и са случайни стойности, поради което грешките за вземане на проби също са случайни стойности, могат да се вземат различни стойности за различни проби и затова е обичайно да се изчисли средна грешка.

Средна грешка при пробаима стойност, която изразява средното квадратично отклонение на примерната среда от математическото очакване. Тази стойност при спазването на принципа на случайна подбор зависи преди всичко от размера на пробата и от степента на вариация на функцията: колкото по-голяма е разликата от функцията (следователно, стойността), колкото по-малка е стойността на средната грешка в извадката. Съотношението между дисперсиите на общите и селективните агрегати се изразява по формулата:

тези. С доста голям, можем да приемем това. Средната грешка в извадката показва възможните отклонения на параметъра за изборния набор от общия параметър. В раздела. 9.2 показва изрази за изчисляване на средната грешка при вземане на проби при различни методи за наблюдение.

Таблица 9.2 Средна грешка (m) на примерна среда и акции за различни видове вземане на проби

Където е средната стойност на вътрешногрупа селективни дисперсии за непрекъсната функция;

Средната за вътрешните дисперсии на акта;

- броя на избраните серии, - общия брой на серията;

къде е средният брой на серията;

- общата средна по време на селективния агрегат за непрекъсната характеристика;

където - съотношението на знака на серията;

- общия дял на знака по целия селективен агрегат.

Въпреки това, величината на средната грешка може да се прецени само с определена вероятност P (p ≤ 1). Ляпунов А.М. Доказано е, че разпределението на селективните средни стойности и следователно техните отклонения от общата средно, с достатъчно голям брой приблизително ограничава нормалния закон за разпределение, при условие че общото население има ограничена средна и ограничена дисперсия.

Математически, това твърдение за средната стойност се изразява във формата:

и за съотношението на изразяването (1) приема формата:

където - има Грешка при подборкоето е множествено величина на средната грешка в извадката , И съотношението на множеството - има ученик критерий ("коефициент на доверие"), предложен от U.S. Gosset (псевдоним "студент"); Стойностите за различни вземания се съхраняват в специална таблица.

Стойностите на функцията f (t) при някои стойности t са равни: \\ t

Следователно изразът (3) може да се чете така: с вероятност P \u003d 0,683 (68.3%) Може да се твърди, че разликата между пробата и общата средна стойност няма да надвишава една стойност на средната грешка M (t \u003d 1), с вероятност P \u003d 0.954 (95.4%) - че няма да надвишава величината на две средни грешки M (t \u003d 2), С вероятност P \u003d 0.997 (99.7%) - няма да надвишава три стойности m (t \u003d 3).Следователно, вероятността тази разлика да надвишава трикратната стойност на средната грешка определя ниво на грешка и не е повече 0,3% .

В раздела. 9.3 Формулите са дадени, за да се изчисли грешката на лимита за избор.

Таблица 9.3 Грешка (г) Проби за средни и акции (P) за различни видове селективно наблюдение

Разпределение на резултатите от пробата върху общия комплект

Крайната цел на селективното наблюдение е характерен за общото население. При малки томове за вземане на проби, емпиричните оценки на параметрите (ите) могат значително да се отклонят от техните истински стойности (и). Следователно става необходимо да се установят граници, в рамките на които (ите) стойности са (ите) за селективни стойности на параметрите (и).

Поверителен интервалвсеки параметър θgeneral набор се нарича случаен регион на стойностите на този параметър, който вероятно е близо до 1 ( надеждност) Съдържа истинската стойност на този параметър.

Максимална грешка Проби Δ ви позволява да определяте граничните стойности на характеристиките на общото население и техните интервали на довериеса равни:

Долна линия поверителен интервал Получени чрез изваждане грешка в границите От селективната среда (дял) и отгоре - като го добавите.

Интервал на доверие За средната употреба грешката за подбор на подбор и за определеното ниво на доверие се определя по формулата:

Това означава, че с дадена вероятност R.което се нарича ниво на доверие и е недвусмислено определено от стойността t.може да се твърди, че истинската стойност на средните лежи в рамките на и истинската стойност на акцията - от

При изчисляване на доверителния интервал за три стандартни нива на доверие Р \u003d 95%, p \u003d 99% и p \u003d 99.9% Стойността е избрана от. Приложения в зависимост от броя на степените на свободата. Ако размерът на извадката е доста голям, тогава стойностите, съответстващи на тези вероятности t. Равен: 1,96, 2,58 и 3,29 . По този начин грешката за подбор ви позволява да определяте граничните стойности на характеристиките на общото население и техните доверителни интервали:

Разпространението на резултатите от селективното наблюдение върху общото население в социално-икономическите изследвания има свои характеристики, тъй като тя изисква пълнотата на представителността на всички нейни видове и групи. Основата за възможността за такова разпространение е изчислението относителна грешка:

където Δ % - Относителна грешка на подбор; .

Има два основни метода за разпространение на селективно наблюдение върху общото население: директно преизчисляване и метод на коефициенти.

Същност директно преизчисляванетова е умножение на средната стойност на пробата !! Извършете (X) върху обема на общото население.

Пример. Нека средният брой на вършачките в града се оценява от селективния метод и възлиза на човек. Ако в града има 1000 млади семейства, броят на необходимите места в общинската детска стая се получава чрез умножаване на тази средна стойност за броя на общото население n \u003d 1000, т.е. ще бъдат 1200 места.

Метод на коефициентите Препоръчително е в случая, когато се извършва селективно наблюдение, за да се изясни тези твърди наблюдения.

В същото време използвайте формулата:

когато всички променливи са броят на агрегата:

Необходимо вземане на проби

Таблица 9.4 Необходими обем (n) Проби за различни видове организация на селективно наблюдение

Когато планирате селективно наблюдение с предварително определена стойност на валидната грешка при пробата, е необходимо правилно да се оцени необходимите обем на вземане на проби. Този обем може да се определи въз основа на валидна грешка в селективното наблюдение въз основа на дадена вероятност, която гарантира допустимата стойност на нивото на грешката (като се вземе предвид начинът на организиране на наблюдение). Формули, за да се определи необходимия брой вземане на проби, лесно се получава директно от формулите на грешка при избора. Така че, от израз за гранична грешка:

директно определя размера на пробата н.:

Тази формула показва, че с намаление на грешката на пробата Δ необходимият обем на извадката е значително увеличаващ се, който е пропорционален на дисперсията и квадрата на ученика.

За определен начин за организиране на наблюдение, необходимия обем на вземане на проби се изчислява съгласно формулите, показани в таблицата. 9.4.

Практически примери за изчисление

Пример 1. Изчислете средната стойност и доверителния интервал за непрекъсната количествена функция.

За да се оцени процентът на изчисление с кредиторите, случайна извадка от 10 платежни документа е случайна. Техните стойности се оказаха равни (в дни): 10; 3; петнадесет; петнадесет; 22; 7; осем; един; деветнайсет; двадесет.

Необходимо е с вероятност P \u003d 0,954. Определете граничната грешка Δ селективни средни и доверителни граници на средното време за сетълмент.

Решение. Средната стойност се изчислява по формулата от таблицата. 9.1 за селективен агрегат

Дисперсията се изчислява по формулата от таблицата. 9.1.

Средната квадратична грешка на деня.

Средната грешка се изчислява по формулата:

тези. Средната стойност е x ± m \u003d 12.0 ± 2,3 дни.

Точността на средната стойност

Граничната грешка се изчислява по формулата от таблицата. 9.3 за повторно подбор, тъй като броят на общото население е неизвестен и за P \u003d 0,954. ниво на надеждност.

Така средната стойност е `x ± d \u003d` x ± 2m \u003d 12.0 ± 4.6, т.е. Истинското му значение е от 7.4 до 16,6 дни.

Използване на таблицата на ученика. Приложенията позволяват да се заключи, че за n \u003d 10 - 1 \u003d 9 степени на свобода, получената стойност е надеждно с нивото на значимостта, £ 0.001, т.е. Получената стойност на средната стойност е надеждно различна от 0.

Пример 2. Оценка на вероятността (обща акция) стр.

С механичен селективен метод за изследване на социалната позиция на 1000 семейства, беше разкрито, че делът на семействата с ниски доходи е бил w \u003d 0.3 (30%) (проба е била 2% . n / n \u003d 0.02). Необходимо е с нивото на надеждност p \u003d 0.997. Определя индикатора r.семейства с ниски доходи в целия регион.

Решение. Според представените стойности на функцията F (t) Намерете за определеното ниво на надеждност P \u003d 0.997. стойност t \u003d 3. (виж Формула 3). Грешка на територията w. Ние определяме формулата от таблицата. 9.3 за избор на улавяне (механичната проба винаги е възможна:

Ограничете относителната грешка в извадката в % ще бъде:

Вероятността (общата пропорция) на семействата с ниски доходи в региона ще бъде p \u003d w ± δ wИ ограниченията на доверието P се изчисляват въз основа на двойно неравенство:

w - δ w ≤ p ≤ w - δ w. Истинската стойност на P лъжи в:

0,3 — 0,014 < p <0,3 + 0,014, а именно от 28,6% до 31,4%.

Така, с вероятност от 0.997, може да се твърди, че делът на семействата с ниски доходи сред всички семейства на региона варира от 28.6% до 31.4%.

Пример 3.Изчисляване на средната стойност и доверителен интервал за дискретен атрибут, определен от интервал наблизо.

В раздела. 9.5. Разпределението на заявленията за производство на поръчки по отношение на тяхното изпълнение от предприятието е определено.

Таблица 9.5 Разпределение на наблюденията по отношение на външния вид

Решение. Средният срок за кандидатстване се изчислява по формулата:

Средната стойност ще бъде:

\u003d (3 * 20 + 9 * 80 + 24 * 60 + 48 * 20 + 72 * 20) / 200 \u003d 23.1 месеца.

Получаваме същия отговор, ако използваме данните за P i от предпоследната таблица на таблицата. 9.5, използвайки формулата:

Обърнете внимание, че средата на интервала за последната градина е разположена чрез изкуствено добавяне на ширината на интервала от предишната градина, равна на 60 - 36 \u003d 24 месеца.

Дисперсията се изчислява по формулата

където x I.- средата на интервалната серия.

Следователно !! sigma \u003d frac (20 ^ 2 + 14 ^ 2 + 1 + 25 ^ 2 + 49 ^ 2) (4) и средната квадратична грешка.

Средната грешка се изчислява по формулата, т.е. Средната стойност е !! Извършете (x) ± m \u003d 23.1 ± 13.4.

Граничната грешка се изчислява по формулата от таблицата. 9.3 за повторно подбор, тъй като броят на общото население е неизвестен, за 0.954 нива на надеждност:

Така средната стойност е:

тези. Истинското му значение е от 0 до 50 месеца.

Пример 4. За да се определи скоростта на изчисленията с кредиторите n \u003d 500 предприятия на корпорацията в търговска банка, е необходимо да се извърши проучване на извадката по метода на случайно неместно селекция. Определете необходимата размер на пробата N, така че с вероятността за P \u003d 0.954 средна грешка в извадката не надвишава 3 дни, ако прогнозите са показали, че средното квадратично отклонение е 10 дни.

Решение. За да се определи броят на необходимите проучвания, n Използваме формулата за избора извън площадката от таблицата. 9.4:

В него стойността t се определя от нивото на надеждност р \u003d 0.954. Той е равен на 2. Средната квадратична стойност S \u003d 10, обемът на общия набор n \u003d 500 и граничната грешка на средната стойност Δ x \u003d 3. Заместване на тези стойности във формулата, получаваме:

тези. Пробата е достатъчна, за да състави 41 предприятия за оценка на необходимия параметър - степента на изчисленията с кредиторите.

Селективно наблюдение Използва се при използването на солидно наблюдение физически невъзможни поради голям масив за данни или икономически неподходящи. Физическата неспособност възниква, например, при изучаването на пътническия трафик, пазарните цени, семейните бюджети. Икономически непълноцелеспособност се извършва при оценката на качеството на стоките, свързани с тяхното унищожаване, например дегустация, тестване на тухли за сила и др.

Статистически единици, избрани за наблюдение селективен агрегат или пробаи цялата им масива - общ агрегат (GS). Където броя на единиците в извадката обозначаваме н.и във всичките тези - Н.. Поведение n / n. Наречен относителен размер или вземане на проби.

Качеството на резултатите от селективното наблюдение зависи от представителна пробаТова обаче е, доколкото е представително за GS. За да се гарантира, че трябва да се спазва представителността на пробата принципа на избор на единицикоето предполага, че включването на единица на HS не може да засегне всеки друг фактор освен случая.

Съществува 4 начина на случайност Към пробата:

Всъщност случайно Избор или метод за "лото", когато статистическите стойности се присвояват по последователни номера, въведени в определени елементи (например барела), които след това се смесват в някакъв капацитет (например в торба) и на случаен принцип. На практика този метод се извършва с генератор на произволен брой или математически таблици на случайни числа.
Механични Подбор, според който всеки ( N / n.) - величината на общото население. Например, ако съдържа 100 000 стойности и е необходимо да изберете 1000, след това всеки 100,000 / 1000 \u003d 100-тата стойност ще попадне в пробата. Освен това, ако не са класирани, тогава първият е избран на случаен принцип от първите сто, а броят на другите ще бъде на сто повече. Например, ако първият е един от № 19, тогава следното трябва да бъде № 119, след това № 219, тогава № 319 и т.н. Ако единиците на общото население са класирани, тогава първият е подбран № 50, след това № 150, след това № 250 и така нататък.
Избор на стойности от нехомогенна масив за данни се извършва стратифициран(стратифицирани) по начин, когато общият комплект е предварително разделен на хомогенни групи, към които се прилага случайна или механична селекция.
Специален начин за композиране на проба е сериен Изборът, при който случайно или механично избират не отделни стойности, но серията им (последователности с някакъв брой за някакъв договор), вътре, които са подложени на твърдо наблюдение.

Качеството на селективните наблюдения зависи от вид на пробата: повторение или улавяне.
За повторно селекция Статистическите ценности, попаднали в извадката или серията им след употреба, се връщат на общото население, имайки възможност да влязат в нова проба. В този случай всички стойности на общия агрегат са същата вероятност за включване в извадката.
Избор на улавяне Това означава, че статистическите стойности, които са попаднали в извадката или серията им след употреба, не се връщат на общото население и следователно за останалите стойности на последния увеличават вероятността да влязат в следващата проба.

Изборът за улавяне осигурява по-точни резултати, така че се използва по-често. Но има ситуации, в които не може да се прилага (проучването на пътническия трафик, потребителското търсене и т.н.) и след това се извършва повторно подбор.

Грешки в извадката

Селективният комплект може да бъде оформен от количествената основа на статистическите стойности, както и алтернатива или атрибут. В първия случай обобщаването на характеристиката на извадката служи Стойността е посочена и във втория - селективен дял Стойностите, обозначени w.. В общото население, съответно: обща среда и общ дял R..

Разлика - I. W. — r. Наречен грешка при вземане на пробикоето е разделено рекордната грешка и представителна грешка. Първата част от грешката на извадката възниква поради неправилна или неточна информация поради причините за неразбиране на въпроса, непълнотата на секретаря при попълването на въпросника, формули и др. Лесно се открива справедливо и елиминирано. Втората част на грешката възниква поради постоянното или спонтанно неспазване на принципа на процента. Трудно е да се открие и елиминира, той е много повече и затова е фокусиран.

Размерът на грешката в извадката може да бъде различен за различни проби от една обща популация, така че в статистиката се определя вземане на проби от средна грешка и не-докладване По формули:

Повтарящи се

- Улавяне;

Където DV е селективна дисперсия.

Например, във фабрика с броя на служителите на 1000 души. Провежда се 5% случайна проба от труд, за да се определи средният опит на работниците. Резултатите от наблюдението на пробата са дадени в първите две колони от следната таблица:
Х. , години
(работен опит)

е. , хора
(брой на служителите в извадката)

Х. и

Х. и е.

В третата колона се определят средата на интервалите на х (като половин асм на долната и горната граници на интервала), а в 4-та колона - произведенията на X и F, за да намерят примерната среда според Средна аритметична формула:
143.0 / 50 \u003d 2.86 (година).
Изчислете селективната дисперсия, претеглена:
= 105,520/50 = 2,110.
Сега ще намерим средна грешка на Корсперската проба:
\u003d 0,200 (години).

От формулите на средните грешки в извадката, може да се види, че грешката е по-малка с не-симулатор, и, както е доказано в теорията на вероятността, тя се случва с вероятност от 0.683 (т.е. ако имате 1000 Проби от един общ набор, след това в 683 от тях, грешката не надвишава грешката за вземане на проби). Такъв шанс (0.683) е нисък, така че не е достатъчно за практически изчисления, където е необходима по-голяма вероятност. За определяне на грешката за вземане на проби с по-висока от 0.683 вероятност, изчислете грешка при вземане на проби:

Където t. - коефициентът на доверие в зависимост от вероятността да се определи грешка при избора.

Стойности на коефициента на доверие t. Изчислени за различни вероятности и са налични в специални таблици (Inplace Integral), от които следните комбинации са широко използвани в статистиката:

Вероятност	0,683	0,866	0,950	0,954	0,988	0,990	0,997	0,999
t.	1	1,5	1,96	2	2,5	2,58	3	3,5

Определяне на специфичното ниво на вероятност, изберете от таблицата, съответстваща на нея t. и определете грешката на лимита за избор по формулата.
Най-често се използва \u003d 0.95 и t.\u003d 1.96, т.е. се смята, че с вероятност от 95% грешка при вземане на проби от 1.96 пъти повече средно. Тази вероятност (0.95) се разглежда стандарт и се прилага по подразбиране в изчисленията.

В нашия, ние определяме маргиналната грешка при избор със стандартна 95% вероятност (от вземане t. \u003d 1.96 за 95% вероятност): \u003d 1.96 * 0,200 \u003d 0.392 (година).

След изчисляване на граничната грешка интервал на доверие обобщава характеристиките на общото население. Такъв интервал за общата средна има формата
Това означава, че средният опит на работниците на цялото растение се крие в диапазона от 2.468 до 3,252 години.

Определяне на броя на извадката

Разработване на програмата за наблюдение на пробата, понякога определена от специфичната стойност на ограничаващата грешка с ниво на вероятност. Минималният брой проби остава неизвестен, като осигурява определена точност. Може да се получи от формулите на средните и ограничаването на грешките в зависимост от вида на вземане на проби. Така че, замествайки както в, така и, решаването му по отношение на размера на пробата, ние получаваме следните формули:
За повтаряща се проба н. =
За пробата за труп н. = .

В допълнение, при статистически количествени знаци, трябва да знаете селективната дисперсия, но не е известно на началото на изчисленията. Следователно тя се приема приблизително Един от следните методи (в приоритет):

При изучаване на не-цифрови признаци, ако няма приблизителна информация за селективния дял, той се приема w. \u003d 0.5, която според дисперсионната формула делът съответства на селективната дисперсия в максималния размер Dv \u003d.0,5*(1-0,5) = 0,25.

Общият брой на обектите за наблюдение (хора, домакинства, предприятия, селища и др.), Които имат определен набор от характеристики (пол, възраст, доход, брой, оборот и др.), Limited в пространството и времето. Примери за общи агрегати

Всички жители на Москва (10,6 милиона души според преброяването от 2002 г.)
Мусковит мъже (4,9 милиона души според преброяването от 2002 г.)
Юридически лица на Русия (2,2 милиона в началото на 2005 г.)
Търговски обекти, продаващи хранителни продукти (20 хиляди в началото на 2008 г.) и др.

Вземане на проби (селективен комплект)

Някои от обектите от общия агрегат, избрани за изследване, за да направят приключването на цялата обща популация. За да се направи полученото чрез изучаване на извадката, е възможно да се разшири до целия общ набор, пробата трябва да има имущество на представителност.

Представителна проба

Проучният имот правилно отразява общото население. Същата извадка може да бъде представена и непредставителна за различни общи комплекти.
Пример:

Пробата, която изцяло се състои от московица, която притежава колата, не представлява цялото население на Москва.
Проба от руски предприятия с редица до 100 души не представляват всички предприятия на Русия.
Проба от московчани, които правят покупки на пазара, не представляват поведението на всички мусковци.

В същото време, посочените проби (при спазване на други условия) могат перфектно да представляват собственици на монсовити-автомобили, малки и средни руски предприятия и купувачи, които правят покупки на пазарите, съответно.
Важно е да се разбере, че представителността на извадката и грешката на извадката са различни явления. Представителност, за разлика от грешката, тя не зависи от размера на извадката.
Пример:
Сякаш не увеличихме броя на анкетираните полицейски собственици, няма да можем да представим на тази извадка от всички мусковци.

Грешка в извадката (интервал на доверие)

Отклонение на резултатите, получени чрез селективно наблюдение от истинските данни на общото население.
Грешка в извадката Има два вида - статистически и систематични. Статистическата грешка зависи от размера на извадката. Колкото по-голям е размерът на извадката, толкова е по-долу.
Пример:
За прост случаен размер на извадката от 400 единици максималната статистическа грешка (с 95% вероятност за доверие) е 5%, за вземане на проби от 600 единици - 4%, за вземане на проби в 1100 единици - 3% обикновено, когато грешката на пробата се казва, тя е Именно статистическа грешка.
Систематична грешка зависи от различни фактори, които имат постоянно въздействие върху проучването и преместват резултатите от проучването в определена посока.
Пример:

Използването на пробогодни проби подценява дела на хората с висок доход, водещ активен начин на живот. Това се дължи на факта, че такива хора са много по-трудни за улов на конкретно място (например у дома).
Проблемът на респондентите, които отказват да отговорят на въпроси (делът на "отказ" в Москва, за различни проучвания, се колебае от 50% до 80%)

В някои случаи, когато са известни истинските разпределения, систематичната грешка може да бъде изравнена чрез въвеждането на квоти или да се вземат данните, но в повечето реални изследвания дори оценяват, че е доста проблематично.

Видове проби

Пробите се разделят на два вида:

вероятност
невероятно

1. Вероятни проби
1.1 Случайна проба (проста случайна селекция)
Такава проба включва хомогенността на общото население, същата вероятност за наличието на всички елементи, наличието на пълен списък на всички елементи. Когато се избират елементи, като правило се използва таблица с случайни числа.
1.2 Механична (системна) проба
Разнообразие от случайни проба, поръчана от всеки знак (азбучен ред, телефонен номер, дата на раждане и др.). Първият елемент е избран случайно, след това с стъпка 'n', всеки 'k'th елемент е избран. Размера на общия агрегат, с n \u003d n * k
1.3 стратифицирани (зонирани)
Използва се в случай на нехомогенност на общото население. Общият агрегат е разделен на групи (слоеве). Във всяка стратегия селекцията се извършва случайно или механично.
1.4 Сериен (гнездо или клъстер)
С серийна проба, подборните единици не са самите обекти, но групи (клъстери или гнезда). Групите се избират на случаен принцип. Обектите вътре в групите се изследват с твърдо вещество.

2. Увеличени проби
Изборът в такава извадка не се извършва върху принципите на шанса, но относно субективните критерии - достъпност, типично, равно представителство и др.
2.1. Четирия проба
Първоначално бяха разграничени редица групи обекти (например мъже на възраст 20-30 години, 31-45 години и 46-60 години; лица с доход до 30 хиляди рубли, с доход от 30 до 60 хиляди рубли. и с доход над 60 хиляди рубли) всяка група се определя от броя на обектите, които трябва да бъдат изследвани. Броят на обектите, които трябва да попаднат във всяка от групите, е определен, най-често или пропорционално на най-известния дял на групата в общото население или една и съща за всяка група. Вътрешните групи обектите са избрани произволно. Четивите проби се използват доста често.
2.2. Метод на снежна кома
Пробата е изградена по следния начин. Всеки респондент, започвайки от първия, попитайте контактите на приятелите си, колеги, познати, които биха били подходящи за условията за подбор и могат да участват в проучването. Така, с изключение на първата стъпка, пробата се формира с участието на самите обекти. Методът често се използва, когато е необходимо да се намерят и интервюират труднодостъпните групи от респондентите (например респондентите, които имат високи доходи, респонденти, принадлежащи към една професионална група, респонденти, които имат подобни хобита / хобита и др. Чест
2.3 спонтанна проба
Интервюират се най-достъпните респонденти. Типични примери за спонтанни проби - във вестници / списания, дадени на респондентите за самозапълване, повечето от интернет проучванията. Размерът и съставът на естествените проби не са известни предварително и се определят само от един параметър - активността на респондентите.
2.4 Вземане на проби от типични случаи
Единиците на общия агрегат са избрани със средно (типичен) знак. В този случай проблемът за избор на характеристика и определение на неговата типична стойност.

Курс на лекции по статистическа теория

Повече информация за селективните наблюдения може да бъде получена чрез гледане.

Селективно проучване.

Концепцията за селективен метод.

Селективно наблюдение - Това е такова нежелано наблюдение, при което се изборът на агрегираните единици, който трябва да бъде проучен, е случаен, избраната част е подложена на проучване, след което резултатите се прилагат за целия комплект.

Използването на метода на извадката е прибягно в случаи

1, когато самата наблюдение е свързана с увреждането или унищожаването на наблюдаваните единици (прежда за подправки, електрическата крушка на продукта за горене)

2 голямо количество агрегат

3 големи разходи (финансови и труд).

Обикновено 5-10% от цялата съвкупност е изложена на селективно изследване, по-рядко 15-25%.

Целта на селективното наблюдение е да се определят характеристиките на общата средна и общата фракция (P). Спецификации за селективни колекции - автомобили и селективната акция (W) се различава от първоначалните характеристики чрез стойността на грешката в извадката ( ). Следователно е необходимо да се изчисли грешката на извадката или грешката на представителността, която се определя от формулите, предназначени в теорията на вероятността за всеки вид вземане на проби и метода на подбор.

Има следните методи за избор на единици:

1 селекция според обратната топка, често се нарича повторно проба.

При повторно подбор, вероятността да се въведе всяка отделна единица остава постоянна, защото След избора на някаква единица, тя се връща отново към агрегата и може да бъде избран отново.

2 Селекция според схемата на невъзвръщаема топка, наречена извадка.В този случай, всяко избрано устройство не се връща назад, а вероятността от отделни звена в пробата се променя през цялото време (за останалите единици, което ще се увеличи) (Draw), случайни числа, например 75 от 780.

Видове проби.

1 Всъщност - случайно.

Това е така, в което изборът на единици в селективния комплект се прави директно от цялата маса на единиците на общото население.

В този случай броят на избраните единици обикновено се определя въз основа на приетия дял на извадката.

За пробата съществува съотношение на броя на единиците на селективния агрегат и към броя на единиците на общото селскостопански N.

Така с 5% проба от партида стоки през 2000 единици, броят на пробата п е 100 единици. (
), и с проба от 20%, тя ще бъде 400 единици.

(
)

Важно условие за случайна извадка Във факта, че всяка единица на общото население е предоставена на равни възможности за влизане в селективната цялост.

С случаен избор на грешка при избора за средата равен

- разпръскване на селективен агрегат

n-вземане на проби

коефициентът на доверие, който се определя от таблицата на стойностите на интегралната функция на Лапласа в дадена вероятност P.

С избор без избор, грешката за подбор се определя с формулата за средната стойност

където n е броят на общото население

За да се определи съдържанието на пепел в въглищата, произволната проба е изследвана 100 въглищни проби. В резултат на проучването е установено, че средното съдържание на въглища в извадката е 16%, \\ t \u003d 5%. В 10 проби, съдържанието на пепел в въглищата е\u003e 20% с вероятност от 0.954, за да се определят границите, при които средното съдържание на пепел в депозита и дела на въглища с съдържание на пепел\u003e 20%

Средна пещелка

определете грешката на лимита за избор

2*0.5=1%

при p \u003d 0.954 t \u003d 2

спектакъл на въглища с пепел ... 20%

определя се селективен дял

където m - дял от единици със знак

вземане на проби за грешка за акция

С вероятност от 0.954, може да се твърди, че делът на въглищата с капацитет на пепел повече от 20% в полето ще бъде в границите

P \u003d 10% + (-) 6% или

Механична проба.

Това е разнообразие от случайно случайно. В този случай, цялата обща популация е разделена на N равни части и след това една единица е избрана от всяка част.

Всички звена на населението трябва да бъдат разположени в определен ред. В същото време, по отношение на показателя, индикаторът на общата популация може да бъде поръчан от значима, вторична или неутрална основа. В същото време, единицата, която е в средата на всяка група, трябва да бъде избрана от всяка група. Това избягва систематична грешка в извадката.

Приложи: Когато преглеждате купувачи в магазини, посетители в клиники, на всеки 5.4.3 и т.н.

Примерна механична проба

За да се определи средният срок на употреба, краткосрочният заем в банката ще бъде произведен 5% механична извадка, в която 100 сметки са паднали. В резултат на проверката беше установено, че средното използване на краткосрочен заем от 30 дни
9 дни в 5 сметки Условия за ползване на заем\u003e 60 дни.

Грешка при вземане на проби

тези. С вероятността от 0.954 може да се твърди, че срокът на използване на кредита се колебае

1 в рамките на 30 дни. + (-) 2 дни, т.е.

2 акции на заеми със срок от 60 дни.

селективният дял ще бъде

определя се грешката на дела

с вероятност от 0.954, може да се твърди, че делът на кредитите в банката със срок на ползване на\u003e 60 ще бъде в рамките на границите

Типична извадка.

Общото население е разделено на хомогенни типични групи. След това, от всяка типична група, самоубег или механична проба, индивидуалният избор на единици се извършва в селективен комплект

Например: tr. служители, състоящи се от индивидуални квалификационни екипи.

Важна характеристика - дава по-точни резултати в сравнение с другите, защото В пробата участва типологично устройство.

Изборът на звено за наблюдение в селективния комплект се прави по различни методи. Помислете за типична извадка с пропорционална селекция в типичните групи.

Размерът на пробата от типичната група при избора на пропорционалния брой типични групи се определя по формулата

където \u003d V Проби от типичната група

\u003d V типична група.

Екстремна грешка на селективна среда и акция с неден случайност и механичен метод за избор в типични групи се изчислява по формули

където \u003d Разпръскване на селективен агрегат

Пример: Типична проба

За да се определят мъжете на средна възраст, които са женени, 5% проба с избора на единици е пропорционална на броя на типичните групи.

Вътрешни групи използваха механична селекция

С вероятност от 0.954 за определяне на границите, в които ще бъдат средна възраст Мъже, които са влезли в брак и делът на хората, които отново се омъжват.

средна възраст се жени за мъже в селективен агрегат

грешка при подбор

с вероятност от 0.954, може да се твърди, че средната възраст на мъжете, които се ожени за, ще бъдат разположени вътре

за мъже, които влизат във втория брак да бъдат вътре

определя се селективен дял

селективна дисперсия на алтернативна функция

с вероятност от 0.954, може да се твърди, че делът на брака е в рамките на втори път

Серийна проба.

В серийната проба комбинацията е разделена на една и съща група - серия. Селективният комплект се избира от серията. Вътре в серията се извършва непрекъснато наблюдение на единици в серия.

С невъзвръщаем избор и определят формулата

където
- Интерсионална дисперсия

където
селективна средна серия

селективно средно серийно вземане на проби

R - броя на поредица от общ агрегат

r - броя на избраните серии

Пример: Серийната извадка от 20% ще се извършва в семинара 10 на бригадите, за да се изследва производителността на труда, в която 2 бригади удариха. В резултат на проучването беше установено това

с вероятност от 0.997, възможно е да се идентифицират границите, в които ще бъде разположен средният производствен семинар.

селективната средна серийна проба се определя с формулата

с вероятност от 0.997, може да се твърди, че средното производство на работни срещи е вътре

В склада на готовите продукти, магазините са 200 кутии от 40 броя във всяко чекмедже. За да се тества качеството на готовите продукти, ще бъде произведена 10% серийна проба. В резултат на пробата е установено, че за дефектни части е 15%. Дисперсията на серийната проба е 0.0049.

С вероятност от 0.997, е възможно да се идентифицират лимитите, в които се намира делът на дефектните продукти в партидите

Делът на дефектните части ще бъде вътре

ние определяме грешката на лимита за избор за дела на формулата

с вероятност от 0.997, може да се твърди, че делът на дефектните части

в партията е вътре

В практиката на проектиране на селективно наблюдение необходимостта от намиране на броя на извадката, която е необходима, за да се осигури определена точност на изчисляване на общите характеристики - средна и дял.

Грешката за подбор, вероятността от външния му вид и вариацията на функцията е предварително известна.

Със случайно повторно селекция Размерът на пробата се определя с формулата

със случайна невержима и механична селекция

за типична проба

за серийна проба

Пример в района живее 2000 семейства.

Предполага се, че провежда своето изследване на извадката по метода на случайно не-реципрочен избор за намиране на средно семейство.

Определете необходимия брой проби, при условие че грешката за вземане на проби не надвишава 1 човек със средно квадратично отклонение на 3 души с вероятност 0.954.

В града живее 10 хиляди. семейства. С помощта на механична извадка се предлага да се определи фракцията на семействата с три деца и др. Какво трябва да бъде броят на вземането на проби, така че грешката на извадката да не надвишава 0.02, ако грешката за вземане на проби не надвишава 0.02, ако дисперсията е известна като 0.02 въз основа на предишни проучвания?

Х. , години (работен опит)	е. , хора (брой на служителите в извадката)	Х. и	Х. и е.