Populația generală și metoda de eșantionare. Estimarea pe intervale a cotei generale

Se întâmplă adesea că este necesar să se analizeze un anumit fenomen social și să se obțină informații despre acesta. Astfel de sarcini apar adesea în statistici și când studii statistice... Este adesea imposibil să se verifice un fenomen social complet definit. De exemplu, cum să afli opinia populației sau a tuturor locuitorilor unui anumit oraș cu privire la orice problemă? Întrebarea absolut tuturor este aproape imposibilă și foarte laborioasă. În astfel de cazuri, avem nevoie de un eșantion. Acesta este exact conceptul pe care se bazează aproape toate cercetările și analizele.

Ce este eșantionarea

Când se analizează un anumit fenomen social, este necesar să se obțină informații despre acesta. Dacă întreprindeți orice cercetare, veți observa că nu fiecare unitate din totalitatea obiectului de cercetare este supusă cercetării și analizei. Doar o anumită parte a întregului set este luată în considerare. Acest proces este un eșantionare: atunci când sunt examinate numai anumite unități dintr-un set.

Desigur, multe depind de tipul probei. Dar există și reguli de bază. Principala este că selecția din populație trebuie să fie complet aleatorie. Unitățile de populație care trebuie utilizate nu ar trebui selectate din cauza vreunui criteriu. Aproximativ vorbind, dacă este necesar să recrutezi o populație din populația unui anumit oraș și să selectezi doar bărbați, atunci va exista o eroare în studiu, deoarece selecția nu a fost efectuată întâmplător, ci a fost selectată în funcție de sex. Aproape toate metodele de eșantionare se bazează pe această regulă.

Reguli de eșantionare

Pentru ca populația selectată să reflecte calitățile de bază ale întregului fenomen, acesta trebuie construit conform legilor specifice, unde trebuie acordată atenția principală următoarelor categorii:

  • eșantion (populație eșantion);
  • populația generală;
  • reprezentativitate;
  • eroare de reprezentativitate;
  • unitate agregată;
  • metode de eșantionare.

Particularități observarea selectivăși eșantionarea sunt după cum urmează:

  1. Toate rezultatele obținute se bazează pe legi și reguli matematice, adică dacă cercetarea este efectuată corect și cu calcule corecte, rezultatele nu vor fi denaturate pe o bază subiectivă.
  2. Face posibilă obținerea unui rezultat mult mai rapid și cu mai puțin timp și resurse, studiind nu întreaga gamă de evenimente, ci doar o parte din ele.
  3. Poate fi folosit pentru a studia diverse obiecte: de la probleme specifice, de exemplu, vârsta, sexul grupului care ne interesează, până la studiu opinie publica sau nivelul de securitate materială a populației.

Observarea selectivă

Aceasta este selectivă observarea statistică, în care nu întregul agregat al celor studiate este supus cercetării, ci doar o anumită parte a acestuia, selectată într-un anumit mod, iar rezultatele studiului acestei părți sunt extinse la întregul agregat. Această parte se numește populație eșantion. Aceasta este singura modalitate de a studia o gamă largă de obiecte de cercetare.

Dar observarea selectivă poate fi utilizată numai în cazurile în care este necesar să se studieze doar un grup mic de unități. De exemplu, atunci când se studiază raportul dintre bărbați și femei din lume, se va utiliza eșantionul de observare. Din motive evidente, este imposibil să ținem cont de fiecare locuitor al planetei noastre.

Dar, cu același studiu, dar nu toți locuitorii pământului, ci o anumită clasă 2 „A” într-o anumită școală, un anumit oraș, o anumită țară, pot face fără o observație selectivă. La urma urmei, este foarte posibil să analizăm întreaga gamă a obiectului cercetării. Este necesar să se numere băieții și fetele din această clasă - acesta va fi raportul.

Eșantion și populație generală

De fapt, totul nu este atât de complicat pe cât pare. În orice obiect de studiu există două sisteme: populația generală și populația eșantion. Ce este? Toate unitățile sunt clasificate ca generale. Și pentru eșantion - acele unități ale populației generale care au fost luate pentru eșantion. Dacă totul este făcut corect, atunci partea selectată va constitui un model redus al întregii populații (generale).

Dacă vorbim despre populația generală, atunci putem distinge doar două dintre soiurile sale: o populație generală definită și nedeterminată. Depinde dacă numărul total de unități ale unui sistem dat este cunoscut sau nu. Dacă aceasta este o populație specifică, atunci eșantionarea va fi mai ușoară, deoarece se știe ce procent din numărul total de unități va fi eșantionat.

Acest punct este foarte necesar în cercetare. De exemplu, dacă doriți să investigați procentul de produse de cofetărie de proastă calitate la o anumită fabrică. Să presupunem că populația a fost deja determinată. Se știe cu siguranță că această întreprindere produce 1000 de produse de cofetărie pe an. Dacă realizăm un eșantion de 100 de produse de cofetărie aleatorii din această mie și le trimitem spre examinare, atunci eroarea va fi minimă. Aproximativ vorbind, 10% din toate produsele au fost supuse cercetării și, conform rezultatelor, putem, ținând cont de eroarea reprezentativității, să vorbim despre calitatea slabă a tuturor produselor.

Și dacă prelevăm 100 de produse de cofetărie dintr-o populație generală nedefinită, unde existau, de exemplu, 1 milion de unități, atunci rezultatul eșantionului și studiul în sine vor fi critic plauzibile și inexacte. Simți diferența? Prin urmare, certitudinea populației generale în cele mai multe cazuri este extrem de importantă și afectează foarte mult rezultatul studiului.

Reprezentativitatea populației

Deci, acum una dintre cele mai importante întrebări - care ar trebui să fie eșantionul? Acesta este cel mai important punct al studiului. În această etapă, este necesar să calculați eșantionul și să selectați unități din totalulîn el. Populația a fost selectată corect dacă anumite caracteristici și caracteristici ale populației generale rămân în eșantion. Aceasta se numește reprezentativitate.

Cu alte cuvinte, dacă, după selecție, o parte păstrează aceleași tendințe și caracteristici ca întreaga cantitate a persoanei investigate, atunci un astfel de set se numește reprezentativ. Dar nu fiecare eșantion poate fi selectat dintr-o populație reprezentativă. Există, de asemenea, astfel de obiecte de cercetare, al căror eșantion pur și simplu nu poate fi reprezentativ. Aici apare conceptul unei erori de reprezentativitate. Dar să vorbim despre asta mai în detaliu puțin mai mult.

Cum se face o mostră

Deci, pentru a maximiza reprezentativitatea, există trei reguli principale de eșantionare:


Eroare (eroare) de reprezentativitate

Principala caracteristică a calității eșantionului selectat este conceptul de „eroare de reprezentativitate”. Ce este? Acestea sunt anumite discrepanțe între indicatorii de observare selectivă și continuă. În ceea ce privește indicatorii de eroare, reprezentativitatea este împărțită în fiabil, normal și aproximativ. Cu alte cuvinte, sunt permise abateri de până la 3%, de la 3 la 10% și respectiv de la 10 la 20%. Deși în statistici este de dorit ca eroarea să nu depășească 5-6%. În caz contrar, există un motiv pentru a vorbi despre reprezentativitatea insuficientă a eșantionului. Mulți factori sunt luați în considerare pentru a calcula tendința reprezentativității și modul în care aceasta afectează un eșantion sau o populație generală:

  1. Probabilitatea cu care doriți să obțineți un rezultat precis.
  2. Numărul de unități din eșantion. După cum sa menționat mai devreme, cu cât eșantionul face mai puține unități, cu atât va fi mai mare eroarea de reprezentativitate și invers.
  3. Omogenitatea populației studiate. Cu cât populația este mai eterogenă, cu atât va fi mai mare eroarea de reprezentativitate. Capacitatea unui agregat de a fi reprezentativ depinde de omogenitatea tuturor unităților sale constitutive.
  4. Metoda de selectare a unităților pentru eșantion.

În studii specifice, procentul de eroare al mediei este de obicei determinat de cercetătorul însuși pe baza programului de observare și conform studiilor anterioare. De regulă, eroarea de eșantionare marginală acceptabilă (eroare de reprezentativitate) este considerată a fi cuprinsă între 3-5%.

Mai mare nu este întotdeauna mai bun

De asemenea, merită să ne amintim că principalul lucru în organizarea observației selective este de a aduce volumul său la un minim acceptabil. În același timp, nu trebuie să se străduiască o reducere excesivă a limitelor erorilor de eșantionare, deoarece aceasta poate duce la o creștere nejustificată a dimensiunii eșantionului și, în consecință, la o creștere a costului efectuării unui sondaj selectiv.

În același timp, este imposibil să crești excesiv dimensiunea erorii de reprezentativitate. Într-adevăr, în acest caz, deși va exista o scădere a dimensiunii populației eșantion, aceasta va duce la o deteriorare a fiabilității rezultatelor obținute.

Ce întrebări se adresează de obicei cercetătorului

Orice cercetare, dacă este efectuată, are un anumit scop și pentru a obține unele rezultate. Când se efectuează un eșantion de studiu, de regulă, se pun întrebările inițiale:


Metode de selectare a unităților de cercetare din eșantion

Nu fiecare eșantion este reprezentativ. Uneori, același semn este exprimat diferit în întreg și în partea sa. Pentru a îndeplini cerințele de reprezentativitate, este recomandabil să se utilizeze diverse tehnici de eșantionare. Mai mult, utilizarea uneia sau altei metode depinde de circumstanțele specifice. Aceste tehnici de eșantionare includ:

  • selectie aleatorie;
  • selecție mecanică;
  • selecție tipică;
  • selecție în serie (imbricată).

Eșantionarea aleatorie este un sistem de măsuri care vizează selectarea aleatorie a unităților populației, atunci când probabilitatea de a fi inclusă în eșantion este egală pentru toate unitățile populației generale. Se recomandă utilizarea acestei tehnici numai în cazul omogenității și al unui număr mic de caracteristici inerente. În caz contrar, unele dintre caracteristici riscă să nu fie reflectate în eșantion. Eșantionarea aleatorie se află în centrul tuturor celorlalte metode de eșantionare.

Cu selecția mecanică a unităților, se efectuează la un anumit interval. Dacă este necesar să se formeze un eșantion de infracțiuni specifice, fiecare carte 5, 10 sau 15 poate fi eliminată din toate înregistrările statistice ale infracțiunilor înregistrate, în funcție de numărul total al acestora și de dimensiunea eșantionului disponibil. Dezavantajul acestei metode este că, înainte de eșantionare, este necesar să aveți un cont complet al unităților populației, atunci este necesar să se efectueze un clasament și numai după aceea este posibil să se efectueze o eșantionare la un anumit interval . Această metodă consumă mult timp și, prin urmare, nu este adesea utilizată.

Selecția tipică (zonată) este un tip de eșantionare în care populația generală este împărțită în grupuri omogene în funcție de o anumită caracteristică. Uneori cercetătorii folosesc alți termeni în loc de „grupuri”: „zone” și „zone”. Apoi, un anumit număr de unități sunt selectate aleatoriu din fiecare grup proporțional cu greutatea specifică a grupului în populația totală. Selecția tipică este adesea efectuată în mai mulți pași.

Eșantionarea în serie este o metodă în care selectarea unităților se efectuează în grupuri (serie) și toate unitățile din grupul selectat (serie) sunt supuse examinării. Avantajul acestei metode este că uneori este mai dificil să selectezi unități individuale decât serii, de exemplu, atunci când studiezi o persoană care execută o pedeapsă. În districtele, zonele selectate, se aplică studiul tuturor unităților fără excepție, de exemplu, studiul tuturor persoanelor care execută o pedeapsă într-o anumită instituție.

Populația statistică- un set de unități cu masă, tipicitate, omogenitate calitativă și prezența variației.

Populația statistică constă din obiecte existente material (lucrători, întreprinderi, țări, regiuni), este un obiect.

Unitate agregată- fiecare unitate specifică a populației statistice.

Una și aceeași populație statistică poate fi omogenă într-un atribut și eterogenă în altul.

Uniformitate calitativă- similitudinea tuturor unităților agregatului dintr-un anumit motiv și diferența pentru toate celelalte.

Într-o populație statistică, diferențele dintre o unitate a populației și alta sunt adesea de natură cantitativă. Modificările cantitative ale valorilor unei caracteristici a diferitelor unități ale populației se numesc variație.

Variația unei caracteristici- o schimbare cantitativă a unei trăsături (pentru o trăsătură cantitativă) în timpul tranziției de la o unitate a populației la alta.

Semn este o proprietate, trăsătură caracteristică sau altă trăsătură a unităților, obiectelor și fenomenelor care pot fi observate sau măsurate. Semnele sunt împărțite în cantitativ și calitativ. Se numește varietatea și variabilitatea valorii trăsăturii în unități individuale ale populației variație.

Caracteristicile atributive (calitative) nu se pretează la exprimarea numerică (compoziția populației după sex). Caracteristicile cantitative sunt exprimate numeric (compoziția populației în funcție de vârstă).

Index- Aceasta este o caracteristică generalizatoare cantitativ calitativă a oricărei proprietăți a unităților sau a unui set de obiective în condiții specifice de timp și loc.

Scorecard Este un set de indicatori care reflectă în mod cuprinzător fenomenul studiat.

De exemplu, salariul este studiat:
  • Caracteristică - salarii
  • Populația statistică - toți angajații
  • Unitatea de populație - fiecare angajat
  • Omogenitate calitativă - salarii acumulate
  • Variația unui semn - o serie de numere

Populația generală și eșantion din aceasta

Baza este un set de date obținute ca urmare a măsurării uneia sau mai multor caracteristici. Setul de obiecte observat efectiv, reprezentat statistic de un număr de observații ale unei variabile aleatorii, este prelevarea de probe, și ipotetic existent (conjecturat) - populația generală... Populația generală poate fi finită (numărul de observații N = const) sau infinit ( N = ∞), iar un eșantion din populația generală este întotdeauna rezultatul unui număr limitat de observații. Numărul de observații care formează un eșantion este numit marime de mostra... Dacă dimensiunea eșantionului este suficient de mare ( n → ∞) eșantionul este luat în considerare mare altfel se numește eșantion volum limitat... Eșantionul este luat în considerare mic dacă, la măsurarea unei variabile aleatorii unidimensionale, dimensiunea eșantionului nu depășește 30 ( n<= 30 ), iar la măsurarea mai multor ( k) caracteristici în spațiul multidimensional, raportul n La k mai puțin decât 10 (n / k< 10) ... Eșantionul se formează intervalul de variație dacă membrii săi sunt statistici ordinale, adică valorile eșantionului unei variabile aleatorii NS sortate în ordine crescătoare (clasate), în timp ce valorile caracteristicii sunt numite Opțiuni.

Exemplu... Aproape același set de obiecte selectate aleatoriu - băncile comerciale ale unui district administrativ din Moscova, pot fi considerate ca un eșantion din populația generală a tuturor băncilor comerciale din acest district și ca un eșantion din populația generală a tuturor băncilor comerciale din Moscova , precum și un eșantion de la băncile comerciale ale țării etc.

Metode de eșantionare de bază

Fiabilitatea concluziilor statistice și interpretarea semnificativă a rezultatelor depind de reprezentativitate eșantionare, adică completitudinea și adecvarea reprezentării proprietăților populației generale, în raport cu care acest eșantion poate fi considerat reprezentativ. Studiul proprietăților statistice ale unei populații poate fi organizat în două moduri: folosind continuuși discontinuu. Observare continuă prevede o anchetă a tuturor unități studiat agregatul, A observarea discontinuă (selectivă)- doar părți din el.

Există cinci modalități principale de organizare a eșantionului de observare:

1. selecție aleatorie simplă, în care obiectele sunt extrase aleatoriu dintr-o populație generală de obiecte (de exemplu, folosind un tabel sau un generator de numere aleatorii), fiecare dintre probele posibile având probabilitate egală. Astfel de probe sunt numite aleatoriu propriu-zis;

2. selecție simplă folosind o procedură obișnuită se efectuează utilizând o componentă mecanică (de exemplu, data, ziua săptămânii, numărul apartamentului, litera alfabetului etc.) și probele obținute în acest mod se numesc mecanic;

3. stratificat selecția constă în faptul că populația generală a volumului este subdivizată în subseturi sau straturi (straturi) ale volumului astfel încât. Straturile sunt obiecte omogene în ceea ce privește caracteristicile statistice (de exemplu, populația este împărțită în straturi pe grupe de vârstă sau clasă socială; întreprinderi - după industrie). În acest caz, probele sunt numite stratificat(in caz contrar, stratificat, tipic, zonat);

4.metode serial selecția este folosită pentru a forma serial sau probe imbricate... Sunt convenabile dacă este necesar să se examineze imediat un „bloc” sau o serie de obiecte (de exemplu, un lot de mărfuri, produse dintr-o anumită serie sau populația din diviziunea administrativ teritorială a țării). Selecția loturilor poate fi efectuată într-un mod pur aleatoriu sau mecanic. În acest caz, se efectuează o anchetă completă a unui anumit lot de bunuri sau a unei întregi unități teritoriale (clădire rezidențială sau cartier);

5. combinate(în trepte) selecția poate combina mai multe metode de selecție simultan (de exemplu, stratificată și aleatorie sau aleatorie și mecanică); se numește un astfel de eșantion combinate.

Tipuri de selecție

De minte distinge între selecția individuală, de grup și combinată. La selecție individuală unitățile individuale ale populației generale sunt selectate în eșantion, cu selectarea grupului- grupuri (serii) de unități omogene calitativ și selecție combinată presupune o combinație a primului și celui de-al doilea tip.

De metodă selecție distinge repetate și nerepetate probă.

Irepetabil se apelează selecția, în care unitatea care a intrat în eșantion nu revine la populația inițială și nu participă la selecția ulterioară; în timp ce numărul de unități din populația generală N este redus în procesul de selecție. La repetat selecţie prinsîn eșantion, unitatea după înregistrare este returnată populației generale și, astfel, păstrează o șansă egală, împreună cu alte unități, de a fi utilizată în procedura de selecție ulterioară; în timp ce numărul de unități din populația generală N rămâne neschimbată (metoda este rar utilizată în cercetarea socio-economică). Cu toate acestea, cu un mare N (N → ∞) formule pentru irepetabil selecțiile se apropie de cele pentru repetat selecție și aproape mai des acestea din urmă sunt folosite ( N = const).

Principalele caracteristici ale parametrilor populației generale și ale eșantionului

Concluziile statistice ale studiului se bazează pe distribuția unei variabile aleatorii, în timp ce valorile observate (x 1, x 2, ..., x n) se numesc realizări ale variabilei aleatorii NS(n este dimensiunea eșantionului). Distribuția unei variabile aleatorii în populația generală este teoretică, ideală, iar analiza sa eșantion este empiric distribuție. Unele distribuții teoretice sunt date analitic, adică al lor Opțiuni determinați valoarea funcției de distribuție în fiecare punct din spațiul valorilor posibile ale variabilei aleatorii. Pentru un eșantion, funcția de distribuție este dificil de determinat și, prin urmare, uneori imposibilă Opțiuni estimate din date empirice și apoi sunt substituite într-o expresie analitică care descrie distribuția teoretică. În acest caz, presupunerea (sau ipoteză) despre tipul de distribuție poate fi atât statistic corect, cât și eronat. Dar, în orice caz, distribuția empirică reconstruită din eșantion doar o caracterizează aproximativ pe cea adevărată. Cei mai importanți parametri de distribuție sunt valorea estimatași varianță.

Prin natura lor, distribuțiile sunt continuuși discret... Cea mai cunoscută distribuție continuă este normal... Analogii selectivi ai parametrilor și pentru aceasta sunt: ​​valoarea medie și varianța empirică. Dintre cele discrete din cercetarea socio-economică, cele mai des utilizate alternativă (dihotomică) distribuție. Parametrul așteptării matematice a acestei distribuții exprimă valoarea relativă (sau acțiune) unități ale populației care au trăsătura studiată (este indicată printr-o scrisoare); proporția populației care nu are această caracteristică este notată cu litera q (q = 1 - p)... Varianța distribuției alternative are, de asemenea, un analog empiric.

Caracteristicile parametrilor de distribuție sunt calculate în moduri diferite în funcție de tipul de distribuție și de metoda de selectare a unităților populației. Cele principale pentru distribuțiile teoretice și empirice sunt date în tabel. 9.1.

Fracțiunea eșantionului k n este raportul dintre numărul de unități din eșantion și numărul de unități din populația generală:

k n = n / N.

Fracțiunea eșantionului w Este raportul unităților cu caracteristica studiată X la dimensiunea probei n:

w = n n / n.

Exemplu.Într-un lot de bunuri care conțin 1000 de unități, cu un eșantion de 5% fracțiunea eșantionului k nîn valoare absolută este de 50 de unități. (n = N * 0,05); dacă în acest eșantion se găsesc 2 produse defecte, atunci rata selectivă a deșeurilor w va fi 0,04 (w = 2/50 = 0,04 sau 4%).

Deoarece populația eșantion este diferită de populația generală, atunci erori de eșantionare.

Tabelul 9.1 Parametrii de bază ai populației generale și a eșantionului

Erori de eșantionare

Pentru orice erori (continue și selective) de două tipuri pot apărea: înregistrare și reprezentativitate. Erori înregistrare poate avea Aleatoriuși sistematic caracter. Aleatoriu erorile sunt alcătuite din mai multe cauze incontrolabile diferite, sunt neintenționate și, de obicei, se echilibrează reciproc în mod agregat (de exemplu, modificări ale citirilor instrumentelor în timpul fluctuațiilor de temperatură din cameră).

Sistematic erorile sunt tendențioase, deoarece încalcă regulile de selectare a obiectelor din eșantion (de exemplu, abateri la măsurători la schimbarea setării dispozitivului de măsurare).

Exemplu. Pentru a evalua statutul social al populației din oraș, este planificată examinarea a 25% din familii. Dacă, în același timp, alegerea fiecărui al patrulea apartament se bazează pe numărul său, atunci există pericolul de a selecta toate apartamentele de un singur tip (de exemplu, apartamente cu o cameră), ceea ce va oferi o eroare sistematică și va distorsiona rezultatele; alegerea numărului apartamentului prin lot este mai preferabilă, deoarece eroarea va fi accidentală.

Erori reprezentative sunt inerente doar observației selective, nu pot fi evitate și apar ca urmare a faptului că eșantionul nu reproduce pe deplin populația generală. Valorile indicatorilor obținuți din eșantion diferă de indicatorii acelorași valori din populația generală (sau obținuți prin observare continuă).

Eșantion de observare a erorii este diferența dintre valoarea parametrului în populația generală și valoarea eșantionului său. Pentru valoarea medie a unei caracteristici cantitative, este egală cu :, și pentru o cotă (caracteristică alternativă) -.

Erorile de eșantionare sunt caracteristice numai observațiilor eșantionului. Cu cât aceste erori sunt mai mari, cu atât distribuția empirică diferă de cea teoretică. Parametrii distribuției empirice sunt valori aleatorii, prin urmare, erorile de eșantionare sunt, de asemenea, valori aleatorii, pot lua valori diferite pentru diferite eșantioane și, prin urmare, este obișnuit să se calculeze eroare medie.

Eroare medie de eșantionare există o valoare care exprimă abaterea standard a mediei eșantionului față de așteptarea matematică. Această valoare, sub rezerva principiului selecției aleatorii, depinde în primul rând de dimensiunea eșantionului și de gradul de variație al caracteristicii: cu cât variația caracteristicii (și, prin urmare, valoarea) este mai mică și cu atât este mai mică valoarea eroare medie de eșantionare. Raportul dintre varianțele populației generale și ale eșantionului este exprimat prin formula:

acestea. pentru suficient de mare, putem presupune că. Eroarea medie de eșantionare arată posibilele abateri ale parametrului populației eșantion de la parametrul populației generale. Masa 9.2 arată expresii pentru calcularea erorii medii de eșantionare pentru diferite metode de organizare a observației.

Tabelul 9.2 Eroarea medie (m) a mediei și proporției eșantionului pentru diferite tipuri de eșantion

Unde este media varianțelor eșantionului intragrup pentru o caracteristică continuă;

Media diferențelor de acțiuni intra-grup;

- numărul de serii selectate, - numărul total de serii;

,

unde este media seriei a-a;

- media generală pentru întregul eșantion pentru o caracteristică continuă;

,

unde este ponderea caracteristicii din seria a;

- cota totală a funcției în întregul eșantion.

Cu toate acestea, valoarea erorii medii poate fi evaluată numai cu o anumită probabilitate P (P ≤ 1). Lyapunov A.M. a demonstrat că distribuția eșantionului înseamnă, și, prin urmare, abaterile acestora de la media generală, pentru un număr suficient de mare, respectă aproximativ legea distribuției normale, cu condiția ca populația generală să aibă o medie finită și o varianță limitată.

Matematic, această afirmație pentru medie este exprimată ca:

iar pentru fracție, expresia (1) va lua forma:

Unde - există eroare de eșantionare marginală, care este un multiplu al erorii medii de eșantionare , iar factorul multiplicității este testul Studentului („factorul de încredere”) propus de SUA. Gosset (alias „Student”); valorile pentru diferite dimensiuni ale eșantionului sunt stocate într-un tabel special.

Valorile funcției Ф (t) pentru unele valori ale lui t sunt egale:

Prin urmare, expresia (3) poate fi citită după cum urmează: cu probabilitate P = 0,683 (68,3%) se poate argumenta că diferența dintre eșantion și media generală nu va depăși o valoare a erorii medii m (t = 1), cu probabilitate P = 0,954 (95,4%)- că nu va depăși valoarea a două erori medii m (t = 2), cu probabilitate P = 0,997 (99,7%)- nu va depăși trei valori m (t = 3). Astfel, determină probabilitatea ca această diferență să depășească de trei ori valoarea erorii medii nivel de eroareși nu mai este 0,3% .

Masa 9.3 prezintă formulele pentru calcularea erorii de eșantionare marginală.

Tabelul 9.3 Eroare marginală (D) a eșantionului pentru medie și proporție (p) pentru diferite tipuri de observare a eșantionului

Distribuția rezultatelor eșantionului la populația generală

Scopul final al observării selective este de a caracteriza populația generală. Pentru dimensiuni mici de eșantion, estimările empirice ale parametrilor (și) se pot abate semnificativ de la valorile lor adevărate (și). Prin urmare, devine necesar să se stabilească limitele în care se află valorile adevărate (și) pentru valorile eșantionului parametrilor (și).

Interval de încredere al oricărui parametru θ al populației generale se numește un interval aleatoriu de valori ale acestui parametru, care cu o probabilitate apropiată de 1 ( fiabilitate) conține adevărata valoare a acestui parametru.

Eroare marginală prelevarea de probe Δ vă permite să determinați valorile limită ale caracteristicilor populației generale și ale acestora intervale de încredere care sunt egale:

Linia de fund interval de încredere obținută prin scădere eroare marginală din media eșantionului (share), iar cea superioară prin adăugarea acestuia.

Interval de încredere pentru medie, folosește eroarea de eșantionare marginală și pentru un anumit nivel de încredere este determinat de formula:

Aceasta înseamnă că, cu o probabilitate dată R, care se numește nivelul de încredere și este determinat în mod unic de valoare t, se poate argumenta că adevărata valoare a mediei se află în intervalul de la , iar adevărata valoare a fracției este în intervalul de la

La calcularea intervalului de încredere pentru trei niveluri standard de încredere P = 95%, P = 99% și P = 99,9% valoarea este selectată de. Aplicații în funcție de numărul de grade de libertate. Dacă dimensiunea eșantionului este suficient de mare, atunci valorile corespunzătoare acestor probabilități t sunt egale: 1,96, 2,58 și 3,29 ... Astfel, eroarea de eșantionare marginală face posibilă determinarea valorilor limitative ale caracteristicilor populației generale și a intervalelor de încredere ale acestora:

Distribuția rezultatelor observației selective către populația generală în cercetarea socio-economică are propriile sale caracteristici, deoarece necesită completitudinea reprezentativității tuturor tipurilor și grupurilor sale. Baza posibilității unei astfel de distribuții este calculul eroare relativă:

Unde Δ % - eroare relativă de eșantionare marginală; ,.

Există două metode principale de extindere a observației prin eșantion la populația generală: conversia directă și metoda coeficienților.

Esenta conversie directă constă în multiplicarea eșantionului mediu !! \ overline (x) cu dimensiunea populației generale.

Exemplu... Să se estimeze numărul mediu de copii mici din oraș printr-o metodă de eșantionare și să fie o persoană. Dacă există 1000 de familii tinere în oraș, atunci numărul locurilor necesare în creșele municipale se obține înmulțind această medie cu dimensiunea populației generale N = 1000, adică se va ridica la 1200 de locuri.

Metoda cotelor se recomandă utilizarea în cazul în care se efectuează observarea selectivă pentru a clarifica datele de observare continuă.

În acest caz, se folosește formula:

unde toate variabilele sunt dimensiunea populației:

Dimensiunea eșantionului necesar

Tabelul 9.4 Dimensiunea eșantionului necesar (n) pentru diferite tipuri de organizare a observării eșantionului

Atunci când planificați o observare a eșantionului cu o valoare prestabilită a erorii de eșantionare admisibile, este necesar să estimați corect necesarul marime de mostra... Acest volum poate fi determinat pe baza erorii admisibile într-un eșantion de observație pe baza unei probabilități date care garantează valoarea admisibilă a nivelului de eroare (luând în considerare modul de organizare a observației). Formulele pentru determinarea dimensiunii necesare a eșantionului n sunt ușor de obținut direct din formulele pentru eroarea de eșantionare marginală. Deci, din expresia erorii marginale:

mărimea eșantionului este determinată direct n:

Această formulă arată că, cu o eroare de eșantionare marginală în scădere Δ mărimea eșantionului necesar crește semnificativ, ceea ce este proporțional cu varianța și pătratul testului Studentului.

Pentru o metodă specifică de organizare a observației, dimensiunea eșantionului necesar este calculată în conformitate cu formulele date în tabel. 9.4.

Exemple practice de calcul

Exemplul 1. Calculul mediei și al intervalului de încredere pentru o caracteristică cantitativă continuă.

Pentru a evalua rapiditatea decontării cu creditorii, banca a efectuat un eșantion aleatoriu de 10 documente de plată. Valorile lor s-au dovedit a fi egale (în zile): 10; 3; 15; 15; 22; 7; opt; 1; 19; douăzeci.

Necesar cu probabilitate P = 0,954 determina eroarea marginală Δ eșantionul mediu și limitele de încredere pentru timpul mediu al calculelor.

Soluţie. Valoarea medie se calculează utilizând formula din tabel. 9.1 pentru un eșantion

Varianța este calculată prin formula din tabel. 9.1.

Eroarea medie pătrată a zilei.

Eroarea medie este calculată prin formula:

acestea. media este x ± m = 12,0 ± 2,3 zile.

Fiabilitatea medie a fost

Eroarea limitativă este calculată prin formula din tabel. 9.3 pentru re-eșantionare, deoarece dimensiunea populației este necunoscută și pentru P = 0,954 nivel de încredere.

Astfel, valoarea medie este egală cu `x ± D =` x ± 2m = 12,0 ± 4,6, adică valoarea sa reală variază între 7,4 și 16,6 zile.

Folosind masa Studentului. Aplicația ne permite să concluzionăm că pentru n = 10 - 1 = 9 grade de libertate, valoarea obținută este fiabilă cu un nivel de semnificație de 0,001 GBP, adică valoarea medie obținută este semnificativ diferită de 0.

Exemplul 2. Estimarea probabilității (ponderea generală) p.

Cu o metodă de eșantionare mecanică de supraveghere a statutului social a 1000 de familii, s-a dezvăluit că ponderea familiilor cu venituri mici era w = 0,3 (30%)(proba a fost 2% , adică n / N = 0,02). Necesar cu un nivel de încredere p = 0,997 determina indicatorul R familii cu venituri mici din întreaga regiune.

Soluţie. Conform valorilor prezentate ale funcției Ф (t) găsiți pentru un anumit nivel de încredere P = 0,997 sens t = 3(vezi formula 3). Eroare partajare marginală w determinată de formula din tabel. 9.3 pentru eșantionarea non-repetitivă (eșantionarea mecanică este întotdeauna non-repetitivă):

Eroarea relativă de eșantionare relativă în % va fi:

Probabilitatea (ponderea generală) a familiilor cu venituri mici din regiune va fi p = w ± Δ w, iar limitele de încredere p sunt calculate pe baza dublei inegalități:

w - Δ w ≤ p ≤ w - Δ w, adică adevărata valoare a lui p se află în:

0,3 — 0,014 < p <0,3 + 0,014, а именно от 28,6% до 31,4%.

Astfel, cu o probabilitate de 0,997, se poate argumenta că ponderea familiilor cu venituri mici dintre toate familiile din regiune variază de la 28,6% la 31,4%.

Exemplul 3. Calculul mediei și al intervalului de încredere pentru o caracteristică discretă specificată de o serie de intervale.

Masa 9.5. se dă distribuirea comenzilor pentru producerea comenzilor în momentul îndeplinirii acestora de către întreprindere.

Tabelul 9.5 Distribuția observațiilor în funcție de momentul apariției

Soluţie. Timpul mediu de executare a comenzii este calculat prin formula:

Perioada medie va fi:

= (3 * 20 + 9 * 80 + 24 * 60 + 48 * 20 + 72 * 20) / 200 = 23,1 luni.

Primim același răspuns dacă folosim datele de pe p i din penultima coloană a tabelului. 9.5 folosind formula:

Rețineți că mijlocul intervalului pentru ultima gradație se găsește completându-l artificial cu lățimea intervalului gradației anterioare egal cu 60 - 36 = 24 de luni.

Varianța este calculată prin formulă

Unde x i- mijlocul rândului de intervale.

Prin urmare !! \ sigma = \ frac (20 ^ 2 + 14 ^ 2 + 1 + 25 ^ 2 + 49 ^ 2) (4), iar rădăcina înseamnă eroare pătrată.

Eroarea medie este calculată utilizând formula lunii, adică media este !! \ overline (x) ± m = 23,1 ± 13,4.

Eroarea limitativă este calculată prin formula din tabel. 9.3 pentru re-eșantionare, deoarece dimensiunea populației este necunoscută, pentru un nivel de încredere de 0,954:

Deci media este:

acestea. valoarea sa reală variază de la 0 la 50 de luni.

Exemplul 4. Pentru a determina viteza decontărilor cu creditorii a N = 500 de întreprinderi ale unei corporații într-o bancă comercială, este necesar să se efectueze un studiu eșantion prin metoda selecției aleatorii nerepuse. Determinați dimensiunea necesară a eșantionului n astfel încât, cu o probabilitate de P = 0,954, eroarea eșantionului mediu să nu depășească 3 zile, dacă estimările studiului au arătat că abaterea standard s a fost de 10 zile.

Soluţie... Pentru a determina numărul de studii necesare n, vom folosi formula pentru selecția repetată din tabel. 9.4:

În ea, valoarea lui t este determinată de la nivelul de încredere P = 0,954. Este egal cu 2. Pătratul rădăcinii medii s = 10, dimensiunea populației generale este N = 500, iar eroarea marginală a mediei este Δ x = 3. Înlocuind aceste valori în formulă, obținem:

acestea. este suficient să se facă un eșantion de 41 de întreprinderi pentru a estima parametrul necesar - viteza decontărilor cu creditorii.

Observarea selectivă se aplică atunci când se aplică supravegherea continuă imposibil din punct de vedere fizic datorită unei cantități mari de date sau impracticabil economic... Imposibilitatea fizică apare, de exemplu, atunci când se studiază fluxurile de pasageri, prețurile pieței, bugetele familiei. Inexpediența economică apare atunci când se evaluează calitatea mărfurilor asociate cu distrugerea lor, de exemplu, degustarea, testarea cărămizilor pentru rezistență etc.

Unitățile statistice selectate pentru observare sunt populația eșantion sau prelevarea de probe, și întreaga lor matrice este populația generală(HS). Unde numărul de unități din eșantion denota n, și în întregul SA - N... Atitudine n / N numit mărime relativă sau rata simpla.

Calitatea rezultatelor observării selective depinde de reprezentativitatea eșantionului, adică cu privire la cât de reprezentativ este în HS. Pentru a asigura reprezentativitatea eșantionului, este necesar să se respecte selectarea aleatorie a unităților, care presupune că includerea unei unități HS în eșantion nu poate fi influențată de alt factor decât caz.

Exista 4 moduri de selectare aleatorie la eșantion:

  1. De fapt întâmplător selecția sau „metoda lotului”, atunci când cantităților statistice li se atribuie numere de serie, introduse pe anumite articole (de exemplu, butoaie), care sunt apoi amestecate într-un container (de exemplu, într-o pungă) și alese la întâmplare. În practică, această metodă se realizează folosind un generator de numere aleatorii sau tabele matematice ale numerelor aleatorii.
  2. Mecanic selecție, în funcție de care fiecare ( N / n) -a valoare a populației generale. De exemplu, dacă conține 100.000 de valori și doriți să selectați 1.000, atunci fiecare valoare 100.000 / 1000 = 100 va fi inclusă în eșantion. Mai mult, dacă nu sunt clasate, atunci primul este ales la întâmplare din prima sută, iar numerele celorlalte vor fi cu încă o sută. De exemplu, dacă unitatea # 19 s-a dovedit a fi prima, atunci următoarea ar trebui să fie # 119, apoi # 219, apoi # 319 și așa mai departe. Dacă unitățile populației generale sunt clasificate, atunci se selectează mai întâi # 50, apoi # 150, apoi # 250 și așa mai departe.
  3. Se efectuează selectarea valorilor dintr-un set de date eterogen stratificat mod (stratificat), atunci când populația generală este pre-împărțită în grupuri omogene, cărora li se aplică selecția aleatorie sau mecanică.
  4. Un mod special de eșantionare este serial selecție, în care nu sunt selectate aleatoriu sau mecanic cantități individuale, ci seria lor (secvențe de la un număr la altul la rând), în cadrul căreia se efectuează observarea continuă.

De calitatea observațiilor eșantionului depinde, de asemenea tip de eșantion: repetat sau irepetabil.
La re-selectare Cantitățile statistice care au intrat în eșantion sau seria lor după utilizare sunt returnate populației generale, având șansa de a intra într-un eșantion nou. Mai mult, toate valorile populației generale au aceeași probabilitate de a fi incluse în eșantion.
Selecție fără repetareînseamnă că cantitățile statistice incluse în eșantion sau seria lor după utilizare nu sunt returnate populației generale și, prin urmare, pentru cantitățile rămase din aceasta din urmă, probabilitatea de a intra în eșantionul următor crește.

Eșantionarea repetată oferă rezultate mai precise, prin urmare, este utilizată mai des. Dar există situații în care acesta nu poate fi aplicat (studiul fluxurilor de pasageri, cererea consumatorilor etc.) și apoi se efectuează o re-selectare.

Erori de eșantionare

Eșantionul poate fi format în funcție de caracteristica cantitativă a valorilor statistice, precum și alternativă sau atributivă. În primul caz, caracteristica generalizantă a eșantionului este cantitatea notată, iar în al doilea - cota eșantionului cantități indicate w... În populația generală, respectiv: media generalăși cota generală a p.

Diferențe - și WR sunt numite Eroare de eșantionare care este divizibil cu eroare de înregistrareși eroare de reprezentativitate... Prima parte a erorii de eșantionare provine din informații incorecte sau inexacte datorită lipsei de înțelegere a esenței problemei, neatenției registratorului la completarea chestionarelor, formularelor etc. Este destul de ușor de detectat și eliminat. A doua parte a erorii apare din nerespectarea constantă sau spontană a principiului selecției aleatorii. Este dificil de detectat și eliminat, este mult mai mare decât primul și, prin urmare, este centrul principal al atenției.

Mărimea erorii de eșantionare poate fi diferită pentru diferite eșantioane din aceeași populație generală, prin urmare, în statistici, se determină eroare medie de eșantionare și neeșantionare după formulele:

Repetat;

- irepetabil;

Unde Dw este varianța eșantionului.

De exemplu, la o fabrică cu 1000 de angajați. a fost efectuată o eșantionare aleatorie non-repetitivă pentru a determina durata medie a serviciilor angajaților. Rezultatele unui eșantion de observație sunt prezentate în primele două coloane din următorul tabel:

X , ani
(experiență de muncă)

f , oameni
(numărul de angajați din eșantion)

X și

X și f

În a 3-a coloană, punctele medii ale intervalelor X sunt determinate (ca jumătate a limitelor inferioare și superioare ale intervalului), iar în a 4-a coloană - produsele lui X Și f pentru a găsi media eșantionului în funcție de la formula mediei ponderate aritmetice:

143,0 / 50 = 2,86 (ani).

Să calculăm varianța ponderată a eșantionului:
= 105,520/50 = 2,110.

Acum să găsim eroarea medie a non-eșantionării:
= 0,200 (ani).

Din formulele pentru erorile medii de eșantionare, se poate observa că eroarea este mai mică la eșantionarea non-repetitivă și, așa cum sa dovedit în teoria probabilității, apare cu o probabilitate de 0,683 (adică dacă se iau 1000 de eșantioane dintr-o populație generală, atunci în 683 dintre ei eroarea nu va depăși eroarea medie de eșantionare). Această probabilitate (0,683) este mică, prin urmare nu este foarte potrivită pentru calcule practice, unde este necesară o probabilitate mai mare. Pentru a determina eroarea de eșantionare cu o probabilitate mai mare de 0,683, calculați eroare de eșantionare marginală:

Unde t- coeficientul de încredere, în funcție de probabilitatea cu care se determină eroarea de eșantionare marginală.

Valori ale coeficientului de încredere t calculate pentru diferite probabilități și sunt disponibile în tabele speciale (integrala Laplace), dintre care următoarele combinații sunt utilizate pe scară largă în statistici:

Probabilitate 0,683 0,866 0,950 0,954 0,988 0,990 0,997 0,999
t 1 1,5 1,96 2 2,5 2,58 3 3,5

După ce ați stabilit un anumit nivel de probabilitate, alegeți din tabel valoarea corespunzătoare tși determinați eroarea de eșantionare marginală prin formulă.
În acest caz, cel mai des folosit = 0,95 și t= 1,96, adică se crede că, cu o probabilitate de 95%, eroarea de eșantionare marginală este de 1,96 ori mai mare decât media. Această probabilitate (0,95) este luată în considerare standardși este utilizat implicit în calcule.

În al nostru, definim eroarea de eșantionare marginală la probabilitatea standard de 95% (din preluarea t= 1,96 pentru 95% probabilitate): = 1,96 * 0,200 = 0,392 (ani).

După calcularea erorii de limitare, găsiți interval de încredere al caracteristicilor generalizatoare ale populației generale... Un astfel de interval pentru media generală are forma
Adică, durata medie a serviciilor angajaților la întreaga fabrică este cuprinsă între 2.468 și 3.252 de ani.

Determinarea mărimii eșantionului

Când se dezvoltă un program de observare selectivă, uneori li se dă o valoare specifică a erorii marginale cu un nivel de probabilitate. Dimensiunea minimă a eșantionului care oferă precizia specificată rămâne necunoscută. Poate fi obținut din formulele pentru erorile medii și marginale în funcție de tipul probei. Deci, înlocuind atât în, cât și rezolvându-l în funcție de dimensiunea eșantionului, obținem următoarele formule:
pentru eșantionare n =
pentru eșantionarea non-replicată n = .

În plus, pentru cantitățile statistice cu caracteristici cantitative, este necesar să se cunoască varianța eșantionului, dar nici la începutul calculelor nu se știe. Prin urmare, este acceptat aproximativ una dintre următoarele căi(în ordine de prioritate):

Când se studiază caracteristicile nenumerice, chiar dacă nu există informații aproximative despre fracțiunea eșantionului, se iau w= 0,5, care, conform formulei pentru varianța cotei, corespunde varianței eșantionului în mărimea maximă Dv = 0,5*(1-0,5) = 0,25.

Numărul total de obiecte de observație (oameni, gospodării, întreprinderi, așezări etc.) cu un anumit set de caracteristici (sex, vârstă, venit, număr, cifră de afaceri etc.), limitat în spațiu și timp. Exemple de populații

  • Toți locuitorii Moscovei (10,6 milioane de persoane conform recensământului din 2002)
  • Bărbați moscoviți (4,9 milioane de persoane conform recensământului din 2002)
  • Persoane juridice din Rusia (2,2 milioane la începutul anului 2005)
  • Puncte de vânzare cu amănuntul care vând alimente (20 mii la începutul anului 2008) etc.

Eșantion (Eșantion Populație)

O parte din obiectele din populația generală selectate pentru studiu pentru a face o concluzie despre întreaga populație generală. Pentru ca concluzia obținută prin examinarea eșantionului să fie extinsă la întreaga populație generală, eșantionul trebuie să aibă proprietatea reprezentativității.

Reprezentativitatea eșantionului

Proprietatea unui eșantion de a reflecta corect populația generală. Același eșantion poate fi reprezentativ și nereprezentativ pentru diferite populații.
Exemplu:

  • Eșantionul alcătuit în totalitate din moscoviții care dețin o mașină nu reprezintă întreaga populație din Moscova.
  • Eșantionul întreprinderilor rusești în număr de până la 100 de persoane nu reprezintă toate întreprinderile din Rusia.
  • Eșantionul de moscoviți care efectuează achiziții pe piață nu reprezintă comportamentul de cumpărare al tuturor moscoviților.

În același timp, aceste eșantioane (supuse altor condiții) pot reprezenta perfect proprietarii de moscoviți, întreprinderile mici și mijlocii rusești, respectiv cumpărătorii care fac cumpărături pe piețe.
Este important să înțelegem că reprezentativitatea eșantionului și eroarea de eșantionare sunt fenomene diferite. Reprezentativitatea, spre deosebire de eroare, nu depinde în niciun fel de mărimea eșantionului.
Exemplu:
Indiferent cum am crește numărul de proprietari de moscoviți chestionați, nu vom putea reprezenta toți moscoviții cu acest eșantion.

Eroare de eșantionare (interval de încredere)

Abaterea rezultatelor obținute folosind observația selectivă din datele reale ale populației generale.
Eroarea de eșantionare este de două tipuri - statistică și sistematică. Eroarea statistică depinde de mărimea eșantionului. Cu cât eșantionul este mai mare, cu atât este mai mic.
Exemplu:
Pentru un eșantion simplu aleatoriu de 400 de unități, eroarea statistică maximă (cu un nivel de încredere de 95%) este de 5%, pentru un eșantion de 600 de unități - 4%, pentru un eșantion de 1100 de unități - 3% De obicei, atunci când oamenii vorbesc despre eroare de eșantionare, înseamnă eroarea statistică ...
Tendința depinde de diferiți factori care au un impact permanent asupra studiului și influențează rezultatele studiului într-o anumită direcție.
Exemplu:

  • Folosirea oricărui eșantion de probabilitate subestimează proporția persoanelor cu venituri mari cu stiluri de viață active. Acest lucru se întâmplă datorită faptului că astfel de oameni sunt mult mai greu de găsit în orice loc specific (de exemplu, acasă).
  • Problema respondenților care refuză să răspundă la întrebări (ponderea „refuseniks” la Moscova, pentru diferite sondaje, variază de la 50% la 80%)

În unele cazuri, când sunt cunoscute distribuțiile adevărate, prejudecata poate fi neutralizată prin introducerea cotelor sau re-ponderarea datelor, dar în majoritatea studiilor reale poate fi destul de problematic chiar să o estimăm.

Tipuri de probe

Probele sunt împărțite în două tipuri:

  • probabilistică
  • improbabil

1. Probele de probabilitate
1.1 Eșantionare aleatorie (eșantionare simplă)
Un astfel de eșantion presupune omogenitatea populației generale, aceeași probabilitate de disponibilitate a tuturor elementelor, prezența unei liste complete a tuturor elementelor. La selectarea elementelor, de regulă, se folosește un tabel de numere aleatorii.
1.2 Prelevare mecanică (sistematică)
Un fel de probă aleatorie, ordonată după un anumit criteriu (ordine alfabetică, număr de telefon, data nașterii etc.). Primul element este selectat aleatoriu, apoi, în trepte de „n”, fiecare element „k’th este selectat. Mărimea populației generale, în timp ce - N = n * k
1.3 Stratificat (zonat)
Se folosește în caz de eterogenitate a populației generale. Populația generală este împărțită în grupuri (straturi). În fiecare strat, selecția se efectuează aleator sau mecanic.
1.4 Eșantionare în serie (imbricată sau grupată)
În eșantionarea în serie, unitățile de selecție nu sunt obiectele în sine, ci grupuri (clustere sau cuiburi). Grupurile sunt selectate aleatoriu. Obiectele din cadrul grupurilor sunt analizate solid.

2 eșantionare improbabilă
Selecția într-un astfel de eșantion se efectuează nu conform principiilor aleatoriei, ci în funcție de criterii subiective - disponibilitate, tipicitate, reprezentare egală etc.
2.1. Eșantionarea cotelor
Inițial, se alocă un anumit număr de grupuri de obiecte (de exemplu, bărbați cu vârste cuprinse între 20-30 ani, 31-45 ani și 46-60 ani; persoane cu un venit de până la 30 mii ruble, cu un venit de 30 la 60 de mii de ruble și cu un venit de peste 60 de mii de ruble) Pentru fiecare grup, este stabilit numărul de obiecte care trebuie examinate. Numărul de obiecte care ar trebui să se încadreze în fiecare dintre grupuri este stabilit, cel mai adesea, fie proporțional cu ponderea cunoscută anterior a grupului în populația generală, fie aceeași pentru fiecare grup. În cadrul grupurilor, obiectele sunt selectate aleatoriu. Probele de cote sunt utilizate destul de des.
2.2. Metoda ghiocelului
Proba este construită după cum urmează. Fiecare respondent, începând cu primul, este solicitat contactele prietenilor, colegilor, cunoscuților săi care să se potrivească condițiilor de selecție și ar putea lua parte la studiu. Astfel, cu excepția primului pas, eșantionul este format cu participarea obiectelor de cercetare în sine. Metoda este adesea utilizată atunci când este necesar să se găsească și să se intervieveze grupuri de respondenți greu accesibile (de exemplu, respondenți cu venituri mari, respondenți aparținând aceluiași grup profesional, respondenți cu orice hobby / hobby similar etc.)
2.3 Eșantionare spontană
Sunt intervievați cei mai accesibili respondenți. Exemple tipice de eșantionare spontană se găsesc în ziare / reviste, date respondenților pentru completare personală, majoritatea sondajelor pe internet. Mărimea și compoziția probelor spontane nu sunt cunoscute în prealabil și sunt determinate de un singur parametru - activitatea respondenților.
2.4 Eșantion de cazuri tipice
Sunt selectate unități ale populației generale care au valoarea medie (tipică) a trăsăturii. Acest lucru ridică problema alegerii unei caracteristici și determinării valorii sale tipice.

Curs de prelegeri despre teoria statisticii

Informații mai detaliate despre eșantionul de observații pot fi obținute prin vizionare.

Studiu selectiv.

Conceptul unei metode de eșantionare.

Observarea selectivă- aceasta este o astfel de observație discontinuă în care selecția unităților populației care urmează a fi investigată se efectuează aleatoriu, partea selectată este supusă cercetării, după care rezultatele sunt extinse la întreaga populație.

În aceste cazuri se recurge la utilizarea metodei de eșantionare

1 când observația în sine este asociată cu deteriorarea sau distrugerea unităților observate (fire pentru condimente, bec pentru produsul de ardere)

2 dimensiuni mari ale populației

3 costuri mari (financiare și de muncă).

De obicei, 5-10% din populația totală este supusă unui sondaj de sondaj, mai rar 15-25%.

Scopul observației prin eșantion este de a determina caracteristicile mediei generale și cotei generale (P). Caracteristicile eșantionului - media eșantionului iar fracțiunea eșantionului (w) diferă de caracteristicile generale prin valoarea erorii de eșantionare ( ). Prin urmare, este necesar să se calculeze eroarea de eșantionare sau eroarea de reprezentativitate, care este determinată de formulele dezvoltate în teoria probabilității pentru fiecare tip de eșantionare și metodă de selecție.

Există următoarele modalități de selectare a unităților:

1 Selecția mingii returnate, denumită în mod obișnuit resamplarea.

Cu eșantionarea repetată, probabilitatea ca fiecare unitate individuală să fie inclusă în eșantion rămâne constantă, deoarece după selectarea unei unități, aceasta revine din nou la totalitate și poate fi selectată din nou.

2 selecție conform schemei unei mingi nereturnate, numită prelevare de probe nerepetată.În acest caz, fiecare unitate selectată nu revine, iar probabilitatea ca unități individuale să cadă în eșantion se schimbă tot timpul (pentru unitățile rămase va crește) (extrageți), tabele cu numere aleatorii, de exemplu, 75 din 780.

Tipuri de probe.

1 De fapt - aleatoriu.

Acesta este unul în care selecția unităților dintr-un eșantion de populație se face direct din întreaga masă de unități din populația generală.

În acest caz, numărul de unități selectate este de obicei determinat pe baza proporției acceptate a eșantionului.

Pentru un eșantion, există raportul dintre numărul de unități din eșantion și numărul de unități din populația generală N.

Astfel, cu un eșantion de 5% dintr-un lot de mărfuri de 2000 de unități, dimensiunea eșantionului n este de 100 de unități. (
), și cu un eșantion de 20%, acesta va fi de 400 de unități.

(
)

O condiție importantă pentru eșantionarea corectă aleatorie prin faptul că fiecărei unități a populației generale i se oferă o șansă egală de a intra în eșantion.

În cazul selecției aleatorii, eroarea de eșantionare marginală pentru medie este egal cu

- varianța eșantionului

n- dimensiunea probei

t este coeficientul de încredere, care este determinat din tabelul valorilor funcției integrale Laplace pentru o probabilitate dată P.

În cazul eșantionării non-repetitive, eroarea de eșantionare marginală este determinată de formula pentru medie

unde N este numărul populației generale a ponderii

Pentru a determina conținutul de cenușă al cărbunelui, 100 de probe de cărbune au fost examinate într-o probă aleatorie. Ca rezultat al sondajului, sa constatat că conținutul mediu de cenușă din cărbune din eșantion este de 16%, = 5%. În 10 eșantioane, conținutul de cenușă al cărbunelui a fost> 20% cu o probabilitate de 0,954 pentru a determina limitele în care conținutul mediu de cenușă al cărbunelui din zăcământ și cota de cărbune cu conținut de cenușă> 20% va fi

Conținut mediu de cenușă

determinați eroarea de eșantionare marginală


2*0.5=1%

la p = 0,954 t = 2

cota de cărbune cu conținut de cenușă> 20%

se determină ponderea eșantionului

unde m este proporția unităților cu caracteristica

eroare de eșantionare pentru fracțiune

Cu o probabilitate de 0,954, se poate argumenta că ponderea cărbunelui cu un conținut de cenușă mai mare de 20% în depozit va fi în

P = 10% + (-) 6% sau

Prelevare mecanică.

Acest tip este de fapt aleatoriu. În acest caz, întreaga populație generală este împărțită în n părți egale și apoi este selectată o unitate din fiecare parte.

Toate unitățile populației generale ar trebui să fie aranjate într-o anumită ordine. În același timp, în raport cu indicatorul studiat, unitățile populației generale pot fi ordonate după un criteriu esențial, secundar sau neutru. În acest caz, unitatea care se află în mijlocul fiecărui grup ar trebui selectată din fiecare grup. Acest lucru evită părtinirea eșantionării.

Aplicați: atunci când examinați cumpărătorii din magazine, vizitatorii din clinici, fiecare 5,4,3 etc.

Exemplu de eșantionare mecanică

Pentru a determina termenul mediu pentru utilizarea unui împrumut pe termen scurt în bancă, se va face un eșantion mecanic de 5%, care include 100 de conturi. Ca rezultat al sondajului, sa constatat că termenul mediu pentru utilizarea unui împrumut pe termen scurt este de 30 de zile la
9 zile în 5 conturi, termenul de utilizare a împrumutului este> 60 de zile.

Eroare de eșantionare

acestea. cu o probabilitate de 0,954, se poate argumenta că durata împrumutului fluctuează

1 în 30 de zile + (-) 2 zile, adică

2 acțiuni de împrumuturi cu scadență> 60 de zile.

ponderea eșantionului va fi

este determinată eroarea de partajare

cu o probabilitate de 0,954, se poate argumenta că ponderea împrumuturilor în bancă cu un termen de> 60 de zile va fi în

Eșantion tipic.

Populația generală este împărțită în grupuri tipice omogene. Apoi, din fiecare grup tipic, prin eșantionare adecvată aleatorie sau mecanică, se face o selecție individuală de unități în populația eșantionului.

De exemplu: pr. Tr. lucrători, constând din grupe separate de calificări.

Caracteristică importantă- oferă rezultate mai precise în comparație cu altele, deoarece o unitate tipologică participă la eșantion.

Selecția unităților de observare în populația eșantion se face prin diferite metode. Luați în considerare o eșantionare proporțională tipică într-un grup tipic.

Mărimea eșantionului dintr-un grup tipic la selectarea proporțională cu numărul de grupuri tipice este determinată de formulă

Unde = Eșantioane V dintr-un grup tipic

= V grup tipic.

Eroarea marginală a mediei și proporției eșantionului pentru o metodă de selecție aleatorie și mecanică nerepetabilă în cadrul grupurilor tipice este calculată prin formule


Unde = varianța eșantionului

Exemplu: eșantion tipic

Pentru a determina vârsta medie a bărbaților care intră în căsătorie, a fost realizat un eșantion de 5% în district, cu selectarea unităților proporțional cu numărul grupurilor tipice.

Selecția mecanică a fost utilizată în cadrul grupurilor

Cu o probabilitate de 0,954, determinați limitele în care varsta medie bărbații care s-au căsătorit și proporția bărbaților care s-au căsătorit din nou.

vârsta medie a bărbaților din eșantion se căsătoresc

eroare de eșantionare marginală

cu o probabilitate de 0,954, se poate argumenta că vârsta medie a bărbaților care se căsătoresc va fi înăuntru

pentru ca bărbații care intră într-o a doua căsătorie să fie înăuntru

se determină ponderea eșantionului

varianța eșantionului caracteristicii alternative este

cu o probabilitate de 0,954, se poate argumenta că ponderea persoanelor care se căsătoresc pentru a doua oară este înăuntru

Eșantionare în serie.

Cu eșantionarea în serie, populația este împărțită în grupuri de aceeași dimensiune - serie. Eșantionul este selectat pe serii. În cadrul seriei, se efectuează observarea continuă a unităților care intră în serie.

Cu o selecție care nu se repetă și determinată de formulă

Unde
- varianța inter-run

Unde
serie medie eșantion

media eșantionului dintr-un eșantion serial

R este numărul de serii ale populației generale

r - numărul seriilor selectate

Exemplu: într-un atelier de 10 brigăzi, pentru a-și studia productivitatea muncii, se va efectua un eșantion în serie de 20%, care include 2 brigăzi. În urma sondajului, sa constatat că

cu o probabilitate de 0,997 pentru a determina limitele în care va fi producția medie a lucrătorilor din magazin.

media eșantionului eșantionului în serie este determinată de formulă

cu o probabilitate de 0,997, se poate argumenta că producția medie a lucrătorilor din atelier este în interior

Există 200 de cutii de piese, 40 de bucăți în fiecare cutie, în depozitul de produse finite al atelierului. Pentru a verifica calitatea produsului finit, se va face o probă de lot de 10%. Ca rezultat al eșantionării, sa constatat că pentru piesele defecte este de 15%. Varianța eșantionului serial este 0,0049.

Cu o probabilitate de 0,997, determinați limitele în care se află ponderea produselor defecte într-un lot de cutii

Proporția de piese defecte va fi în interior

să determinăm eroarea de eșantionare marginală a cotei prin formulă

cu o probabilitate de 0,997, se poate argumenta că proporția pieselor defecte

în partid este înăuntru

În practica proiectării observației selective, este necesar să se găsească dimensiunea eșantionului, care este necesară pentru a asigura o anumită acuratețe în calcularea caracteristicilor generale - media și proporția.

Eroarea de eșantionare marginală, probabilitatea apariției acesteia și variația caracteristicii sunt cunoscute în prealabil.

În caz de accident re-selectare mărimea eșantionului este determinată de formulă

în cazul eșantionării nerepetabile și mecanice aleatorii, dimensiunea eșantionului

pentru un eșantion tipic

pentru eșantionarea în serie

Exemplu 2000 de familii locuiesc în zonă.

Se presupune că va efectua un sondaj de sondaj al acestora prin metoda de selecție aleatorie non-repetată pentru a găsi dimensiunea medie a familiei.

Determinați dimensiunea necesară a eșantionului, cu condiția ca, cu o probabilitate de 0,954, eroarea de eșantionare să nu depășească 1 persoană cu o abatere standard de 3 persoane.

Orașul găzduiește 10 mii. familii. Folosind eșantionarea mecanică, se propune determinarea proporției familiilor cu trei sau mai mulți copii. Care ar trebui să fie dimensiunea eșantionului astfel încât, cu o probabilitate de P = 0,954, eroarea de eșantionare să nu depășească 0,02, dacă se știe pe baza anchetelor anterioare că varianța este 0,02?