Splošna agregatna in selektivna metoda. Ocena intervala splošnega deleža

Pogosto se zgodi, da je treba analizirati kateri koli poseben družbeni pojav in dobiti informacije o njem. Takšne naloge se pogosto pojavljajo v statistiki in statistične študije. Preverite popolnoma določen družbeni pojav, je najpogosteje nemogoče. Na primer, kako ugotoviti mnenje prebivalstva ali vseh prebivalcev določenega mesta na vsakem vprašanju? Vprašajte absolutno vse - primer je skoraj nemogoč in zelo težaven. V takih primerih potrebujemo vzorec. To je točno koncept, na katerem temeljijo skoraj vse raziskave in teste.

Kaj je vzorec

Pri analizi določenega družbenega pojava je potrebno pridobiti informacije o tem. Če vzamete kakršne koli raziskave, potem je mogoče opozoriti, da študija in analiza ne velja vsaka enota niza raziskovalnega predmeta. Upošteva se le določen del celotne celote. Ta proces je vzorec: ko preiskujejo le nekatere enote iz niza.

Seveda je veliko odvisno od vrste vzorčenja. Vendar obstajajo osnovna pravila. Glavna stvar je, da mora biti izbira agregata popolnoma naključna. Enote agregata, ki se bodo uporabljali, se ne smejo izbrati zaradi kakršnega koli merila. V grobem, če morate zbrati celoto prebivalstva določenega mesta in vzeti samo moški, potem bo študija napaka, ker izbir ni bil po nesreči porabljen, vendar je izbral spol. Skoraj vse vzorčne metode temeljijo na tem pravilu.

Izbirna pravila

Da bi izbrani agregat odražal glavne lastnosti celotnega pojava, ga je treba zgraditi v skladu s posebnimi zakoni, kjer se je treba osredotočiti na naslednje kategorije:

  • vzorec (selektivni agregat);
  • splošno agregat;
  • reprezentativnost;
  • reprezentativna napaka;
  • skupna enota;
  • metode za izgradnjo vzorca.

Lastnosti selektivno opazovanje In vzorec je sestavljen iz:

  1. Vsi dobljeni rezultati temeljijo na matematičnih zakonih in pravilih, to je z ustreznimi raziskavami in pod pravilnimi izračuni, rezultati ne bodo izkrivljeni na subjektivni osnovi.
  2. To daje priložnost veliko hitreje in z manj časa in virov, da dobijo rezultat, ne preučuje celotno paleto dogodkov, ampak le njihov del.
  3. Lahko se uporablja za preučevanje različnih predmetov: od posebnih vprašanj, na primer, starost, nadstropje skupine, ki vas zanimajo, za študijo javno mnenje ali raven materialne podpore prebivalstva.

Selektivno opazovanje

Vzorec - je statistično opazovanjeV kateri študija ni predmet celotnega celotnega študija, ampak le nekaj, izbranih na določen način, in rezultati študije tega dela so razdeljeni na celoten niz. Ta del se imenuje selektivni set. To je edini način, da preučite veliko paleto predmeta študije.

Vendar selektivno opazovanje se lahko uporablja samo v primerih, ko je treba raziskati le majhno skupino enot. Na primer, ko študiramo razmerje med ženskami na svetu, se bo uporabljala selektivna opazovanje. Iz očitnih razlogov je nemogoče upoštevati vsakega rezidenta našega planeta.

Toda z isto študijo, vendar ne vsi prebivalci zemlje, ampak določen 2 "a" razred v določeni šoli, določenem mestu, določeni državi, lahko storijo brez selektivnega opazovanja. Konec koncev, da analiziramo celotno paleto predmeta študije - je povsem mogoče. Treba je izračunati fantje in dekleta tega razreda - to bo razmerje.

Selektivni in splošni agregat

Pravzaprav vse ni tako težko, kot se sliši. V vsakem predmetu študije obstajata dva sistema: splošni in selektivni agregat. Kaj je to? Vse enote se nanašajo na splošno. In selektivno - tiste enote celotnega agregata, ki so bili sprejeti za vzorec. Če je vse opravljeno pravilno, bo izbrani del zmanjšana razporeditev celotnega (splošnega) kompleta.

Če govorimo o splošnem agregatu, se lahko razlikujeta le dve vrsti tega: določen in nedoločen splošni agregat. Odvisno od tega, ali je skupno število enot tega sistema znano ali ne. Če je to določen splošni sklop, bo vzorec lažje zaradi tega, kar je znano, kateri odstotek skupnega števila enot bo vzorec.

Ta trenutek je zelo potreben v raziskavah. Na primer, če morate preučiti odstotek slabih slaščic v določeni tovarni. Recimo, da je splošni agregat že opredeljen. Znano je, da ta družba ta družba proizvaja 1000 slaščic. Če naredite vzorec 100 naključnih slaščic iz tega tisoč in jih pošljete na pregled, bo napaka minimalna. Grobo, študija je bila napisana na 10% vseh proizvodov, na rezultate pa lahko, ob upoštevanju napake reprezentativnosti, govorite o slabi kakovosti vseh izdelkov.

In če imate vzorec 100 slaščic iz nedoločenega splošnega agregata, kjer so bili dejansko, so bili sprejeti, 1 milijon enot, rezultat vzorca in sama raziskava bo kritična in netočna. Čutite razliko? Zato je gotovost splošne populacije v večini primerov izjemno pomembna in močno vpliva na rezultat študije.

Reprezentativnost agregatov

Torej, zdaj eno najpomembnejših vprašanj - kaj bi moral biti vzorec? To je glavni trenutek študije. Na tej stopnji je treba izračunati vzorec in izbrati enote iz skupaj. v. Komplet je bil pravilno izbran, če nekatere značilnosti in značilnosti splošne populacije ostanejo v selektivni. To se imenuje predstavnik.

Z drugimi besedami, če se po izbiri del obdrži enake trende in funkcije, ki jih je celoten znesek preiskanega, nato tak niz se imenuje predstavnik. Vendar pa ne moremo izbrati vsakega posebnega vzorca iz reprezentativne celote. Obstajajo takšni predmeti študije, katerega vzorec preprosto ne more biti reprezentativen. Od tu se pojavi pojem reprezentativnosti. Toda o tem bomo govorili malo več.

Kako narediti vzorec

Torej, da je reprezentativnost maksimum, dodeljuje tri osnovna vzorčna pravila:


Napaka (napaka) reprezentativnost

Glavna značilnost kakovosti izbranega vzorca je koncept "reprezentativne napake". Kaj je to? To so določena neskladja med kazalniki selektivnega in trdnega opazovanja. Kar zadeva napake, je reprezentativnost razdeljena na zanesljivo, navadno in približno. Z drugimi besedami, dovoljena odstopanja v višini do 3%, od 3 do 10% oziroma od 10 do 20%. Čeprav je v statistiki zaželeno, da napaka ne presega 5-6%. V nasprotnem primeru obstaja razlog za pogovor o nezadostni reprezentativnosti vzorca. Za izračun nujnosti reprezentativnosti in kako vpliva na selektivno ali splošno populacijo, se upoštevajo številni dejavniki: \\ t

  1. Verjetnost, s katero je potrebno pridobiti natančen rezultat.
  2. Število enot selektivnega agregata. Kot smo že omenili, bo manj enot vzorec, večja bo napaka reprezentativnosti, in obratno.
  3. Enakomernost celote v študiji. Bolj heterogena je celota, večja je negotovost reprezentativnosti. Možnost agregata, ki je reprezentativna, je odvisna od enotnosti vseh njegovih komponent.
  4. Način izbora enot v selektivni niz.

V posebnih študijah se odstotek povprečne napake običajno določi sam raziskovalec na podlagi programa opazovanja in v skladu s podatki o predhodno opravljenih študijah. Praviloma se veljavna napaka vzorčenja šteje za dopustno napako (reprezentativnost) v 3-5%.

Več - ne vedno boljše

Prav tako je treba spomniti, da je glavna stvar pri organizaciji selektivnega opazovanja, da se njena količina dopustnega minimalnega. Ne sme si prizadevati za pretirano zmanjšanje meja napake vzorčenja, saj to lahko privede do neupravičenega povečanja velikosti teh vzorcev in zato povečanju izdatkov za selektivno opazovanje.

Hkrati pa je nemogoče preveč povečati velikosti nujnosti reprezentativnosti. V tem primeru, čeprav se bo zmanjšalo količino selektivnega agregata, bo to povzročilo poslabšanje točnosti dobljenih rezultatov.

Kakšna vprašanja se običajno dajejo pred raziskovalcem

Vsaka študija, če se izvede, potem za nekatere rezultate. Pri izvajanju študije vzorčenja se praviloma postavljajo začetna vprašanja: \\ t


Metode za izbiro raziskav v vzorcu

Vsak vzorec ni zastopan. Včasih je isti znak na splošno drugačen na splošno in v svojih delih. Za doseganje zahtev reprezentativnosti je priporočljivo uporabiti različne tehnike vzorčenja. Poleg tega je uporaba ene ali druge metode odvisna od posebnih okoliščin. Med temi tehnikami ustvarjanja vzorcev se razlikujejo:

  • naključna izbira;
  • mehanska izbira;
  • tipična izbira;
  • serijska (gnezda).

Naključni izbor je sistem ukrepov, namenjenih naključnem izboru agregatov, ko je verjetnost pridobivanja v vzorec enaka vsem enotam splošne populacije. Priporočljivo je, da to tehniko uporabljate samo v primeru homogenosti in majhnega števila znakov, povezanih z njim. V nasprotnem primeru se ne odražajo nekatere značilne značilnosti, ki se ne odražajo v vzorcu. Znaki naključnega izbora temeljijo na vseh drugih načinih za izgradnjo vzorca.

Z mehanskim izborom enot se izvaja skozi določen interval. Če morate oblikovati vzorec posebnih kaznivih dejanj, lahko umaknete iz vseh statističnih računovodskih kartic registriranih kaznivih dejanj vsakega 5, 10. ali 15. kartice, odvisno od skupnega števila in velikost vzorca. Pomanjkljivost te metode je, da je pred izbiro potrebno imeti popolno računovodstvo agregatov, nato razvrstitev in šele po tem, da je mogoče vzorčiti z določenim intervalom. Ta metoda traja veliko časa, zato se pogosto ne uporablja.

Tipična (coned) izbira je vrsta vzorčenja, v katerem je splošna populacija razdeljena na homogene skupine na določenem znaku. Včasih raziskovalci namesto skupin uporabljajo druge izraze: "Okrožje" in "cone". Potem, iz vsake skupine v naključnem vrstnem redu, je določeno število enot izbran v sorazmerju s posebno težo skupine v skupnem agregatu. Tipična izbira se pogosto izvaja v več fazah.

Serijska izbira je metoda, na kateri izbor enot izvaja skupine (serija) in vse enote izbrane skupine (serije) so predmet ankete. Prednost te metode je, da včasih izberejo posamezne enote bolj zapletene kot serija, na primer, ko študirate osebo, ki služi stavek. V okviru izbranih območij območja uporabljajo študijo vseh enot brez izjeme, na primer študijo vseh oseb, ki služijo kazni v določeni instituciji.

Statistični agregat- Veliko enot z masistom, tipično, visoko kakovostno homogenostjo in prisotnostjo variacije.

Statistični agregat je sestavljen iz materialov predmetov (zaposleni, podjetja, države, regije), je predmet.

Agregate - vsaka posamezna enota statističnega agregata.

Isti statistični agregat je lahko homogeni en znak in heterogeno drugače.

Kvalitativna homogenost - Podobnosti vseh agregatov na vsakem znaku in nege v vseh ostalih.

V statističnem agregatu razlike ene enote celote, pogosteje ima kvantitativno naravo. Kvantitativne spremembe vrednosti znaka različnih agregatov se imenujejo razlike.

Sprememba znaka - Kvantitativna sprememba v značilnosti (za kvantitativno) med prehodom iz ene enote celote v drugo.

Znak- ta lastnost, značilnost ali druga značilnost enot, predmetov in pojavov, ki jih je mogoče opaziti ali izmeriti. Znaki so razdeljeni na kvantitativno in kvalitativno. Raznolikost in variabilnost znaka znaka v posameznih enotah seta se imenuje Variacija.

Atribut (kvalitativni) znaki niso primerljivi za numerični izraz (sestava prebivalstva tal). Kvantitativni znaki imajo številčni izraz (sestava prebivalstva po starosti).

Indikator - To posploši kvantitativno kvalificirane značilnosti vsakega premoženja enot ali celota v prizemnem stanju v posebnih pogojih in prostoru.

Sistem kazalnikov - To je kombinacija kazalnikov, ki celovito odražajo preučeni pojav.

Na primer, plače je raziskano:
  • Znak - plače
  • Statistični agregat - vsi zaposleni
  • Enota agregata - vsak zaposleni
  • Kakovost homogenost - obračunana plač
  • Sprememba signala - število številk

Splošni agregat in vzorec tega

Osnova predstavlja številne podatke, pridobljene kot posledica merjenja enega ali več znakov. Dejansko opaženo sklop predmetov, statistično zastopano število opazovanj naključne spremenljivke je vzorecin hipotetično obstoječe (prezirljivo) - splošno spoštovanje. Splošno prebivalstvo je lahko končno (število opazovanj N \u003d CONT.) ali neskončno ( N \u003d ∞.), in vzorec iz splošne populacije je vedno rezultat omejenega števila pripomb. Število opazovanj, ki tvorijo vzorec, se imenuje vzorčenje. Če je velikost vzorca dovolj velika ( n → ∞.) Šteje se vzorec velikaV nasprotnem primeru se imenuje vzorčenje omejena prostornina. Šteje se vzorec malajaČe pri merjenju enodimenzionalne naključne spremenljivke velikost vzorca ne presega 30 ( n.<= 30 ) in pri merjenju hkrati več ( k.) Znaki v večdimenzionalni prostorski odnos n.za K.manj kot 10 (n / k< 10) . Vzorčne oblike variacijska serijaČe so njeni člani redna statistika, t.e. selektivne vrednosti naključne spremenljivke H. Naročeno naraščajoče (uvrščene), se klicajo vrednosti znaka opcije.

Primer. Skoraj eden in enak nenamerno izbrani sklop predmetov - komercialne banke enega upravnega okrožja Moskve, se lahko šteje kot vzorec iz splošne populacije vseh poslovnih bank tega okrožja, in kot vzorec iz splošne populacije vseh poslovnih bank v Moskvi, kot tudi vzorec komercialnih bank v državi in \u200b\u200bitd.

Glavni načini za organizacijo vzorčenja

Natančnost statističnih zaključkov in smiselno razlago rezultatov je odvisna od reprezentativnost vzorci, t.j. Popolnost in ustreznost predstavitve lastnosti splošne populacije, s katerim se lahko ta vzorec šteje za reprezentativno. Študija statističnih lastnosti seta se lahko organizira na dva načina: z tRD in neplačan. Trdno opazovanjezagotavlja raziskavo vseh enote študiral skupaj., Ampak neprepustno (selektivno) opazovanje - Samo njegovi deli.

Obstaja pet temeljnih načinov za organizacijo selektivnega opazovanja:

1. enostavna naključna izbiraV katerih predmetov so naključno pridobljeni iz splošnega sklopa predmetov (na primer z uporabo tabele ali senzorja naključnih števil), ima vsak od možnih vzorcev enako verjetnost. Takšni vzorci se imenujejo dejansko naključno;

2. enostavna izbira z rednim postopkom Izvaja se z uporabo mehanske komponente (na primer datume, dan v tednu, apartmajskih sobah, črkah abecede itd.) In na ta način se imenuje vzorec mehansko;

3. stratificiran. Izbor je, da je splošni komplet volumna razdeljen na odvisne družbe ali plasti (STRATA). Strats so homogeni predmeti z vidika statističnih značilnosti (na primer, prebivalstvo je razdeljeno na Strata v starostnih skupinah ali socialnem pripadnosti; Podjetja - industrija). V tem primeru se imenujejo vzorci stratificiran. (drugače strašno, značilno, coned);

4. Metode serijska Izbira se uporablja za oblikovanje serijska ali vzorce gnezda. Ustrezno so, če morate preučiti "blok" ali vrsto predmetov (na primer serija blaga, izdelkov določene serije ali prebivalstvo s teritorialno upravno delitev države). Izbira serije se lahko izvede z naključnim ali mehanskim načinom. Hkrati stalna preučitev določene serije blaga ali celotne teritorialne enote (stanovanjske stavbe ali četrtletja);

5. kombinirano (stopenjska) izbira lahko združi več metod izbire naenkrat (na primer stratificirano in naključno ali naključno in mehansko); Ta vzorec se imenuje kombinirano.

Vrste izbire

Z glejte Posamezna, skupina in kombinirana izbor se razlikujejo. Za posamezna izbira V selektivnem nizu so izbrane ločene enote splošnega agregata, izbira skupine. - kvalitativno homogene skupine (serije) enot in kombinirana izbira Porabi kombinacijo prve in druge vrste.

Z metoda.izbira razlikujejo ponavljajoče se in nepreviden Vzorec.

Capture.izbor se imenuje, v kateri se enota, ki je padla v vzorec, ne vrne v prvotni set in v prihodnosti izbiro ni vpleten; Hkrati pa število enot splošne populacije N. Med izbirnim postopkom. Za ponovil izbor ujetih V vzorcu se enota po registraciji vrne na splošni set in tako ohranja enake možnosti, skupaj z drugimi enotami, ki se uporabljajo v nadaljnjem izbirnem postopku; Hkrati pa število enot splošne populacije N. Ostaja nespremenjena (metoda v socialno-ekonomskih raziskavah se redko uporablja). Vendar pa z velikim N (n → ∞) Formule za primarno. izbira se približuje podobnemu ponovil Se izbor in praktično pogosteje uporablja ( N \u003d CONT.).

Glavne značilnosti parametrov splošnega in selektivnega agregata

V središču statističnih zaključkov študije je porazdelitev naključne spremenljivke, opazovane vrednosti (x 1, x 2, ..., x n) imenovan naključne spremenljivke H. (N - Vzorčenje). Porazdelitev naključne spremenljivke v splošni populaciji je teoretična, idealna narava in njegov selektivni analog empirical. distribucija. Nekatere teoretične porazdelitve so določene analitično, t.j. njim parametri Določite vrednost distribucijske funkcije na vsaki točki prostora možnih vrednosti naključne spremenljivke. Za vzorec je funkcija distribucije težko ugotoviti, zato je torej nemogoče parametri Glede na empirične podatke, nato pa so substituirani v analitični izraz, ki opisuje teoretično porazdelitev. Ob istem času, predpostavka (ali hipoteza) Vrsta distribucije je lahko statistično resnična in napačna. Toda v vsakem primeru pa je empirična porazdelitev obnovljena samo nevljudno označuje resnično. Najpomembnejši parametri distribucij so pričakovana vrednost in disperzijo.

Po naravi, distribucija je neprekinjeno in diskretno. Najbolj znana neprekinjena distribucija je normalno. Selektivni analogi parametrov IDL so: povprečna vrednost in empirična disperzija. Med diskretnimi v socialno-ekonomskih raziskavah se najpogosteje uporablja alternativa (dihotomna) distribucija. Parameter matematičnega pričakovanja te distribucije izraža relativno vrednost (ali deliti) agregatne enote, ki imajo atribut preučevanega atributa (označeno je s črko); Delež agregata, ki nima te funkcije, je označen s črko q (Q \u003d 1 - P). Razpršenost iste alternativne porazdelitve ima tudi empirični analog.

Glede na vrsto distribucije in načina izbire enot niza različno izračunala značilnosti parametrov distribucije. Glavni za teoretične in empirične distribucije so prikazani v tabeli. 9.1.

Vzorčenje K n. Razmerje med številom enot selektivnega nastavljenega na število splošnih agregatnih enot se imenuje:

k n \u003d n / n.

Selektivni delež W. - To je odnos enot z raziskano znakom x. na količino vzorca n.:

w \u003d n n / n.

Primer. V seriji blaga, ki vsebuje 1000 enot, s 5% vzorcem vzorčenje K n. V absolutni vrednosti je 50 enot. (n \u003d n * 0,05); Če v tem vzorcu najdemo 2 okvarjeni izdelki, potem selektivna poroka W. bo 0,04 (W \u003d 2/50 \u003d 0,04 ali 4%).

Ker je selektivni set odličen od splošnega, potem so tam napake vzorčenja.

Tabela 9.1 Osnovni parametri splošnih in selektivnih sklopov

Napake vzorčenja

Za vsako (trdno in selektivno) lahko pride do napak dveh vrst: registracija in reprezentativnost. Napake registracija lahko ima naključen in sistematičen znak. Naključen Napake, ki so bile zložene iz različnih nekontroliranih vzrokov, so nenamerne narave in običajno popolnoma uravnotežijo (na primer spremembe kazalnikov instrumentov pri temperaturnih nihanjih v prostoru).

Sistematičen Napake so nagnjene, saj kršijo pravila za izbiro predmetov na izbiro (na primer odstopanja pri merjenju, ko se merilni instrument spremeni).

Primer. Da bi ocenili socialni položaj prebivalstva v mestu, je načrtovan, da preuči 25% družin. Če je hkrati izbira vsakega četrtega apartmaja, ki temelji na njeni številki, potem obstaja nevarnost, da izberete vse apartmaje samo enega tipa (na primer eno-sobno), ki bo zagotovila sistematično napako in izkrivljala rezultate; Izbira števila stanovanj v parcelah je bolj zaželena, saj bo napaka naključna.

Reprezentativne napake Neločljiv samo s selektivnim opazovanjem, se jim ni mogoče izogniti in nastanejo zaradi dejstva, da selektivni set ne povsem reproducira splošnega. Vrednosti kazalnikov, pridobljenih z vzorcem, se razlikujejo od kazalnikov istih vrednosti v splošni populaciji (ali pridobljene s trdnim opazovanjem).

Napaka selektivna opazovanje Obstaja razlika med vrednostjo parametra v splošni populaciji in njegovi selektivni vrednosti. Za povprečni kvantitativni znak je enak :, in za delnico (alternativni značaj) -.

Vzorčne napake so značilne samo zaradi selektivnih opazovanj. Več te napake, večja je empirična distribucija razlikuje od teoretične. Parametri empirične porazdelitve in so naključne vrednosti, zato so napake vzorčenja tudi naključne vrednosti, lahko sprejmejo različne vrednosti za različne vzorce in zato je običajno izračunavanje srednja napaka.

Povprečna napaka vzorcaobstaja vrednost, ki izraža povprečno kvadratno odstopanje vzorčnega medija iz matematičnega pričakovanja. Ta vrednost v skladu z upoštevanjem načela naključnega izbora je odvisna predvsem od velikosti vzorca in o stopnji variacije funkcije: večja je manjša sprememba elementa (posledično vrednost), manjša vrednost povprečno napako vzorčenja. Razmerje med disperzijami splošnih in selektivnih agregatov je izraženo s formulo:

ti. Z zelo velikim, lahko to domnevamo. Povprečna napaka vzorčenja kaže možna odstopanja selektivnega nastavljenega parametra iz splošnega parametra. V zavihku. 9.2 prikazuje izraze za izračun povprečne napake vzorčenja v različnih metodah opazovalne organizacije.

Tabela 9.2 Povprečna napaka (m) vzorčnega medija in delnic za različne vrste vzorčenja

Kje je povprečje selektivnih disperzij znotraj skupine za neprekinjeno;

Povprečje notranjih disperzij delnic;

- število izbranih serij, - skupno število serij;

,

kje je povprečno število serij;

- skupno povprečje v celotnem selektivnem agregatu za neprekinjeno;

,

kjer - delež znaka serije;

- skupni delež znaka v celotnem selektivnem agregatu.

Vendar pa se lahko obseg povprečne napake presodi le z določeno verjetnostjo P (p ≤ 1). Lyapunov a.m. Dokazano, da je distribucija selektivnih povprečja, zato njihova odstopanja od splošnega povprečja, z dovolj velikim številom približno številu približno običajni zakon o distribuciji, pod pogojem, da ima splošna populacija končna povprečna in omejena disperzija.

Matematično, ta izjava za povprečje je izražena v obliki:

in za delež izraza (1) je obrazec:

kje - tukaj je Napaka z omejitvijo izbireki je večja velikost povprečne napake vzorčenja , Razmerje med množico - obstaja merilo študentov ("Koeficient zaupanja"), ki ga je predlagal U.S. Gosset (psevdonim "študent"); Vrednosti za različne vzorčenja so shranjene v posebni tabeli.

Vrednosti funkcije F (T) pri nekaterih vrednostih T so enake:

Posledično se lahko izraz (3) prebere tako: z verjetnostjo P \u003d 0,683 (68,3%) Trdimo lahko, da razlika med vzorcem in splošnim povprečjem ne bo presegla ene vrednosti povprečne napake M (t \u003d 1)z verjetnostjo P \u003d 0,954 (95,4%) - da ne bo presegla obsega dveh povprečnih napak M (t \u003d 2), Z verjetnostjo P \u003d 0,997 (99,7%) - ne bo presegla treh vrednosti m (t \u003d 3).Zato je verjetnost, da bo ta razlika presegla tri časovne vrednosti povprečne napake raven napake in ni več 0,3% .

V zavihku. 9.3 Formule se dajejo za izračun napake z mejno izbiro.

Tabela 9.3 Omejitev napake (d) Vzorci za srednje in delnice (P) za različne vrste selektivnih opazovanj

Porazdelitev vzorčnih rezultatov na splošnem nizu

Končni cilj selektivnega opazovanja je značilnost splošne populacije. Z majhnimi količinami vzorčenja lahko empirične ocene parametrov (-ov) bistveno odstopajo od svojih pravih (-ov). Zato je potrebno določiti meje, v katerih so prave vrednosti za selektivne vrednosti parametrov (in).

Zaupni interval.vsak parameter θgeneralna komplet se imenuje naključno območje vrednosti tega parametra, ki je verjetno blizu 1 ( zanesljivost) Vsebuje pravo vrednost tega parametra.

Največja napaka Vzorce. Δ omogoča, da določite mejne vrednosti značilnosti splošne populacije in njihovo trust intervalienaka:

Spodnja črta zaupni interval. Prejel s strani subtrakcije omejitev napake Iz selektivnega srednjega (delež) in na vrhu - z dodajanjem.

Interval zaupanja Za povprečno uporabno mejno napako meje in za določeno stopnjo zaupanja se določi s formulo:

To pomeni, da z določeno verjetnostjo R.ki se imenuje raven zaupanja in je nedvoumno določena z vrednostjo t., lahko trdimo, da je prava vrednost povprečja znotraj in prava vrednost delnice - od

Pri izračunu intervala zaupanja za tri standardne ravni zaupanja P \u003d 95%, p \u003d 99% in p \u003d 99,9% Vrednost je izbrana. V aplikacijah, odvisno od števila stopenj svobode. Če je velikost vzorca precej velika, potem vrednosti, ki ustrezajo tem verjetnosti t. EQUAL: 1,96, 2,58 in 3,29 . Tako izbirna napaka vam omogoča, da določite mejne vrednosti značilnosti splošne populacije in njihovih intervalov zaupanja:

Razširjanje rezultatov selektivnega opazovanja na splošno prebivalstvo v socialno-ekonomskih študijah ima svoje lastne značilnosti, saj zahteva popolnost reprezentativnosti vseh njenih vrst in skupin. Osnova za možnost takšne distribucije je izračun relativna napaka:

kje Δ % - Relativna napaka pri izbiri; .

Obstajata dve glavni metodi za distribucijo selektivnega opazovanja na splošno prebivalstvo: neposredno preračun in način koeficientov.

Essence. neposredna preračunanicato je množenje vzorčne srednje vrednosti! Overline (x) o obsegu splošne populacije.

Primer. Naj povprečno število mlagih otrok v mestu ocenjuje s selektivno metodo in je znašala osebo. Če je v mestu 1000 mladih družin, se število potrebnih mest v občinskem vrtecu pridobi z množenjem tega povprečja na število splošnih prebivalcev n \u003d 1000, t.e. bo 1.200 sedežev.

Metoda koeficientov Priporočljivo je, da se v primeru, ko se izvede selektivna opazovanje, da se pojasni ta trdna ugotovitev.

Hkrati uporabite formulo:

kjer so vse spremenljivke število agregatov:

Zahtevano vzorčenje

Tabela 9.4 Zahtevana količina (n) Vzorci za različne vrste organizacij selektivnega opazovanja

Pri načrtovanju selektivnega opazovanja z vnaprej določeno vrednostjo veljavne vzorčne napake, je potrebno pravilno oceniti zahtevano volumen vzorčenja. Ta obseg se lahko določi na podlagi veljavne napake pri selektivnem opazovanju, ki temelji na določeni verjetnosti, ki zagotavlja dovoljeno vrednost ravni napak (ob upoštevanju metode organizacije opazovanja). Formule za določitev zahtevanega števila vzorčenja N enostavno dobite neposredno iz formul izbirne napake. Torej, od izraza za mejno napako:

neposredno določena velikost vzorca n.:

Ta formula kaže, da z zmanjšanjem napake vzorca Δ zahtevani obseg vzorčenja se znatno povečuje, kar je sorazmerno z disperzijo in kvadratom merilo študentov.

Za poseben način za organizacijo opazovanja se zahtevani obseg vzorčenja izračuna po formulah, prikazanih v tabeli. 9.4.

Praktični primeri izračuna

Primer 1. Izračunajte povprečni interval vrednosti in zaupanja za stalno kvantitativno funkcijo.

Da bi ocenili stopnjo izračuna z upniki, je bil naključni vzorec 10 plačilnih dokumentov naključen. Njihove vrednosti so se izkazale za enake (v dneh): 10; 3; petnajst; petnajst; 22; 7; osem; eno; devetnajst; Dvajset.

Potrebno je z verjetnostjo P \u003d 0,954. Določite mejno napako Δ selektivne meje srednje in zaupanja povprečnega časa naselja.

Sklep. Povprečna vrednost se izračuna s formulo iz tabele. 9.1 Za selektivni agregat

Disperzija se izračuna s formulo iz tabele. 9.1.

Povprečna kvadratna napaka dneva.

Povprečna napaka se izračuna s formulo:

ti. Povprečna vrednost je x ± m \u003d 12,0 ± 2,3 dni.

Natančnost povprečja je znašala

Mejna napaka se izračuna s formulo iz tabele. 9.3 Za ponovno izbiro, saj število splošnih prebivalcev ni znano, in za P \u003d 0,954. stopnja zanesljivosti.

Tako je povprečna vrednost `x ± d \u003d` x ± 2m \u003d 12,0 ± 4,6, t.j. Njegov pravi pomen je od 7,4 do 16,6 dni.

Z uporabo študentske mize. Vloge omogočajo zaključek, da za N \u003d 10 - 1 \u003d 9 stopinj svobode, dobljena vrednost zanesljivo z ravnijo pomembnosti £ 0,001, t.j. Nastala vrednost povprečja se zanesljivo razlikuje od 0.

Primer 2. Ocena verjetnosti (splošna delniška skupščina) str.

Z mehanskimi selektivnimi metodami raziskovanja družbenega položaja 1000 družin je bilo razkrito, da je bil delež družin z nizkimi dohodki w \u003d 0,3 (30%) (vzorec je bil 2% . n / n \u003d 0,02). Potrebno je s stopnjo zanesljivosti p \u003d 0,997. Določite kazalnik r.družine z nizkimi dohodki v celotni regiji.

Sklep. Glede na predstavljene vrednosti funkcije F (t) Najti za določeno stopnjo zanesljivosti P \u003d 0,997. vrednost t \u003d 3. (Glejte Formulo 3). Napaka ozemlja w. Določamo formulo iz tabele. 9.3 Za izbiro zajemanja (mehanski vzorec je vedno mogoče:

Omeji relativno napako vzorčenja v % bo:

Verjetnost (splošni delež) družin z nizkimi dohodki v regiji p \u003d w ± Δ wIn omejitve zaupanja P se izračunajo na podlagi dvojne neenakosti:

w - Δ w ≤ p ≤ w - Δ w. Resnična vrednost p laži znotraj:

0,3 — 0,014 < p <0,3 + 0,014, а именно от 28,6% до 31,4%.

Tako je z verjetnostjo 0,997, je mogoče trditi, da se delež družin z nizkimi dohodki med vsemi družinami regije znaša od 28,6% do 31,4%.

Primer 3.Izračun povprečnega intervala vrednosti in zaupanja za diskretni atribut, ki ga določi interval v bližini.

V zavihku. 9.5. Porazdelitev vlog za proizvodnjo naročil v smislu njihovega izvajanja s strani podjetja je določena.

Tabela 9.5 Porazdelitev opazovanj v smislu videza

Sklep. Povprečni rok za vloge se izračuna po formuli:

Povprečje bo:

\u003d (3 * 20 + 9 * 80 + 24 * 60 + 48 * 20 + 72 * 20) / 200 \u003d 23.1 mesecev.

Isto odgovor dobimo, če uporabljamo podatke o P I iz predzadnjega stolpca tabele. 9.5, s formulo:

Upoštevajte, da se sredi intervala za zadnjo stopnjo namesti umetno dodaja širino intervala prejšnje stopnjevanje, ki je enako 60 - 36 \u003d 24 mesecev.

Disperzija se izračuna s formulo

kje x I.- sredina intervalnih serij.

Posledično !! Sigma \u003d Frac (20 ^ 2 + 14 ^ 2 + 1 + 25 ^ 2 + 49 ^ 2) (4) in povprečna kvadratna napaka.

Povprečna napaka se izračuna s formula mesec, t.j. Povprečna vrednost je! Overline (x) ± m \u003d 23,1 ± 13.4.

Mejna napaka se izračuna s formulo iz tabele. 9.3 Za ponovno izbiro, saj število splošnega prebivalstva ni znano, za 0,954 ravni zanesljivosti:

Tako je povprečna vrednost:

ti. Njen pravi pomen je od 0 do 50 mesecev.

Primer 4. Da bi ugotovili stopnjo izračunov z upniki n \u003d 500 podjetij družbe v komercialni banki, je treba izvesti študijo vzorčenja po metodi nenamernega ne-oddaljenega izbora. Določite zahtevano velikost vzorca N, da z verjetnostjo p \u003d 0,954 povprečna napaka vzorčenja ne presega 3 dni, če so ocene poskus pokazale, da je povprečna kvadratna odstopanja je bila 10 dni.

Sklep. Za določitev števila potrebnih študij, n uporabljamo formulo za izbiro zunaj mesta iz tabele. 9.4:

V njej se vrednost T določi od ravni zanesljivosti p \u003d 0,954. To je enako 2. povprečni kvadratna vrednost S \u003d 10, volumen splošnega nabora N \u003d 500, in mejne vrednosti srednje vrednosti Δ X \u003d 3. Zamenjava teh vrednosti v formuli, dobimo:

ti. Vzorec je dovolj, da naredijo 41 podjetij, da ocenjujejo zahtevani parameter - stopnja izračunov z upniki.

Selektivno opazovanje Uporablja se pri uporabi trdnega opazovanja fizično nemogoče Zaradi velikega podatkovnega matrika ali ekonomsko neprimerna. Fizična nezmožnost se na primer pri proučevanju potniškega prometa, tržnih cen, družinskih proračunov. Gospodarska neizpedna ocena poteka pri ocenjevanju kakovosti blaga, ki se nanaša na njihovo uničenje, na primer degustacijo, testiranje opeke za moč, itd

Statistične enote, izbrane za opazovanje selektivni agregat ali vzorecin vse njihovo matriko - splošno agregat (GS). Kjer Število enot v vzorcu označeno n.in na vseh tezah - N.. Odnos. n / N. imenovan relativna velikost ali vzorčenje.

Kakovost rezultatov selektivnega opazovanja je odvisna od reprezentativni vzorecTo pa je, kolikor je reprezentativno za GS. Za zagotovitev reprezentativnosti vzorca je treba upoštevati načelo možnosti izbire enotki kaže, da vključitev enote HS ne more vplivati \u200b\u200bna drug dejavnik poleg primera.

Obstaja 4 načine naključnega izbora V vzorec:

  1. Dejansko naključno Izbira ali "Lotto metoda", ko so statistične vrednosti dodeljene po zaporednih številkah, vnesenih na določenih elementih (na primer sode), ki se nato mešajo v nekaterih zmogljivostih (na primer v vrečki) in naključno izbrani. V praksi se ta metoda izvaja z uporabo generatorja naključnih števil ali matematičnih tabel naključnih števil.
  2. Mehansko Izbor, po katerem vsaka ( N / N.) - obseg splošne populacije. Na primer, če vsebuje 100.000 vrednosti, in mora izbrati 1.000, nato pa bo vsaka 100.000 / 1000 \u003d 100. vrednost spadala v vzorec. Poleg tega, če se ne uvrščajo, potem je prvi izbran naključno od prvih sto, število drugih pa bo na sto še sto. Na primer, če je bil prvi eden od št. 19, potem mora biti naslednje št. 119, nato št. 219, nato št. 319 itd. Če so enote splošne populacije razvrščene, potem je prvo izbrano št. 50, nato št. 150, nato št. 250 in tako naprej.
  3. Izvaja se izbor vrednosti iz nehomogenega podatkovnega matrika stratificiran.(stratificiran) na način, ko je splošni set predhodno razdeljen na homogene skupine, na katero se uporablja naključni ali mehanski izbor.
  4. Poseben način za sestavljanje vzorca je serijska Izbor, na katerem po naključju ali mehansko izberejo, ne ločene vrednosti, vendar njihove serije (zaporedja z določeno številko za nekakšno pogodbo), znotraj katerih so v postopku trdne ugotovitve.

Kakovost selektivnih opazovanj je odvisna od vrsta vzorca: ponovil ali zajemanje.
Za ponovna izbira Statistične vrednosti, ki so se padle v vzorcu ali njihove serije po uporabi, se vrnejo na splošno populacijo, ki imajo možnost, da pridejo v nov vzorec. V tem primeru so vse vrednosti splošnega agregata enaka verjetnost vključitve v vzorec.
Zajemite izbiro To pomeni, da se statistične vrednosti, ki so padle v vzorec ali njihove serije po uporabi, ne vrnejo na splošno populacijo, in zato za preostale vrednosti slednjega poveča verjetnost vstopa v naslednji vzorec.

Izbira zajemanja zagotavlja natančnejše rezultate, zato se pogosteje uporablja. Vendar pa obstajajo situacije, kjer jih ni mogoče uporabiti (študija potniškega prometa, povpraševanja potrošnikov itd.) In nato se izvede ponovna izbira.

Napake vzorčenja

Selektivni set se lahko oblikuje s kvantitativno osnovo statističnih vrednosti, kot tudi alternativo ali atribut. V prvem primeru se splošna značilnost vzorca služi Vrednost je navedena in v drugem - selektivni delež Vrednosti označene w.. V splošni populaciji: splošno središče in splošni delež R..

Razlika - I. W.r. imenovan napaka pri vzorčenjuki je razdeljen na snemajte napako in reprezentativna napaka. Prvi del napake vzorčenja se pojavi zaradi nepravilnih ali netočnih informacij iz razlogov za nega razumevanja bivanja vprašanja, nepopolnost registrarja pri izpolnjevanju vprašalnika, formule itd. Z lahkoto se odkrije pošteno in odpravljeno. Drugi del napake se pojavi zaradi konstantne ali spontane neskladnosti z načelom stopnje nesreče. Težko je zaznati in odpraviti, je veliko bolj prvi in \u200b\u200bzato je osredotočen.

Velikost napake vzorčenja je lahko drugačna za različne vzorce iz ene splošne populacije, zato se v statistiki določi povprečna vzorčenje ponovnega prenosa napak Z formulami:

Ponavljajoč

- zajemanje;

Kjer je DV selektivna disperzija.

Na primer, v tovarni s številom zaposlenih v višini 1000 ljudi. 5% naključnega vzorca trupla je potekalo za določitev povprečne izkušnje delavcev. Rezultati opazovanja vzorca so podani v prvih dveh stolpcih naslednje tabele:

X. , leta
(delovne izkušnje)

f. , Ljudje
(Število zaposlenih v vzorcu)

X. in

X. in f.

V 3. stolpcu se določi sredina X intervalih (kot pol domu spodnjih in zgornjih meja intervala) in v 4. stolpcu - dela X in F, da najdejo vzorčni medij po Srednja aritmetična formula:

143.0 / 50 \u003d 2,86 (leto).

Izračunajte selektivno uteženo disperzijo:
= 105,520/50 = 2,110.

Zdaj bomo našli povprečno napako vzorca cortable:
\u003d 0,200 (leta).

Iz formul povprečnih napak vzorčenja je razvidno, da je napaka manjša z vzorcem, ki ne-simulator, in, kot je dokazano v teoriji verjetnosti, se pojavi z verjetnostjo 0,683 (to je, če imate 1000 Vzorci iz enega splošnega niza, nato pa v 683 od njih napaka ne presega napake vzorčenja). Takšna možnost (0,683) je nizka, zato ni dovolj praktičnih izračunov, kjer je potrebna večja verjetnost. Za določitev napake vzorčenja z višjo od 0,683 verjetnost, izračunajte napaka pri vzorčenju:

Kje t. - Koeficient zaupanja, odvisno od verjetnosti, da se ugotovi napaka z mero za izbiro.

Vrednosti koeficienta zaupanja t. Izračunano za različne verjetnosti in so na voljo v posebnih tabelah (Laplace Integral), od katerih se v statistiki široko uporabljajo naslednje kombinacije:

Verjetnost 0,683 0,866 0,950 0,954 0,988 0,990 0,997 0,999
t. 1 1,5 1,96 2 2,5 2,58 3 3,5

Določitev specifične ravni verjetnosti, izberite iz tabele, ki ustreza njem t. in določite napako meje izbire po formuli.
Najpogosteje se uporablja \u003d 0,95 in t.\u003d 1.96, to je, da je verjel, da z verjetnostjo 95-odstotne napake vzorčenja 1,96-krat več povprečje. Obravnavana je taka verjetnost (0,95) standard. privzeto privzeto v izračunih.

V naši, opredelimo izbirno mejno napako s standardno 95-odstotno verjetnostjo (od prevzema t. \u003d 1,96 za 95% verjetnost): \u003d 1,96 * 0,200 \u003d 0,392 (leto).

Po izračunu mejne napake interval zaupanja, ki posplošijo značilnosti splošne populacije. Takšen interval za splošno povprečje ima obrazec
To pomeni, da je srednja izkušnja delavcev v celotni obrata leži v območju od 2.468 do 3,252 let.

Določanje števila vzorca

Razvoj programa za nadzor vzorca, ki je včasih določen s posebno vrednostjo omejevalne napake z verjetnostjo stopnjo. Najmanjše število vzorcev ostaja neznano, ki zagotavlja določeno natančnost. Lahko ga dobite iz formul srednjih in omejevalnih napak, odvisno od vrste vzorčenja. Torej, zamenjavo tako v in, reševanju v primerjavi z velikostjo vzorca, dobimo naslednje formule:
Za ponavljajoči se vzorec n. =
Za vzorec trupla n. = .

Poleg tega morate pod statističnimi kvantitativnimi znaki poznati selektivno disperzijo, vendar na začetku izračunov ni znano. Zato je sprejeta približno Eno od naslednjih metode (prednostno):

Pri proučevanju ne-numeričnih znakov, če ni približnih informacij o selektivnem deležu, je sprejet w. \u003d 0,5, ki, v skladu z disperzijsko formulo, delež ustreza selektivni disperziji v največji velikosti DV \u003d.0,5*(1-0,5) = 0,25.

Skupno število opazovalnih objektov (ljudi, gospodinjstev, podjetij, naselij itd.), Ki imajo določen sklop značilnosti (spol, starost, dohodek, število, promet, itd), omejena v prostoru in času. Primeri splošnih agregatov

  • Vsi prebivalci Moskve (10,6 milijona ljudi po popisu 2002)
  • Muscovite moški (4,9 milijona ljudi po popisu 2002)
  • Pravne osebe Rusije (2,2 milijona v začetku leta 2005)
  • Trgovina na drobno prodajajo živilske proizvode (20 tisoč na začetku leta 2008) itd.

Vzorčenje (selektivni set)

Nekateri predmeti iz splošnega agregata, izbranega za študij, da bi zaključili celotno splošno prebivalstvo. Za zaključek, pridobljen s preučevanjem vzorca, je bilo mogoče razširiti na celoten splošni sklop, vzorec mora imeti lastnost reprezentativnosti.

Reprezentativni vzorec

Vzorec lastnosti pravilno odraža splošno prebivalstvo. Isti vzorec je lahko zastopan in nereprezentativen za različne splošne sklope.
Primer:

  • Vzorec, v celoti sestavljen iz Muscoviti, ki ima v lasti avto, ne predstavlja celotnega prebivalstva Moskve.
  • Vzorec ruskih podjetij s številnim do 100 ljudi ne predstavlja vseh podjetij Rusije.
  • Vzorec Muscovite, ki kupujejo na trgu, ne predstavlja nakupa obnašanja vseh muscoviti.

Hkrati pa lahko določeni vzorci (ob upoštevanju drugih pogojev) popolnoma predstavljajo lastnike avtomobilov Muscovites, mala in srednje velika ruska podjetja in kupce, ki kupujejo na trgih.
Pomembno je razumeti, da je reprezentativnost vzorca in napaka vzorčenja različne pojave. Reprezentativnost, v nasprotju z napako, ni odvisna od velikosti vzorca.
Primer:
Kot da ne bomo povečali števila anketiranih policijskih lastnikov, ne bomo mogli predložiti tega vzorca vseh muscoviti.

Napaka vzorčenja (interval zaupanja)

Odstopanje rezultatov, pridobljenih s selektivnim opazovanjem resničnih podatkov splošne populacije.
Napaka vzorčenja Obstajata dve vrsti - statistični in sistematični. Statistična napaka je odvisna od velikosti vzorca. Večja je velikost vzorca, nižja je spodaj.
Primer:
Za preprosto naključno velikost vzorca 400 enot največje statistične napake (z 95% verjetnost zaupanja) je 5%, za vzorčenje v 600 enot - 4%, za vzorčenje v 1100 enot - 3% običajno, ko je napaka vzorca, je natančno statistično napako.
Sistematična napaka je odvisna od različnih dejavnikov, ki imajo stalen vpliv na študijo in premeščanje rezultatov študije v določeni smeri.
Primer:

  • Uporaba morebitnih verjetnostnih vzorcev podcenjuje delež ljudi z visokim dohodkom, ki vodi aktivni življenjski slog. To je posledica dejstva, da so takšni ljudje veliko težje ujeti na katerem koli določenem mestu (na primer doma).
  • Problem anketirancev, ki zavrnejo odzivanje na vprašanja (delež "zavrnitve" v Moskvi, za različne raziskave, okleva od 50% do 80%)

V nekaterih primerih, ko so znane prave porazdelitve, je mogoče sistematično napako izvesti z uvedbo kvot ali ob upoštevanju podatkov, vendar v večini resničnih študij celo ocenjujejo, da je zelo problematično.

Vrste vzorcev

Vzorci so razdeljeni na dve vrsti:

  • probabilistična
  • neverjetno

1. Probabilistični vzorci
1.1 Naključni vzorec (enostavna naključna izbira)
Tak vzorec vključuje homogenost splošne populacije, enako verjetnost razpoložljivosti vseh elementov, prisotnost celotnega seznama vseh elementov. Pri izbiri elementov, praviloma, se uporablja tabela naključnih števil.
1.2 Mehanski (sistematični) vzorec
Različni naključni vzorec, ki ga je naročil katerikoli znak (abecedni red, telefonska številka, datum rojstva itd.). Prvi element je izbrana po naključju, nato pa je izbran vsakemu elementu "K". Velikost splošnega agregata z n \u003d n * K
1.3 stratificirano (coned)
Uporablja se v primeru nehomogenosti splošne populacije. Splošni agregat je razdeljen na skupine (STRATA). V vsaki strategiji se izbor izvede naključno ali mehansko.
1.4 Vzorec serijske (vtičnice ali gruče)
S serijskim vzorcem izbirne enote niso same predmete, ampak skupine (grozdi ali vtičnice). Skupine so izbrane naključno. Predmeti v skupinah se pregledajo s trdno snovjo.

2. Uvedeni vzorci
Izbor v takem vzorcu se ne izvaja na načelih na lokalni ravni, temveč na subjektivnih merilih - dostopnosti, tipične, enake zastopanosti itd.
2.1. Quad vzorec.
Sprva so bile številne skupine predmetov (na primer, moški, stari 20-30 let, 31-45 let in 46-60 let, so se razlikovale; osebe z dohodki do 30 tisoč rubljev, z dohodek od 30 do 60 tisoč rubljev Z dohodek več kot 60 tisoč rubljev) je vsaka skupina določena s številom predmetov, ki jih je treba pregledati. Število predmetov, ki bi morali spadati v vsako od skupin, je najpogosteje določeno, ali sorazmerno s predhodno znanim deležem skupine v splošni populaciji, ali enako za vsako skupino. Znotraj skupin, predmetov so izbrani samovoljno. Quad vzorci se pogosto uporabljajo v precej pogosto.
2.2. Metoda snega koma
Vzorec je zgrajen na naslednji način. Vsak anketiranci, ki se začne od prvega, vprašajo stike svojih prijateljev, sodelavcev, znancev, ki bi bili primerni za pogoje izbire in bi lahko sodelovali v študiji. Tako, z izjemo prvega koraka, se vzorec oblikuje s sodelovanjem predmetov samih. Metoda se pogosto uporablja, če je potrebno najti in razgovor s težko dosežnimi skupinami anketirancev (na primer anketiranci, ki imajo visok dohodek, anketiranci, ki pripadajo eni strokovni skupini, anketiranci, ki imajo kakšne podobne hobije / hobije itd. )
2.3 spontani vzorec
Najbolj dostopni anketiranci so anketirani. Tipični primeri spontanih vzorcev - v časopisih / revijah, ki so jih anketiranci, ki so samodejni, večina internetnih raziskav. Velikost in sestava naravnih vzorcev nista znana vnaprej in se določi samo z enim parametrom - dejavnost anketirancev.
2.4 Vzorčenje tipičnih primerov
Enote splošnega agregata so izbrane s povprečnim (tipičnim) znakom. V tem primeru se pojavi problem izbire značilnosti in opredelitve njegove tipične vrednosti.

Predavanja na statistični teoriji

Več informacij o selektivnih opazovanjih je mogoče dobiti z ogledom.

Selektivna študija.

Koncept selektivne metode.

Selektivno opazovanje - To je tako odstransko opazovanje, v katerem je izbor agregatnih enot, ki jih je treba preučiti, naključno, je izbrani del izpostavljen študiji, potem, ko rezultati veljajo za celoten niz.

Uporaba vzorčne metode se uporabi v primerih

1 Ko je opazovanje povezano s poškodbo ali uničenjem opazovanih enot (začimba preje, žarnica na produktu zgorevanja)

2 velika količina agregata

3 veliki stroški (finančni in delovni sili).

Običajno je 5-10% celotne celote izpostavljeno selektivnemu pregledu, manj pogosto 15-25%.

Namen selektivnega opazovanja je določiti značilnosti splošnega povprečja in splošne frakcije (P). Specifikacije selektivnega zbiranja - avtomobili in selektivni delež (W) se razlikuje od prvotnih značilnosti z vrednostjo napake vzorčenja ( ). Zato je treba izračunati napako vzorčenja ali napako reprezentativnosti, ki jo določajo formule, ki so oblikovane v teoriji verjetnosti za vsako vrsto vzorčenja in način izbire.

Obstajajo naslednje metode izbire enot:

1 izbor po vrnjeni shemi krogle, ki se običajno imenuje ponovno vzorec.

Pri ponovnem izboru je verjetnost vstopa v vsako posamezno enoto stalna, ker Po izbiri neke enote se ponovno vrne v agregat in jo lahko ponovno izbere.

2 izbor po shemi nevračljive krogle, ki se imenuje zajet vzorec.V tem primeru se vsaka izbrana enota ne vrne nazaj, verjetnost posameznih enot v vzorcu pa se ves čas spremeni (za preostale enote) (žrebanje), tabele naključnih številk, na primer 75 od 780.

Vrste vzorcev.

1 Pravzaprav - naključno.

To je tako, v katerem se izbor enot v selektivni sklop izvede neposredno iz celotne mase enot splošne populacije.

V tem primeru se število izbranih enot običajno določi na podlagi sprejetega deleža vzorca.

Za vzorec je razmerje med številom enot selektivnega agregata in na število enot splošnega kmetijskega N.

Torej s 5-odstotnim vzorcem iz serije blaga v 2000 enotah, število vzorcev N je 100 enot. (
), in z 20-odstotnim vzorcem, bo 400 enot.

(
)

Pomemben pogoj za naključni vzorec V dejstvu, da je vsaka enota splošne populacije na voljo za enake možnosti, da pride v selektivno celoto.

Z naključnim izborom izbirne napake za sredino enako

- Razpršenost selektivnega agregata

n-vzorčenje

koeficient zaupanja, ki je določen s tabelo vrednosti celovite funkcije Laplaceja na dani verjetnosti P.

Z izbiro brez izbire se napaka izbora določi s formulo za povprečje

kjer je n število splošnega prebivalstva

Za določitev vsebnosti pepela iz premoga je bil naključni vzorec pregledan 100 vzorcev premoga. Kot rezultat ankete je bilo ugotovljeno, da je povprečni vsebnost pepela premoga v vzorcu 16%, \u003d 5%. V 10 vzorcih je bila vsebnost pepela iz premoga\u003e 20% z verjetnostjo 0,954, da se določi omejitve, v katerih povprečna vsebnost pepela premoga v depozitu in delež premoga s vsebnostjo pepela\u003e 20%

Povprečna pepelnost

določite napako mejne vrednosti


2*0.5=1%

na p \u003d 0,954 t \u003d 2

delež premoga s pepelom ... 20%

določen selektivni delež

kjer je M-delež enot z znakom

napaka pri vzorčenju za delnico

Z verjetnostjo 0,954 je mogoče trditi, da bo delež premoga s kapaciteto pepela več kot 20% na tem področju v mejah

P \u003d 10% + (-) 6% ali

Mehanski vzorec.

To je različna dejansko naključna. V tem primeru je celotno splošno prebivalstvo razdeljeno na N EQUAL DESE, nato pa je ena enota izbrana iz vsakega dela.

Vse enote splošne populacije bi morale biti v določenem naročilu. Hkrati se lahko v zvezi z kazalnikom, kazalnik splošne populacije odredi s pomembno, sekundarno ali nevtralno osnovo. Hkrati je treba izbrati enoto, ki je na sredini vsake skupine, izbrati iz vsake skupine. To preprečuje sistematično napako vzorčenja.

Uporabi: Pri preučevanju kupcev v trgovinah, obiskovalci v klinikah, vsakih 5.4.3 itd.

Primer mehanskega vzorca

Za določitev povprečnega obdobja uporabe bo kratkoročno posojilo v banki proizvedeno 5% mehanskega vzorca, v katerem je 100 računov padlo. Kot rezultat pregleda, je bilo ugotovljeno, da je povprečna uporaba kratkoročnega posojila 30 dni
9 dni v 5 računih Pogoji uporabe posojila\u003e 60 dni.

Napaka pri vzorčenju

ti. Z verjetnostjo 0,954 je mogoče trditi, da se izraz uporabe posojila niha

1 v 30 dneh. + (-) 2 dni, t.j.

2 Deleži posojil z mandatom\u003e 60 dni.

selektivni delež bo

določena je napaka

z verjetnostjo 0,954, je mogoče trditi, da bo delež posojil v banki z mandatom uporabe\u003e 60 bo v mejah

Tipičen vzorec.

Splošno prebivalstvo je razdeljeno na homogene tipične skupine. Potem, iz vsake tipične skupine, samodejni ali mehanski vzorec, se posamezni izbor enot izvede v selektivnem nizu

Na primer: tr. zaposleni, ki so sestavljeni iz posameznih ekip kvalifikacij.

Pomembna značilnost - daje natančnejše rezultate v primerjavi z drugimi, ker V vzorec je vključena tipologa.

Izbor opazovalnih enot v selektivni niz je narejen z različnimi metodami. Razmislite o tipičnem vzorcu s sorazmerno izbiro znotraj tipičnih skupin.

Velikost vzorca iz tipične skupine pri izbiri proporcionalnega števila tipičnih skupin je določena s formulo

kje \u003d V Vzorce iz tipične skupine

\u003d V tipična skupina.

Ekstremna napaka selektivnega medija in skupnega deleža z ne-nenamernim naključnim in mehanskim načinom izbire v tipičnih skupinah se izračuna z formulami


kje \u003d Razpršenost selektivnega agregata

Primer: Tipičen vzorec

Za določitev moških srednjih let, ki so poročeni, je 5-odstotni vzorec z izborom enot je sorazmeren s številom tipičnih skupin.

Znotraj skupine rabljena mehanska izbira

Z verjetnostjo 0,954 za določitev omejitev, v katerih bodo povprečna starost Moški, ki so vstopili v poroko, in delež moških, ki so bili spet poročeni.

srednja starost se poroči z moškimi v selektivnem agregatu

napaka z omejitvijo izbire

z verjetnostjo 0,954 se lahko trdi, da se povprečna starost moških, ki se poročijo z njimi, se nahaja znotraj

za moške, ki vstopajo v drugo poroko, da so znotraj

določen selektivni delež

selektivna disperzija alternativne funkcije

z verjetnostjo 0,954 je mogoče trditi, da je delež zakonske zveze v drugem času

Serijski vzorec.

V serijskem vzorcu je kombinacija razdeljena na isto skupino - serija. Selektivni komplet izbere serija. V seriji se izvaja neprekinjeno opazovanje enot v seriji.

Z ne-reverzibilnim izborom in določite formulo

kje
- medseklno razpršenost

kje
selektivna srednja serija

selektivno povprečno serijsko vzorčenje

R - število serij splošnega agregata

r - Število izbranih serij

Primer: 20% serijskega vzorca se bo izvajal v delavnici 10 brigad, da bi preučil njihovo produktivnost dela, v katerem je 2 brigade udarila. Kot rezultat ankete, je bilo ugotovljeno, da

z verjetnostjo 0,997 je mogoče ugotoviti omejitve, na katerih se bo našli povprečna proizvodna delavnica.

selektivni povprečni serijski vzorec se določi s formulo

z verjetnostjo 0,997 se lahko trdi, da je povprečna proizvodnja delavnic znotraj

V skladišču končnih izdelkov so trgovine 200 škatle delov 40 kosov v vsakem predalu. Za preverjanje kakovosti končnih izdelkov bo proizveden 10% serijskega vzorca. Kot rezultat vzorca je bilo ugotovljeno, da je za okvarjene dele 15%. Razpršenost serijskega vzorca je 0,0049.

Z verjetnostjo 0,997 je mogoče ugotoviti omejitve, v katerih se nahaja delež napaknih izdelkov v paketih

Delež okvarjenih delov bo znotraj

določamo napako meje izbire za delež formule

z verjetnostjo 0,997 se lahko trdi, da je delež okvarjenih delov

v zabavi je znotraj

V praksi oblikovanja selektivnega opazovanja, potreba po iskanju števila vzorca, ki je potrebna za zagotovitev določene natančnosti izračunavanja splošnih značilnosti - medij in delež.

Napaka pri izbiri, verjetnost njegovega videza in variacije funkcije je vnaprej znana.

Z naključnim ponovna izbira Velikost vzorca je določena s formulo

z naključnim ne-reverzibilnim in mehanskim izborom

za tipičen vzorec

za serijski vzorec

Primer na območju živi 2000 družin.

Predpostavlja se, da svoje vzorčne raziskave izvaja z metodo naključne nevzajemne izbire za iskanje srednje velikih družin.

Določite zahtevano število vzorcev, pod pogojem, da napaka vzorčenja ne presega 1 osebe s povprečnim kvadratnim odstopanjem 3 osebe z verjetnostjo 0,954.

V mestu živi 10 tisoč. družine. S pomočjo mehanskega vzorca se predlaga, da se določi delež družin s tremi otroki in še več. Kaj bi moralo biti število vzorčenja, tako da napaka vzorčenja ne presega 0,02, če napaka vzorčenja ne presega 0,02, če je disperzija znano, da je 0,02 na podlagi prejšnjih raziskav?