Criterii de selecție asimptotică. Optim asimptotic. Continuitatea distanței informaționale Kullback - Leibler - Sanov

Testele exacte oferă două metode suplimentare pentru calcularea nivelurilor de semnificație pentru statisticile disponibile prin procedurile Tabele încrucișate și Testele neparametrice. Aceste metode, metoda exactă și metoda Monte Carlo, oferă un mijloc de obținere a rezultatelor exacte atunci când datele dumneavoastră nu îndeplinesc oricare dintre ipotezele de bază necesare pentru rezultate fiabile folosind metoda asimptotică standard. Disponibil numai dacă ați achiziționat opțiunile Exact Tests.

Exemplu. Rezultatele asimptotice obținute din seturi de date mici sau tabele rare sau dezechilibrate pot induce în eroare. Testele exacte vă permit să obțineți un nivel de semnificație precis fără a vă baza pe ipoteze care ar putea să nu fie îndeplinite de datele dvs. De exemplu, rezultatele unui examen de admitere pentru 20 de pompieri într-o localitate mică arată că toți cei cinci candidați albi au primit un rezultat de promovare, în timp ce rezultatele pentru candidații negri, asiatici și hispanici sunt mixte. Un chi-pătrat Pearson care testează ipoteza nulă că rezultatele sunt independente de rasă produce un nivel de semnificație asimptotică de 0,07. Acest rezultat conduce la concluzia că rezultatele examenului sunt independente de rasa candidatului. Cu toate acestea, deoarece datele conțin doar 20 de cazuri și celulele au frecvențe așteptate mai mici de 5, acest rezultat nu este demn de încredere. Semnificația exactă a chi-pătratului Pearson este 0,04, ceea ce duce la concluzia opusă. Pe baza semnificației exacte, ați concluziona că rezultatele examenului și rasa candidatului sunt legate. Aceasta demonstrează importanța obținerii unor rezultate exacte atunci când ipotezele metodei asimptotice nu pot fi îndeplinite. Semnificația exactă este întotdeauna de încredere, indiferent de dimensiunea, distribuția, rarătatea sau echilibrul datelor.

Statistici. Semnificație asimptotică. Aproximație Monte Carlo cu nivel de încredere sau semnificație exactă.

  • Asimptotic. Nivelul de semnificație bazat pe distribuția asimptotică a unei statistici de test. De obicei, o valoare mai mică de 0,05 este considerată semnificativă. Semnificația asimptotică se bazează pe presupunerea că setul de date este mare. Dacă setul de date este mic sau slab distribuit, acesta poate să nu fie un bun indiciu al semnificației.
  • Estimare Monte Carlo. O estimare imparțială a nivelului exact de semnificație, calculată prin eșantionarea repetată dintr-un set de referință de tabele cu aceleași dimensiuni și marje de rând și coloană ca și tabelul observat. Metoda Monte Carlo vă permite să estimați semnificația exactă fără a vă baza pe ipotezele necesare pentru metoda asimptotică. Această metodă este cea mai utilă atunci când setul de date este prea mare pentru a calcula semnificația exactă, dar datele nu îndeplinesc ipotezele metodei asimptotice.
  • Corect. Probabilitatea rezultatului observat sau a unui rezultat mai extrem este calculată exact. , un nivel de semnificație mai mic de 0,05 este considerat semnificativ, indicând că de obicei există o relație între variabilele rând și coloană.
teză

Prin urmare, una dintre modalitățile de dezvoltare a testării ipotezelor statistice a fost calea construcției „empirice” a criteriilor, atunci când statisticile construite ale criteriului se bazează pe un anumit principiu, o idee ingenioasă sau bunul simț, dar optimitatea acestuia nu este garantat. Pentru a justifica utilizarea unor astfel de statistici la testarea ipotezelor față de o anumită clasă de alternative, cel mai adesea prin metoda...

  • 1. Informatii justificative
    • 1. 1. Informații din teoria statisticilor C/- și V
    • 1. 2. Definiția și calculul eficienței Bahadur
    • 1. 3. Pe abateri mari ale statisticilor II și V
  • 2. Criteriile de simetrie Baringhouse-Hentze
    • 2. 1. Introducere
    • 2. 2. Statistici
    • 2. 3. Statistici
  • 3. Criterii de exponentialitate
    • 3. 1. Introducere
    • 3. 2. Statistica I
    • 3. 3. Statistica n
  • 4. Criterii de normalitate
    • 4. 1. Introducere
    • 4. 2. Statistica B^
    • 4. 3. Statistica V^n
    • 4. 4. Statistica V|)P
  • 5. Criterii de acord cu legea lui Cauchy
    • 5. 1. Introducere
    • 5. 2. Statistici
    • 5. 3. Statistici

Proprietățile asimptotice ale simetriei și criteriile de acord bazate pe caracterizări (eseu, cursuri, diploma, test)

Această disertație construiește și studiază criteriile de bunătate și de simetrie pe baza proprietăților de caracterizare ale distribuțiilor și, de asemenea, calculează eficiența relativă asimptotică a acestora pentru un număr de alternative.

Construirea criteriilor statistice și studiul proprietăților lor asimptotice este una dintre cele mai importante probleme ale statisticii matematice. Când se testează o ipoteză simplă față de o alternativă simplă, problema este rezolvată folosind lema Neyman-Pearson, care, după cum se știe, dă criteriul optim (cel mai puternic) din clasa tuturor criteriilor unui anumit nivel. Acesta este testul raportului de probabilitate.

Cu toate acestea, pentru problemele de testare a ipotezelor mai dificile și practice care implică fie testarea ipotezelor complexe, fie luarea în considerare a alternativelor complexe, testele cele mai puternice în mod uniform există rareori, iar rolul testului raportului de probabilitate se schimbă semnificativ. Statistica raportului de probabilitate de obicei nu poate fi calculată în mod explicit; își pierde proprietatea de optimitate, iar distribuția sa este instabilă la modificările modelului statistic. Mai mult, statisticianul nu poate determina deloc tipul de alternativă, fără de care construcția criteriilor parametrice devine lipsită de sens.

Prin urmare, una dintre modalitățile de dezvoltare a testării ipotezelor statistice a fost calea construcției „empirice” a criteriilor, când statisticile construite ale criteriului se bazează pe un anumit principiu, o idee ingenioasă sau bunul simț, dar optimitatea acestuia nu este garantat.

Exemple tipice de astfel de statistici sunt statistica semnelor, statistica lui Pearson x2 (1900), statistica Kolmogorov (1933), care măsoară distanța uniformă dintre funcția de distribuție empirică și cea adevărată, coeficientul de corelație a rangului Kendall (1938) sau Bickel- Statistica Rosenblatt (1973), bazată pe riscul pătratic al evaluării densității nucleare. În prezent, statistica matematică are multe zeci de statistici „empirice” pentru testarea ipotezelor de concordanță, simetrie, omogenitate, aleatorie și independență, iar în literatura de specialitate se propun tot mai multe statistici de acest tip. O vastă literatură este dedicată studiului distribuțiilor lor exacte și limită, estimărilor ratei de convergență, abaterilor mari, expansiunilor asimptotice etc.

Pentru a justifica utilizarea unor astfel de statistici la testarea ipotezelor față de o anumită clasă de alternative, puterea lor este cel mai adesea calculată folosind modelarea statistică. Cu toate acestea, pentru orice criteriu consistent, puterea tinde spre unitate pe măsură ce dimensiunea eșantionului crește și, prin urmare, nu este întotdeauna informativ. O analiză mai profundă a proprietăților comparative ale statisticilor poate fi efectuată pe baza conceptului de eficiență relativă asimptotică (ARE). Diverse abordări pentru calcularea AOE au fost propuse de E. Pitman, J. Hodges și E. Lehman, R. Bahadur, G. Chernov și W. Kallenberg la mijlocul secolului XX, rezultatele dezvoltării teoriei AOE la mijlocul Anii 90 au fost rezumați în monografie. Există o opinie general acceptată conform căreia sinteza noilor criterii ar trebui să fie însoțită nu numai de o analiză a proprietăților acestora, ci și de calculul AOE pentru a evalua calitatea acestora și a oferi recomandări informate pentru utilizarea lor în practică.

Această lucrare folosește ideea de a construi criterii bazate pe caracterizarea distribuțiilor prin proprietatea echidistribuției. Teoria caracterizării provine din lucrarea lui D. Polya, publicată în 1923. Apoi a fost dezvoltată în lucrările lui I. Martsinkevich, S. N. Bernstein, E. Lukach, Yu. V. Linnik, A.A. Cântăreț, J. Darmois, V.P. Skitovich, S.R. Pao, A.M. Kagan, J. Galambos, S. Kotz, L. B. Klebanov și mulți alți matematicieni. Literatura de specialitate pe acest subiect este mare, iar în prezent există mai multe monografii dedicate caracterizărilor, de exemplu, , , , , , , .

Ideea de a construi criterii statistice bazate pe caracterizări prin proprietatea de echidistribuție îi aparține lui Yu. V. Linnik. La finalul lucrării sale extinse, el a scris: „. se poate pune problema construirii criteriilor pentru acordul unui eșantion cu o ipoteză complexă, pe baza distribuției identice a celor două statistici corespondente gi (xi> .xr) și g2(x, ¦¦¦xr) și reducând astfel întrebare la criteriul omogenității.”

Să revenim la teorema clasică a lui Polya pentru a explica cu un exemplu concret cum poate funcționa această abordare. În forma sa cea mai simplă, această teoremă este formulată după cum urmează.

teorema lui Polya. Fie X și Y două s centrate independente și distribuite identic. V. Apoi s. V. (X + Y)//2 și X sunt distribuite identic dacă și numai dacă legea distribuției lui X este normală.

Să presupunem că avem un eșantion de observații independente centrate Xi, ., Xn și dorim să testăm ipoteza nulă (complexă) conform căreia distribuția acestui eșantion este normală cu media 0 și o anumită varianță. Folosind eșantionul nostru, să construim funcția obișnuită de distribuție empirică (d.f.) n

Fn (t) = n-^VD

Gn(t) = n~2? VD + Xj< iv^}, t <= R1. i, j=l

În virtutea teoremei Glivenko-Cantelli, care este valabilă și pentru V-statistic empiric d.f. , pentru n mare funcția Fn(t) se apropie uniform de d.f. F (t) = P (X< t), а функция Gn (t) равномерно сближается с G (t) = ЦХ + У < tV2). Поскольку при нулевой гипотезе F = G, то Fn (t) близка к Gn (t), и критерий значимости можно основывать на подходящем функционале Тп от разности Fn (t) — Gn (t). Напротив, при альтернативе (то есть при нарушении нормальности) по теореме Пойа F ф G, что приводит к большим значениям Тп и позволяет отвергнуть нулевую гипотезу, обеспечивая состоятельность критерия.

Cu toate acestea, acest design, bazat pe ideea lui Yu. V. Linnik, nu a primit aproape nicio dezvoltare, probabil din cauza dificultăților tehnice în construirea și analiza criteriilor rezultate. Un alt motiv este probabil că caracterizările distribuțiilor prin proprietatea echidistribuției sunt puține și îndepărtate.

Știm doar câteva lucrări dedicate într-un grad sau altul dezvoltării ideii lui Yu. V. Linnik. Acestea sunt lucrările lui Baringhouse și Henze și Muliere și Nikitin, care vor fi discutate mai jos. Există, de asemenea, lucrări în care criteriile de bunătate de potrivire pentru distribuții specifice sunt, de asemenea, construite pe baza caracterizărilor, dar nu pe baza echidistribuției, de exemplu, , , , , , , , .

Cea mai frecventă utilizare în literatură este de a caracteriza distribuția exponențială folosind diferite variante ale proprietății fără memorie , , , , , , .

Trebuie remarcat faptul că în aproape toate aceste lucrări (cu excepția poate) AOE al criteriilor luate în considerare nu este calculat sau discutat. În această teză, nu doar studiem proprietățile asimptotice ale criteriilor de caracterizare cunoscute și propuse de noi, ci și calculăm AOE local exact (sau aproximativ) al acestora conform Bahadur.

Să definim acum conceptul de AOE. Fie (Tn) și (1^) două secvențe de statistici construite dintr-un eșantion X,., Xn cu distribuție Pd, unde în € 0 C R1, iar ipoteza nulă Ho este testată: 9 € în C față de alternativa A: în € ©-x = ©-6o. Fie Mm (a, P,0) dimensiunea minimă a eșantionului X[,., Xn, pentru care secvența (Tn) cu un nivel de semnificație dat, a > 0 atinge puterea /3< 1 при альтернативном значении параметра в € (c)1- Аналогично вводится в). Относительной эффективностью критерия, основанного на статистике Тп, по отношению к критерию, основанному на Уп, называется величина равная обратному отношению указанных выборочных объемов:

Deoarece eficiența relativă în funcție de trei argumente nu poate fi calculată în mod explicit nici măcar pentru cele mai simple statistici, se obișnuiește să se ia în considerare limitele:

Ptet, y (a,/?, 0), Ntet, y (a,/3,0).

In primul caz se obtine AOE dupa Bahadur, a doua limita determina AOE dupa Hodges-Lehman, iar a treia conduce la determinarea AOE dupa Pitman. Întrucât în ​​aplicațiile practice sunt cele mai interesante cazurile de niveluri de semnificație scăzute, puteri mari și alternative apropiate, toate cele trei definiții par rezonabile și naturale.

În această lucrare, pentru a compara criteriile, vom folosi AOE conform Bahadur. Există mai multe motive pentru aceasta. În primul rând, eficiența Pitman este potrivită în principal pentru statistici normale asimptotic și în această condiție coincide cu eficiența locală Bach-Dur, . Considerăm nu numai statisticile asimptotic normale, ci și statisticile de tip patratic, pentru care distribuția limită în ipoteza nulă diferă brusc de normală, astfel încât eficiența Pitman nu este aplicabilă. În al doilea rând, AOE Hodges-Lehman este nepotrivit pentru studierea criteriilor cu două fețe, deoarece toate se dovedesc a fi optime asimptotic, iar pentru criteriile unilaterale acest AOE coincide de obicei local cu AOE Bahadur. În al treilea rând, recent s-au înregistrat progrese semnificative în domeniul abaterilor mari pentru statisticile de testare, ceea ce este crucial atunci când se calculează AOE Bahadur. Ne referim la marile abateri ale statisticilor U- și V descrise în lucrări recente și.

Să trecem acum la o privire de ansamblu asupra conținutului disertației. Primul capitol este de natură auxiliară. Acesta stabilește informațiile teoretice și tehnice necesare din teoria 11-statisticii, teoria abaterilor mari și teoria eficienței asimptotice conform lui Bahadur.

Capitolul 2 este dedicat construcției și studiului criteriilor de testare a ipotezei de simetrie. Baringhouse și Henze au propus ideea de a construi criterii de simetrie pe baza următoarei caracterizări elementare.

Fie X și Y n.o.s.v.s având un d.f continuu. Apoi |X| și |max (X, Y)| distribuite identic dacă și numai dacă X și Y sunt distribuite simetric în jurul zero.

Folosim această caracterizare pentru a construi noi criterii de simetrie. Să ne amintim că mai multe criterii de simetrie clasice (vezi, Capitolul 4) se bazează pe caracterizarea simetriei prin proprietatea și mai simplă a echidistribuției a X și -X.

Să revenim la caracterizarea Baringhouse-Hentze. Fie X, ., Xn observații având un d.f continuu.<7. Рассмотрим проверку гипотезы симметрии:

H0: OD = 1 —<3(-:г) V я (Е Я1. Это сложная гипотеза, поскольку вид С? не уточняется. В качестве альтернатив мы рассмотрим параметрическую альтернативу сдвига, т. е. G (x-0) = F (x — в), в >0-alternativă oblică, adică d(x-b) = 2f(x)F ($x), c > 0-alternativă Leman, adică G(x-, 6) = F1+ e (x), 6 > 0 și alternativa de poluare , adică G(x-6) = (1 - 6) F(x) + 6Fr+1(x), în > 0, r > 0, unde F (x) și f (x) sunt d.f. și densitatea unei distribuții simetrice.

În conformitate cu caracterizarea de mai sus, un df empiric este construit pe baza |Xj|,., Xn, n

Hn (t) = n~2 J2 Tmax (X^Xk)<г}. На основе этих функций составляются статистики: лоо ):

Fie X uY n.o.s.v.s nenegativ și nedegenerat având un d.f. diferențiabil la zero. F și fie 0< а < 1. Тогда X и min (^, —) одинаково распределены тогда и только тогда, когда F есть ф.р. экспоненциального закона.

Pe lângă construirea criteriului de acord în sine și studierea proprietăților sale asimptotice, este interesant să se calculeze AOE a unui nou criteriu și să se studieze dependența acestuia de parametrul a.

A doua generalizare a acestei caracterizări îi aparține lui Des. O formulăm pe baza unor lucrări mai recente:

Fie Xi, ., Xm, m ^ 2 i.s nenegativ și nedegenerat. r.v.s având un d.f. diferențiabil la zero. F. Atunci statisticile X și m minpfi, ., Xm) sunt distribuite identic dacă și numai dacă F este un d.f. legea exponenţială.

Fie Xx,., Xn observații independente având d.f. Pe baza caracterizărilor formulate mai sus, putem testa ipoteza exponenţială Ho, care constă în faptul că (7 este d.f. al legii exponenţiale. P, faţă de alternativa H, care constă în faptul că C f? sub adiţional slab. conditii.

În conformitate cu aceste caracterizări, se construiește un df empiric. p = pVD< О (°-0−3) 1 и -статистические ф.р. п-2 ± (* ^ < 4} + ^{тш (?, < «}), 1 П

Ne propunem să se bazeze criteriile de verificare a exponenţialităţii pe statistici: pkp = - c&bdquo-(*)] aop(1).

Ca alternative, alegem alternativele standard utilizate în literatura de specialitate privind testarea exponențială: alternativa Weibull cu d(x) = (β + 1)xx(-x1+β), x ^ 0- alternativa Makehama cu d(x) = ( 1 + 0(1 - exp (-x))) exp (-x - 0(exp (-x) - 1 + x)), x ^ 0 - o alternativă la liniaritatea funcției rata de eșec cu d (x) = (1 + bx) exp[—x—^bx2], x^O.

Pentru cele două statistici propuse mai sus, distribuțiile limită sub ipoteza nulă se scriu:

Teorema 3.2.1 Pentru statisticile Uε pentru n -* oo, relația este valabilă: unde Dz(a) este definit în (3.2.2). Teorema 3.3.1 Pentru statisticile n ca n -> oo relația este valabilă

U0,(t + 1)2A1(t)), unde D4 (t) este definit în (3.3.6).

Deoarece ambele statistici depind de parametrii a și m, stabilim la ce valori ale parametrilor AOE conform Bahadur ating maximul și găsim aceste valori. În plus, construim o alternativă în care maximul este atins în punctul și φ ½.

Al patrulea capitol este consacrat testării ipotezei de normalitate. Există multe caracterizări ale legii normale ca una dintre legile centrale ale teoriei probabilităților și ale statisticii matematice și două monografii dedicate exclusiv acestei probleme. Vom lua în considerare o versiune ușor simplificată a caracterizarii binecunoscute a și:

Fie Xr, X2, ., Xm centrate n.o.s.v.s având d.f. o constantele a, a-2,., am sunt astfel încât 0< а* < 1 и = 1. Тогда статистики Х и одинаково распределены тогда и только тогда, когда F (x) = Ф (х/а), то есть F — ф.р. нормального закона с нулевым средним и некоторой дисперсией, а > 0.

Fie X, ., Xn un eșantion cu d.f. G. Pe baza acestei caracterizări, putem testa ipoteza principală R0, care este că G este un d.f. legea normală Fa (x) = Ф (x/a), față de alternativa Hi, care este că G φ Fa. Se construiește df empiric obișnuit. Gn și V-statistice d.f. n^

Bm, n (t) = n~t (E1 + - +< *}),

1.¿-t=1 s

În continuare, simbolul a înseamnă însumarea tuturor permutărilor indicilor. Criteriile de testare a normalității se pot baza pe următoarele statistici:

B, n = Г dGn (t), J -00 oo

BmAt)-Gn (t)]dGn (t), oo

Bin = G t-k

y(k) = y](xt p)(xt+k p) - estimare pentru autocovarianța y(k).

Eșantion de autocorelații parțiale sunt estimări ale autocorelațiilor parțiale prap(t) ale unui proces aleatoriu, construite din implementarea existentă a unei serii de timp.

Procesul de zgomot alb gaussian este un proces de zgomot alb ale cărui distribuții unidimensionale sunt distribuții normale cu așteptări matematice zero.

Proces aleator gaussian - un proces aleatoriu pentru care pentru orice număr întreg m > O și orice set de ori tx< t2 < ... < tm совместные распределения случайных величин Xti, Xtm являются m-мерными нормальными распределениями.

Inovația este valoarea curentă a erorii aleatoare din partea dreaptă a relației care determină procesul de autoregresie Xr Inovația nu este

corelat cu valori întârziate Xt_k9 k= 1, 2, ... Valorile consecutive ale inovațiilor (secvența inovației) formează un proces de zgomot alb.

Criteriul de informare Akaike (AIC) este unul dintre criteriile de selectare a „cel mai bun” model dintre mai multe modele alternative. Dintre valorile alternative ale ordinului modelului autoregresiv, este selectată valoarea care minimizează valoarea

o 2k A1C(£) = 1n0£2+y,

Estimarea dispersiei inovațiilor єг în modelul AR este de regulă.

Criteriul Akaike supraestimează (suprestimează) în mod asimptotic valoarea adevărată a lui k0 cu probabilitate diferită de zero.

Criteriul de informare Hannan-Quinn (HQC) este unul dintre criteriile de selectare a „cel mai bun” model dintre mai multe modele alternative. Dintre valorile alternative ale ordinului modelului autoregresiv, este selectată valoarea care minimizează valoarea

UQ(k) = În a2k + k - ,

unde T este numărul de observații;

(t£ - estimarea dispersiei inovațiilor st în modelul AR de ordinul A>-lea.

Criteriul are o convergenţă destul de rapidă la valoarea adevărată a lui k0 la T -» oo. Cu toate acestea, pentru valori mici ale lui T, acest criteriu subestimează ordinea autoregresiei.

Criteriul de informare Schwarz (SIC) este unul dintre criteriile de selectare a „cel mai bun” model dintre mai multe modele alternative. Dintre valorile alternative ale ordinului modelului autoregresiv, este selectată valoarea care minimizează valoarea

SIC(£) = lno>2+Ar-,

unde T este numărul de observații;

A? - evaluarea dispersării inovaţiilor st în modelul AR al A: ordine.

Corelogramă - pentru o serie staționară: un grafic al dependenței valorilor de autocorelare p(t) ale unei serii staționare pe t. O corelogramă se mai numește și o pereche de grafice date în protocoalele de analiză a datelor în diferite pachete de analiză statistică: a graficul unei funcții de autocorelare eșantion și un grafic al unei funcții de autocorelare parțială eșantion. Prezența acestor două diagrame ajută la identificarea modelului ARMA care generează setul disponibil de observații.

Backcasting este o tehnică pentru obținerea unei aproximări mai precise a funcției de probabilitate condiționată atunci când se estimează un model de medie mobilă MA(q):

Xt = et + bxst_x + b2st_2 + ... + bqet_q9 bq Ф0,

conform observatiilor xl9..., xt. Rezultatul maximizării (fără bx, bl9 ..., bq) a funcției de probabilitate condiționată corespunzătoare valorilor observate xХ9х29 ...9хт pentru valori fixe ale є09 є_Х9 є_д+Х9 depinde de valorile selectate ale b*0, е_є_д+1. Dacă procesul MA(q) este reversibil, atunci putem pune 6*0 = є_х = ... = s_q+x = 0. Dar pentru a îmbunătăți calitatea estimării, putem folosi metoda de prognoză inversă pentru a „estima” valorile є09 e_Х9 є_д+х și utilizați valorile estimate în funcție de probabilitate condiționată. Operator de întârziere (L)9 operator de schimbare înapoi - operator definit prin relația: LXt = Xt_x. Convenabil pentru înregistrarea compactă a modelelor serii de timp și pentru formularea condițiilor care asigură anumite proprietăți ale seriei. De exemplu, folosind acest operator, ecuația care definește modelul ARMA(p, q).

Xt = Z ajxt-j + Z bj£t-j ><*Р*ъ>ych* Oh,

se poate scrie ca: a(L) Xt = b(b)єп unde

a(L) = 1 (axL + a2L2 + ... + apLp

b(L)=l+blL + b2L2 + ... + bqLq.

Problema factorilor comuni este prezența factorilor comuni în polinoamele a(L) și b(L)9 corespunzătoare componentelor AR și MA ale modelului ARMA:

Prezența unor factori comuni în specificația modelului ARMA face dificilă identificarea practic a modelului printr-o serie de observații.

Un proces autoregresiv de ordinul întâi (AR(1)) este un proces aleatoriu, a cărui valoare curentă este suma unei funcții liniare a valorii procesului întârziată cu un pas și a unei erori aleatoare care nu este corelată cu valorile procesului trecut. În acest caz, o secvență de erori aleatoare formează un proces de zgomot alb.

Un proces autoregresiv de ordinul p (proces autoregresiv de ordinul p - AR(p)) este un proces aleatoriu, a cărui valoare curentă este suma unei funcții liniare a valorilor procesului întârziate cu p pași sau mai puțin și o eroare aleatorie nu este corelat cu valorile procesului trecut. În acest caz, o secvență de erori aleatoare formează un proces de zgomot alb.

Un proces de medie mobilă de ordinul q (proces de medie mobilă de ordinul q - MA(g)) este un proces aleatoriu, a cărui valoare curentă este o funcție liniară a valorii curente a unui proces de zgomot alb și a valorilor acestui procesul de zgomot alb întârziat cu p pași sau mai puțin.

Descompunerea lui Wold este o reprezentare a unui proces staționar, cu așteptări matematice zero, ca sumă a unui proces de medie mobilă de ordine infinită și a unui proces liniar determinist.

Autoregresia sezonieră de ordinul întâi (SAR(l) - autoregresia sezonieră de ordinul întâi) este un proces aleatoriu, a cărui valoare curentă este o funcție liniară a valorii acestui proces întârziată cu S pași și o eroare aleatorie necorelată cu valorile trecute ale procesului. În acest caz, o secvență de erori aleatoare formează un proces de zgomot alb. Aici S = 4 pentru datele trimestriale, S = 12 pentru datele lunare.

Media mobilă sezonieră de ordinul întâi (SMA(l) - medie mobilă sezonieră de ordinul întâi) este un proces aleatoriu, a cărui valoare curentă este egală cu suma unei funcții liniare a valorii curente a unui proces de zgomot alb și valoarea a acestui proces de zgomot alb întârziat cu S trepte. În acest caz, o secvență de erori aleatoare formează un proces de zgomot alb. Aici 5 = 4 pentru datele trimestriale, 5 = 12 pentru datele lunare.

Sistemul de ecuații Yule - Walker este un sistem de ecuații care conectează autocorelațiile unui proces autoregresiv staționar de ordinul p cu coeficienții săi. Sistemul vă permite să găsiți în mod consecvent valorile autocorelațiilor și face posibilă, folosind primele p ecuații, să exprimați coeficienții procesului de autoregresie staționară prin valorile primelor p autocorelații, care pot fi utilizate direct atunci când selectarea unui model de autoregresie la date statistice reale.

Un proces aleator cu timp discret (proces stocastic în timp discret, proces aleator în timp discret) este o succesiune de variabile aleatoare corespunzătoare observațiilor efectuate în momente succesive de timp, având o anumită structură probabilistică.

Un proces de medie mobilă autoregresiv mixt, un proces autoregresiv cu reziduuri sub forma unei medii mobile (media mobilă autoregresivă, medie mobilă autoregresivă mixtă - ARMA(p, q)) este un proces aleatoriu, a cărui valoare curentă este suma o funcție liniară a pașilor întârziați cu p sau mai puține valori ale procesului și o funcție liniară din valoarea curentă a unui proces de zgomot alb și valorile acestui proces de zgomot alb întârziate cu q pași sau mai puțin.

Box-Pierce Q-statistic - una dintre opțiunile g-statistic:

Є = r£g2(*),

Ljung-Box Q-statistic este una dintre opțiunile de statistică g, de preferat statisticilor Box-Pierce:

unde T este numărul de observații; r (k) - autocorelații eșantion.

Folosit pentru a testa ipoteza că datele observate sunt o realizare a unui proces de zgomot alb.

Staționar cu sens larg, staționar cu sens slab, staționar slab, staționar de ordinul doi, proces stocastic covariantă-staționar - proces aleator cu așteptare matematică constantă, varianță constantă și variabile aleatoare invariante Xt,Xt+T:

Cov(Xt,Xt+T) = r(r).

Strict staționar, staționar în sens restrâns (strict staționar, staționar în sens strict) proces aleator (proces stocastic) - un proces aleator cu distribuții comune ale variabilelor aleatoare Xh + T, ..., + T invariant în r.

Condiție de reversibilitate a proceselor MA(q) și ARMA(p, q) (condiție de invertibilitate) - pentru procesele Xt de forma MA(g): Xt = b(L)st sau ARMA(p, q): a(L )(Xt ju ) = = b(L)st - condiție pe rădăcinile ecuației b(z) = O, asigurând existența unei reprezentări echivalente a procesului Xt sub forma unui proces autoregresiv de ordin infinit AR( oo):

Condiție de reversibilitate: toate rădăcinile ecuației b(z) = O se află în afara cercului unitar |z|< 1.

Condiție de staționaritate pentru procesele AR(p) și ARMA(p, q) - pentru procesele Xt de forma AR(p): a(L)(Xt ju) = et sau ARMA(p, q) a(L)( Xt ju) = = b(L)st - condiție pe rădăcinile ecuației a(z) = 0, asigurând staționaritatea procesului Xg Condiție de staționaritate: toate rădăcinile ecuației b(z) = O se află în afara cercului unitar |z|< 1. Если многочлены a(z) и b(L) не имеют общих корней, то это условие является необходимым и достаточным условием стационарности процесса Хг

Funcția de autocorelare parțială (PACF - funcția de autocorelare parțială) - pentru o serie staționară, succesiunea de autocorelații parțiale prap(r), m = 0, 1,2,...

Autocorelație parțială (PAC - autocorelare parțială) - pentru o serie staționară, valoarea ppart(r) a coeficientului de corelație între variabilele aleatoare Xt nXt+k, curățată de influența variabilelor aleatoare intermediare Xt+l9...9Xt+k_Y.

Etapa de verificare a diagnosticului modelului - diagnosticarea modelului ARMA estimat, selectat pe baza seriei de observații disponibile.

Etapa de identificare a modelului - selectarea unui model de generare a seriei pe baza seriei disponibile de observații, determinarea ordinelor p și q ale modelului ARMA.

Etapa de evaluare a modelului (etapa de estimare) - estimarea coeficienților modelului ARMA, selectați pe baza seriei de observații disponibile.

(Q-statistics) - statistici de testare utilizate pentru a testa ipoteza că datele observate sunt implementarea unui proces de zgomot alb.

La secțiunea 8

Autorregresia vectorială de ordin p (autoregresia vectorială de ordinul ph - VAR(p)) este un model de generare a unui grup de serii temporale, în care valoarea curentă a fiecărei serii constă dintr-o componentă constantă, combinații liniare de lagged (până la ordin). p) valorile acestei serii și ale altor serii și eroare aleatorie. Erorile aleatoare din fiecare ecuație nu sunt corelate cu valorile întârziate ale tuturor seriilor luate în considerare. Vectorii aleatori formați din erori în serii diferite în același timp sunt vectori aleatori independenți, distribuiți identic, cu medii zero.

Relația pe termen lung este o anumită relație stabilită în timp între variabile, în raport cu care apar oscilații destul de rapide.

Multiplicatori pe termen lung (multiplicatori pe termen lung, multiplicatori de echilibru) - într-un model dinamic cu decalaje distribuite autoregresive - coeficienții cx,cs ai dependenței pe termen lung a unei variabile de variabilele exogene xi, xst. Coeficientul Cj reflectă modificarea valorii lui yt atunci când valorile curente și anterioare ale variabilei xjt se modifică cu unu.

Multiplicatori de impuls (multiplicator de impact, multiplicator pe termen scurt) - într-un model dinamic cu întârzieri distribuite autoregresiv - valori care arată influența modificărilor unice (de impuls) ale valorilor variabilelor exogene chi, xst asupra curentului și valorile ulterioare ale variabilei jr

Covarianțele încrucișate sunt coeficienți de corelație între valorile diferitelor componente ale unei serii vectoriale în momente coincidente sau divergente în timp.

Funcția de covarianță încrucișată este o succesiune de corelații încrucișate a două componente ale unei serii de vectori staționari.

Modelele cu modele autoregresive distribuite lag (ADL) sunt modele în care valoarea curentă a unei variabile explicate este suma unei funcții liniare a mai multor valori întârziate ale acestei variabile, combinații liniare de curent și mai multe valori întârziate ale variabilelor explicative și eroare aleatorie.

Funcția de transfer este o funcție matriceală care stabilește efectul modificărilor de unitate ale variabilelor exogene asupra variabilelor endogene.

Procesul de generare a datelor (DGP) este un model probabilistic care generează date statistice observabile. Procesul de generare a datelor este de obicei necunoscut cercetătorului care analizează datele. Excepție fac situațiile în care cercetătorul însuși alege procesul de generare a datelor și obține date statistice artificiale prin simularea procesului de generare a datelor selectat.

Modelul statistic (SM) este modelul ales pentru evaluare, a cărui structură se presupune că corespunde procesului de generare a datelor. Alegerea modelului statistic se face pe baza teoriei economice existente, a analizei datelor statistice disponibile și a rezultatelor studiilor anterioare.

Seria vectorială staționară (AG-dimensională) (seria temporală staționară K-dimensională) - o succesiune de vectori aleatori de dimensiunea K, având aceiași vectori de așteptări matematice și aceleași matrice de covarianță, pentru care corelații încrucișate (corelații încrucișate) între valoarea k-a componente a seriei în momentul t și valoarea primei componente a seriei în momentul (t + s) depind doar de s.

La secțiunea 9

Ipoteza rădăcinii unitare (UR - ipoteza rădăcinii unitare) - o ipoteză formulată în cadrul modelului ARMA(^, q): a(L)Xt = b(L)cr Ipoteza că polinomul autoregresiv a(L) al modelului ARMA are cel puțin o rădăcină egală cu 1. În acest caz, se presupune de obicei că polinomul a(L) nu are rădăcini al căror modul este mai mic de 1.

Diferențierea - trecerea de la o serie de niveluri Xt la o serie de diferențe Xt Xt_v Diferențierea consecventă a unei serii face posibilă eliminarea tendinței stocastice prezente în seria originală.

Seria integrată de ordinul k - o serie Xn care nu este staționară sau staționară în raport cu o tendință deterministă (adică nu este o serie TS) și pentru care seria obținută ca urmare a diferențierii în ^-fold a seriei Xn este staționară , dar seria obținută ca urmare a diferențierii (k 1)-ori a seriei Xr nu este o serie HY.

Relația de cointegrare este o relație pe termen lung între mai multe serii integrate, care caracterizează starea de echilibru a sistemului acestor serii.

Un model de corectare a erorilor este o combinație de modele de regresie dinamică pe termen scurt și pe termen lung în prezența unei relații de cointegrare între seriile integrate.

Operator de diferențiere - operator A, transformând o serie de niveluri Xt într-o serie de diferențe:

Serii temporale supradiferențiate - o serie obținută ca urmare a diferențierii seriei G5. Diferențierea consecventă a seriei GO ajută la eliminarea tendinței polinomiale deterministe. Cu toate acestea, diferențierea seriei T are unele consecințe nedorite atunci când se selectează un model din datele statistice și se utilizează modelul selectat în scopul de a prezice valorile viitoare ale seriei.

Diferență staționară, seria LU (DS - diferență serie de timp staționară) - serii integrate de diverse ordine k = 1,2, ... Sunt reduse la o serie staționară prin diferențiere simplă sau multiplă, dar nu pot fi reduse la o serie staționară prin scăderea unei tendinţe deterministe.

O serie de tip ARIMA(p, A, q) (ARIMA - medie mobilă integrată autoregresivă) este o serie temporală care, ca urmare a diferențierii ^-fold, se reduce la o serie staționară ARMA(p, q).

Seria staționară în raport cu o tendință deterministă, seria G5

(TS - trend-stationary time series) - serii care devin staționare după scăderea unei tendințe deterministe din ele. Clasa unor astfel de serii include și serii staționare fără o tendință deterministă.

Random walk, random walk process - un proces aleatoriu ale cărui incremente formează un proces de zgomot alb: AXt st, deci Xt = Xt_ x + єг

Random walk with drift, random walk with drift (mersul aleator cu drift) este un proces aleatoriu, ale cărui incremente sunt suma unei constante și a unui proces de zgomot alb: AXt = Xt Xt_ x = a + st, deci Xt = Xt_x + a + ег Constanta a caracterizează deriva traiectoriilor de mers aleatoare care este prezentă constant în timpul trecerii la următorul moment în timp, căruia i se suprapune o componentă aleatoare.

Tendință stocastică - seria temporală Zt pentru care

Z, = єх + є2 + ... + et. Valoarea mersului aleator la momentul t este t

Xt = Х0 + ^ є8, deci Xt Х0 = єх + є2 + ... + єг Cu alte cuvinte, modelul

tendință stocastică - procesul de mers aleatoriu, „ieșind din originea coordonatelor” (pentru acesta X0 = 0).

Inovația șoc este o schimbare unică (de impuls) în inovație.

Efectul Slutsky este efectul formării periodicității false la diferențierea unei serii care este staționară în raport cu o tendință deterministă. De exemplu, dacă seria originală este suma unei tendințe liniare deterministe și a zgomotului alb, atunci seria diferențiată nu are o tendință deterministă, ci se dovedește a fi autocorelată.

^-ipoteza (ipoteza TS) - ipoteza că seria temporală luată în considerare este staționară sau o serie staționară în raport cu o tendință deterministă.

La secțiunea 10

Varianta pe termen lung - pentru o serie cu așteptări matematice zero este definită ca limită

Var(ux +... + it)

G-yus T T-+OD

Testele Dickey-Fuller sunt un grup de criterii statistice pentru testarea ipotezei rădăcinii unitare în cadrul unor modele care presupun așteptări matematice zero sau nenule pentru o serie de timp, precum și prezența posibilă a unei tendințe deterministe în serie.

Atunci când se aplică criteriile Dickey-Fuller, modelele statistice sunt cel mai adesea evaluate

pAxt = a + (3t + cpxt_x + +є*> t = P + h---,T,

Axt =a + cpxt_x + ^0jAxt_j +£*, t = /7 + 1,..., Г,

Axt = cpxt_x + ]T 6j Axt_j +єп t = p +1,..., T.

/-statisticile/valorile obținute în timpul evaluării acestor modele statistice pentru testarea ipotezei H0: cp = O sunt comparate cu valorile critice /crit, în funcție de alegerea modelului statistic. Ipoteza rădăcinii unitare este respinsă dacă f< /крит.

Testul Kwiatkowski-Phillips-Schmidt-Shin (testul KPSS) este un criteriu de distincție a seriei DS și Г5, în care ipoteza ha este luată drept zero.

Testul Leybourne este un criteriu de testare a ipotezei rădăcinii unității, a cărei statistică este egală cu maximul celor două valori ale statisticii Dickey-Fuller obținute din seria originală și din seria inversată în timp.

Testul Perron - un criteriu pentru testarea ipotezei nule conform căreia o serie aparține clasei DS, generalizând procedura Dickey-Fuller la situațiile în care în timpul perioadei de observație apar modificări structurale în model la un moment dat în timp Tb sub formă fie o schimbare de nivel (modelul „colaps”) sau o modificare a pantei tendinței (modelul „schimbarea creșterii”) sau o combinație a acestor două modificări. Se presupune că momentul Tb este determinat exogen - în sensul că nu este selectat pe baza unei examinări vizuale a graficului seriei, ci este asociat cu momentul unei schimbări pe scară largă cunoscute a situației economice, care afectează semnificativ comportamentul seriei în cauză.

Ipoteza rădăcinii unitare este respinsă dacă valoarea observată a statisticii testului ta este sub nivelul critic, adică. Dacă

Distribuțiile asimptotice și valorile critice pentru statisticile ta9 date inițial de Perron sunt valabile pentru modelele cu valori aberante de inovație.

Testul Phillips-Perron - un criteriu care reduce testarea ipotezei că seria xt aparține clasei de serie DS la testarea ipotezei R0: av = O în cadrul unui model statistic

SM: kxt=a + f3t + (pxt_x+un t = 2,...,T,

unde, ca și în criteriul Dickey-Fuller, parametrii an p pot fi luați egali cu zero.

Cu toate acestea, spre deosebire de criteriul Dickey-Fuller, este permisă luarea în considerare o clasă mai largă de serii temporale.

Criteriul se bazează pe statisticile G pentru a testa ipoteza H0:<р = О, но использует вариант этой статистики Zn скорректированный на возможную автокоррелированность и гетероскедастичность ряда иг

Testul Schmidt-Phillips - un criteriu pentru testarea ipotezei rădăcinii unitare în cadrul modelului

unde wt = jSwt_x + st; t-2,G;

y/ - parametru reprezentând nivelul; £ este un parametru care reprezintă tendința.

Criteriul DF-GLS (testul DF-GLS) este un criteriu asimptotic mai puternic decât criteriul Dickey-Fuller.

Kurtosis este coeficientul de distribuție de vârf.

Un model aditiv outlier este un model în care, la trecerea prin data pauzei Tb, seria yt începe imediat să oscileze în jurul unui nou nivel (sau a unei noi linii de tendință).

Modelul innovation outlier este un model în care, după trecerea datei de pauză Tv, procesul yt atinge doar treptat un nou nivel (sau o nouă linie de tendință), în jurul căruia traiectoria seriei începe să oscileze.

Procedura multivariată de testare a ipotezei rădăcinii unitare (Dolado, Jenkinson, Sosvilla-Rivero) - o procedură formalizată de utilizare a criteriilor Dickey-Fuller cu verificarea secvenţială a posibilităţii de reducere a modelului statistic original, pe care modelul este considerat ca fiind

PAxt = a + fit + (pxt_x + ^0jAxt-j +£7> t = P + h---9T.

O condiție prealabilă pentru utilizarea unei proceduri multivariate formalizate este puterea scăzută a testelor rădăcinii unitare. Prin urmare, procedura multivariată implică teste repetate ale ipotezei rădăcinii unitare în modele mai simple cu mai puțini parametri de estimat. Aceasta crește probabilitatea respingerii corecte a ipotezei rădăcinii unității, dar este însoțită de o pierdere a controlului asupra nivelului de semnificație al procedurii.

Testul Perron generalizat - un criteriu necondiționat propus de Zivot și Andrews (legat de emisiile inovatoare), în care datarea punctului de schimbare a regimului se realizează într-un „mod automat”, prin căutarea prin toate opțiunile de întâlnire posibile și calculând pentru fiecare întâlnire. opțiunea / -statistica ta pentru a testa ipoteza rădăcinii unității; Data estimată este considerată cea pentru care valoarea lui ta este minimă.

Procedura Cochrane, testul raportului de varianță - o procedură pentru distingerea TS și /)5-seria, pe baza comportamentului specific pentru acestea

serie a relației VRk = -, unde Vk = -D(Xt -Xt_k).

Mișcarea browniană standard este un proces aleator W(r) cu timp continuu, care este un analog continuu al unei mers aleatoare discrete. Acesta este un proces pentru care:

incrementele (W(r2) W(r()),(W(rk) W(rk_x)) sunt colectiv independente dacă 0< rx < г2 < ... < гк и W(s) W(r) ~ N(0, s г) при s >G;

realizările procesului W(r) sunt continue cu probabilitatea 1.

Mărimea ferestrei este numărul de autocovarianțe ale eșantionului din seria utilizată în estimatorul Newey-West pentru varianța pe termen lung a seriei. Lățimea insuficientă a ferestrei duce la abateri de la dimensiunea nominală a criteriului (nivel de semnificație). În același timp, creșterea lățimii ferestrei pentru a evita abaterile de la dimensiunea nominală a criteriului duce la o scădere a puterii criteriului.

Zgomotul alb gaussian bidimensional este o secvență de vectori aleatori independenți, distribuiți identic, având o distribuție normală bidimensională cu așteptare matematică zero.

Cointegrarea deterministă (cointegrarea stocastică) este existența pentru un grup de serii integrate a combinației lor liniare, anulând tendințele stocastice și deterministe. Seria reprezentată de această combinație liniară este staționară.

Identificarea vectorilor de cointegrare este alegerea unei baze pentru spațiul de cointegrare, constând din vectori de cointegrare care au o interpretare economică rezonabilă.

Spațiul de cointegrare este mulțimea tuturor vectorilor posibili de cointegrare pentru un sistem de cointegrare de serie.

Seria temporală cointegrată, seria temporală cointegrată în sens restrâns, este un grup de serii temporale pentru care există o combinație liniară netrivială a acestor serii, care este o serie staționară.

Vectorul de cointegrare este un vector de coeficienți ai unei combinații liniare netriviale de mai multe serii, care este o serie staționară.

Testul valorii proprii maxime este un criteriu care, în procedura Johansen de estimare a rangului de cointegrare g al unui sistem de serii integrate (de ordinul 1), este utilizat pentru a testa ipoteza H0: r = r* față de ipoteza alternativă HA: r = r* + 1.

Testul urmei este un criteriu care, în procedura Johansen de estimare a rangului de cointegrare g al unui sistem de serii integrate (de ordin 1), este utilizat pentru a testa ipoteza H0: r = r* față de ipoteza alternativă HA: r > g* .

Tendințele comune sunt un grup de serii care controlează nonstaționaritatea stocastică a unui sistem de serii cointegrate.

Cauzalitatea Granger este faptul de a îmbunătăți calitatea prognozei valorii yt a variabilei Y la momentul t pe baza totalității tuturor valorilor trecute ale acestei variabile, ținând cont de valorile trecute ale altei variabile.

Cinci situații în procedura Johansen - cinci situații de care depind valorile critice ale statisticilor criteriilor raportului de probabilitate utilizate în procedura Johansen pentru estimarea rangului de cointegrare a unui sistem de serii integrate (de ordinul 1):

H2(d): nu există tendințe deterministe în date, nici o constantă, nici o tendință nu sunt incluse în SE;

H*(g): nu există tendințe deterministe în date,

CE include o constantă, dar nu include o tendință;

Hx (g): datele au o tendință liniară deterministă, CE include o constantă, dar nu include o tendință;

Н*(r) există o tendință liniară deterministă în date, o tendință constantă și una liniară sunt incluse în SE;

N(g): datele au o tendință pătratică deterministă, CE include o tendință constantă și una liniară.

(Aici CE este ecuația de cointegrare.)

Pentru un rang fix r, cele 5 situații enumerate formează un lanț de ipoteze imbricate:

H2(g) cu H*(g) cu I, (g) cu Ng) cu H(g).

Acest lucru face posibilă, folosind criteriul raportului de probabilitate, să se testeze îndeplinirea ipotezei situate la stânga în acest lanț în cadrul ipotezei situate imediat la dreapta.

Rangul de cointegrare este numărul maxim de vectori de cointegrare liniar independenți pentru un grup dat de serii, rangul spațiului de cointegrare.

Cointegrarea stocastică este existența pentru un grup de serii integrate a unei combinații liniare care anulează tendința stocastică. Seria reprezentată de această combinație liniară nu conține o tendință stocastică, dar poate avea o tendință deterministă.

Sistemul triunghiular al lui Phillips este o reprezentare a sistemului TV de serii cointegrate cu rangul de cointegrare r sub forma unui sistem de ecuații, primul r descriind dependența r variabilelor selectate de restul (N r) variabile (tendințe generale) , iar ecuațiile rămase descriu modele pentru generarea de tendințe generale.

Zgomotul alb gaussian dimensional TV (zgomot alb gaussian N-dimensional) este o secvență de vectori aleatori independenți, distribuiți identic, având o distribuție normală dimensională TV cu așteptări matematice zero.

CRITERII ASIMPTOTICE DE EFICIENȚĂ

Un concept care permite, în cazul eșantioanelor mari, cuantificarea a două statistici diferite. criteriile folosite pentru a verifica false și aceleași statistici. ipoteze. Necesitatea de a măsura eficacitatea criteriilor a apărut în anii 30-40, când simplu din punct de vedere al calculelor, dar ineficient

Enciclopedie matematică. - M.: Enciclopedia Sovietică. I. M. Vinogradov. 1977-1985.

Vedeți ce este „CRITERIU ASIMPTOTIC EFICIENT” în alte dicționare:

    Coeficient de corelație- (Coeficientul de corelație) Coeficientul de corelație este un indicator statistic al dependenței a două variabile aleatoare.Definiția coeficientului de corelație, tipuri de coeficienți de corelație, proprietăți ale coeficientului de corelație, calcul și aplicare... ... Enciclopedia investitorilor

    Metode matematice statistici care nu necesită cunoașterea formei funcționale a distribuțiilor generale. Denumirea de metode neparametrice subliniază diferența lor față de metodele parametrice clasice, în care se presupune că generalul... ... Enciclopedie matematică

    Procesul de prezentare a informațiilor într-o anumită formă standard și procesul invers de restaurare a informațiilor conform reprezentării acesteia. În matematică în literatură se numește codificare maparea unei mulțimi arbitrare AB este o mulțime finită... ... Enciclopedie matematică