Pentru a determina probabilitatea de încredere, trebuie să setați. Interval de încredere. Probabilitatea de încredere. Folosind distribuția normală

Una dintre metodele de rezolvare a problemelor statistice este calcularea intervalului de încredere. Este utilizat ca o alternativă preferată la estimarea punctuală atunci când dimensiunea eșantionului este mică. Trebuie remarcat faptul că procesul de calcul al intervalului de încredere în sine este destul de complex. Dar instrumentele programului Excel vă permit să o simplificați oarecum. Să aflăm cum se face acest lucru în practică.

Această metodă este utilizată pentru estimarea pe intervale a diferitelor mărimi statistice. Sarcina principală a acestui calcul este de a scăpa de incertitudinile estimării punctuale.

În Excel, există două opțiuni principale pentru efectuarea calculelor folosind această metodă: când varianța este cunoscută și când este necunoscută. În primul caz, funcția este utilizată pentru calcule ÎNCREDERE.NORMĂ, iar în al doilea - ADMINISTRATOR.STUDENT.

Metoda 1: Funcția NORM DE ÎNCREDERE

Operator ÎNCREDERE.NORMĂ, care aparține grupului statistic de funcții, a apărut pentru prima dată în Excel 2010. Versiunile anterioare ale acestui program folosesc analogul său ÎNCREDERE. Scopul acestui operator este de a calcula un interval de încredere distribuit normal pentru media populației.

Sintaxa sa este următoarea:

CONFIDENCE.NORM(alpha;standard_off;size)

"Alfa"— un argument care indică nivelul de semnificație care este utilizat pentru a calcula nivelul de încredere. Nivelul de încredere este egal cu următoarea expresie:

(1-"Alfa")*100

"Deviație standard"- Acesta este un argument, a cărui esență este clară din nume. Aceasta este abaterea standard a eșantionului propus.

"Mărimea"— argument care definește dimensiunea eșantionului.

Toate argumentele acestui operator sunt necesare.

Funcţie ÎNCREDERE are exact aceleași argumente și posibilități ca și precedentul. Sintaxa sa este:

TRUST(alpha, standard_off, dimensiune)

După cum puteți vedea, diferențele sunt doar în numele operatorului. Din motive de compatibilitate, această funcție este lăsată în Excel 2010 și versiunile mai noi într-o categorie specială "Compatibilitate". În versiunile Excel 2007 și anterioare, acesta este prezent în grupul principal de operatori statistici.

Limita intervalului de încredere este determinată folosind următoarea formulă:

X+(-)INCREDEREA NORM

Unde X este valoarea medie a eșantionului, care se află la mijlocul intervalului selectat.

Acum să vedem cum să calculăm interval de încredere pe exemplu concret. Au fost efectuate 12 teste, rezultând rezultate diferite raportate în tabel. Aceasta este totalitatea noastră. Abaterea standard este 8. Trebuie să calculăm intervalul de încredere la nivelul de încredere de 97%.

Selectați celula în care va fi afișat rezultatul prelucrării datelor. Faceți clic pe butonul „Inserare funcție”.

Apare Expertul de funcții. Mergi la categorie "Statistic"și evidențiați numele „TRUST.NORM”. După aceea, faceți clic pe butonul "BINE".

Se deschide fereastra de argumente. Câmpurile sale corespund în mod firesc cu numele argumentelor.
Plasați cursorul în primul câmp - "Alfa". Aici ar trebui să indicăm nivelul de semnificație. După cum ne amintim, nivelul nostru de încredere este de 97%. În același timp, am spus că se calculează astfel:
(1-nivel de încredere)/100

Adică, înlocuind valoarea, obținem:

Prin calcule simple aflăm că argumentul "Alfa" egală 0,03 . Introduceți această valoare în câmp.

După cum se știe, prin condiție abaterea standard este egală cu 8 . Prin urmare, pe teren "Deviație standard" doar notează acest număr.

În câmp "Mărimea" trebuie să introduceți numărul de elemente de testare efectuate. După cum ne amintim, lor 12 . Dar pentru a automatiza formula și a nu o edita de fiecare dată când efectuăm un nou test, să setăm această valoare nu cu un număr obișnuit, ci folosind operatorul VERIFICA. Deci, să plasăm cursorul în câmp "Mărimea", apoi faceți clic pe triunghi, care se află în stânga barei de formule.

Apare o listă cu funcțiile utilizate recent. Dacă operatorul VERIFICA a fost folosit recent de dvs., ar trebui să fie pe această listă. În acest caz, trebuie doar să faceți clic pe numele acestuia. În caz contrar, dacă nu îl găsești, mergi la subiect „Alte funcții...”.

Apare unul deja familiar Expertul de funcții. Să ne întoarcem din nou la grup "Statistic". Evidențiem numele acolo "VERIFICA". Faceți clic pe butonul "BINE".

Apare fereastra de argumente pentru afirmația de mai sus. Această funcție este concepută pentru a calcula numărul de celule dintr-un interval specificat care conțin valori numerice. Sintaxa sa este următoarea:
COUNT(valoare1,valoare2,...)

Grupul de argumentare "Valori" este o referință la intervalul în care doriți să calculați numărul de celule umplute cu date numerice. Pot exista până la 255 de astfel de argumente în total, dar în cazul nostru avem nevoie doar de unul.

Plasați cursorul în câmp „Valoarea 1”și, ținând apăsat butonul stâng al mouse-ului, selectați pe foaie gama care conține colecția noastră. Apoi adresa lui va fi afișată în câmp. Faceți clic pe butonul "BINE".

După aceasta, aplicația va efectua calculul și va afișa rezultatul în celula în care se află. În a noastră caz concret Formula arăta astfel:
NORMĂ DE ÎNCREDERE(0,03,8,NUMĂRĂ(B2:B13))

Rezultatul general al calculelor a fost 5,011609 .

Dar asta nu este tot. După cum ne amintim, limita intervalului de încredere este calculată prin adăugarea și scăderea rezultatului calculului din media eșantionului ÎNCREDERE.NORMĂ. În acest fel, se calculează limitele din dreapta și respectiv din stânga intervalului de încredere. Media eșantionului în sine poate fi calculată folosind operatorul IN MEDIE.
Acest operator este conceput pentru a calcula media aritmetică a unui interval selectat de numere. Are următoarea sintaxă destul de simplă:

MEDIE(numărul1,numărul2,...)

Argument "Număr" poate fi fie o singură valoare numerică, fie o referință la celule sau chiar intervale întregi care le conțin.

Deci, selectați celula în care va fi afișat calculul valorii medii și faceți clic pe butonul „Inserare funcție”.

Se deschide Expertul de funcții. Revenind la categorie "Statistic"și selectați un nume din listă "IN MEDIE". Ca întotdeauna, faceți clic pe butonul "BINE".

Se deschide fereastra de argumente. Plasați cursorul în câmp "Numărul 1"și ținând apăsat butonul stâng al mouse-ului, selectați întregul interval de valori. După ce coordonatele sunt afișate în câmp, faceți clic pe butonul "BINE".

După care IN MEDIE afișează rezultatul calculului într-un element de foaie.

Calculăm limita dreaptă a intervalului de încredere. Pentru a face acest lucru, selectați o celulă separată și puneți semnul «=» și se adună conținutul elementelor fișei în care se află rezultatele calculelor funcției IN MEDIEȘi ÎNCREDERE.NORMĂ. Pentru a efectua calculul, apăsați butonul introduce. În cazul nostru, avem următoarea formulă:
Rezultatul calculului: 6,953276

La fel se calculează limita din stânga a intervalului de încredere, doar de data aceasta din rezultatul calculului IN MEDIE scade rezultatul calculului operatorului ÎNCREDERE.NORMĂ. Formula rezultată pentru exemplul nostru este de următorul tip:
Rezultatul calculului: -3,06994

Am încercat să descriem în detaliu toți pașii pentru calcularea intervalului de încredere, așa că am descris fiecare formulă în detaliu. Dar puteți combina toate acțiunile într-o singură formulă. Calculul limitei drepte a intervalului de încredere poate fi scris după cum urmează:
MEDIE(B2:B13)+ÎNCREDERE.NORMĂ(0,03,8,NUMĂRĂ(B2:B13))

Un calcul similar pentru marginea din stânga ar arăta astfel:
MEDIE(B2:B13)-CONFIDENCE.NORM(0,03,8,NUMĂR (B2:B13))

Metoda 2: Funcția STUDENT DE ÎNCREDERE

În plus, Excel are o altă funcție care este asociată cu calcularea intervalului de încredere - ADMINISTRATOR.STUDENT. A apărut doar în Excel 2010. Acest operator calculează intervalul de încredere al populației folosind distribuția Student. Este foarte convenabil de utilizat atunci când varianța și, în consecință, abaterea standard sunt necunoscute. Sintaxa operatorului este:

CONFIDENCE.STUDENT(alpha,standard_off,size)

După cum puteți vedea, numele operatorilor au rămas neschimbate în acest caz.

Să vedem cum se calculează limitele unui interval de încredere cu o abatere standard necunoscută folosind exemplul aceleiași populații pe care am considerat-o în metoda anterioară. Să luăm nivelul de încredere ca ultima dată la 97%.

Selectați celula în care va fi efectuat calculul. Faceți clic pe butonul „Inserare funcție”.

În deschis Expertul de funcții mergi la categorie "Statistic". Selectați un nume „ELEV DE ÎNCREDERE”. Faceți clic pe butonul "BINE".

Se lansează fereastra de argumente pentru operatorul specificat.
În câmp "Alfa", având în vedere că nivelul de încredere este de 97%, notăm numărul 0,03 . Pentru a doua oară nu ne vom opri asupra principiilor calculării acestui parametru.

După aceasta, plasați cursorul în câmp "Deviație standard". De data aceasta, acest indicator ne este necunoscut și trebuie calculat. Acest lucru se face folosind functie speciala – STDEV.V. Pentru a deschide fereastra acestui operator, faceți clic pe triunghiul din stânga barei de formule. Dacă nu găsim numele dorit în lista care se deschide, atunci mergeți la articol „Alte funcții...”.

Începe Expertul de funcții. Trecerea la categorie "Statistic"și marcați numele în el „STDEV.V”. Apoi faceți clic pe butonul "BINE".

Se deschide fereastra de argumente. Sarcina operatorului STDEV.V este de a determina abaterea standard a unei probe. Sintaxa sa arată astfel:
DEVIARE STANDARD.B(număr1;număr2;…)

Nu este greu de ghicit că argumentul "Număr" este adresa elementului de selecție. Dacă selecția este plasată într-o singură matrice, atunci puteți utiliza un singur argument pentru a furniza o legătură către acest interval.

Plasați cursorul în câmp "Numărul 1"și, ca întotdeauna, ținând apăsat butonul stâng al mouse-ului, selectați colecția. După ce coordonatele sunt în câmp, nu vă grăbiți să apăsați butonul "BINE", deoarece rezultatul va fi incorect. Mai întâi trebuie să ne întoarcem la fereastra de argumente operator ADMINISTRATOR.STUDENT pentru a adăuga argumentul final. Pentru a face acest lucru, faceți clic pe numele corespunzător din bara de formule.

Fereastra de argumente pentru funcția deja familiară se deschide din nou. Plasați cursorul în câmp "Mărimea". Din nou, faceți clic pe triunghiul cu care suntem deja familiarizați pentru a merge la selecția operatorilor. După cum înțelegeți, avem nevoie de un nume "VERIFICA". Deoarece am folosit această funcție în calculele din metoda anterioară, este prezentă în această listă, așa că faceți clic pe ea. Dacă nu îl găsiți, atunci urmați algoritmul descris în prima metodă.

Odată ajuns în fereastra de argumente VERIFICA, plasați cursorul în câmp "Numărul 1"și cu butonul mouse-ului ținut apăsat, selectați colecția. Apoi faceți clic pe butonul "BINE".

După aceasta, programul efectuează un calcul și afișează valoarea intervalului de încredere.

Pentru a determina limitele, va trebui din nou să calculăm media eșantionului. Dar, având în vedere că algoritmul de calcul folosind formula IN MEDIE la fel ca în metoda anterioară și chiar și rezultatul nu s-a schimbat, nu ne vom opri asupra acestui lucru în detaliu a doua oară.

Însumarea rezultatelor calculului IN MEDIEȘi ADMINISTRATOR.STUDENT, obținem limita dreaptă a intervalului de încredere.

Scăzând din rezultatele de calcul ale operatorului IN MEDIE rezultatul calculului ADMINISTRATOR.STUDENT, avem limita din stânga a intervalului de încredere.

Dacă calculul este scris într-o singură formulă, atunci calculul limitei drepte în cazul nostru va arăta astfel:
MEDIE(B2:B13)+ÎNCREDERE.STUDENT(0,03,STDEV.B(B2:B13),NUMĂR(B2:B13))

În consecință, formula pentru calcularea marginii din stânga va arăta astfel:
MEDIE(B2:B13)-INCREDERE.STUDENT(0,03,STDEV.B(B2:B13),NUMĂR(B2:B13))

După cum puteți vedea, instrumentele programe Excel fac posibilă simplificarea semnificativă a calculului intervalului de încredere și a limitelor acestuia. În aceste scopuri, se folosesc operatori separați pentru eșantioanele a căror varianță este cunoscută și necunoscută.

Există două tipuri de estimări în statistică: punct și interval. Estimarea punctuala este un singur eșantion statistic care este utilizat pentru a estima un parametru de populație. De exemplu, media eșantionului este o estimare punctuală a așteptărilor matematice a populației și a varianței eșantionului S 2- estimarea punctuală a varianței populației σ 2. s-a demonstrat că media eșantionului este o estimare imparțială a așteptărilor matematice a populației. O medie a eșantionului se numește imparțial deoarece media tuturor mediilor eșantionului (cu aceeași dimensiune a eșantionului) n) este egală cu așteptarea matematică a populației generale.

Pentru variația eșantionului S 2 a devenit o estimare imparțială a varianței populației σ 2, numitorul varianței eșantionului trebuie setat egal cu n – 1 , dar nu n. Cu alte cuvinte, varianța populației este media tuturor variațiilor posibile ale eșantionului.

La estimarea parametrilor populației, ar trebui să se țină cont de faptul că statisticile eșantionului precum , depind de mostre specifice. A ține cont de acest fapt, a obține estimarea intervalului așteptarea matematică a populației generale, analizați distribuția mediilor eșantionului (pentru mai multe detalii, vezi). Intervalul construit este caracterizat de un anumit nivel de încredere, care reprezintă probabilitatea ca parametrul adevărat al populației să fie estimat corect. Intervale similare de încredere pot fi utilizate pentru a estima proporția unei caracteristici Rși principala masă distribuită a populației.

Descărcați nota în sau format, exemple în format

Construirea unui interval de încredere pentru așteptarea matematică a populației cu o abatere standard cunoscută

Construirea unui interval de încredere pentru ponderea unei caracteristici în populație

Această secțiune extinde conceptul de interval de încredere la date categorice. Acest lucru ne permite să estimăm ponderea caracteristicii în populație R folosind partajarea eșantionului RS= X/n. După cum este indicat, dacă cantitățile nRȘi n(1 – p) depășește numărul 5, distribuția binomială poate fi aproximată ca normal. Prin urmare, pentru a estima ponderea unei caracteristici în populație R se poate construi un interval al cărui nivel de încredere este egal cu (1 – α)х100%.

Unde pS- proporția de eșantion a caracteristicii egală cu X/n, adică numărul de succese împărțit la dimensiunea eșantionului, R- ponderea caracteristicii în populația generală, Z- valoarea critică a distribuției normale standardizate, n- marime de mostra.

Exemplul 3. Să presupunem că de la Sistem informatic a fost extras un eșantion de 100 de facturi finalizate în ultima lună. Să presupunem că 10 dintre aceste facturi au fost întocmite cu erori. Prin urmare, R= 10/100 = 0,1. Nivelul de încredere de 95% corespunde valorii critice Z = 1,96.

Astfel, probabilitatea ca între 4,12% și 15,88% din facturi să conțină erori este de 95%.

Pentru o anumită dimensiune a eșantionului, intervalul de încredere care conține proporția caracteristicii în populație pare mai larg decât pentru o variabilă aleatoare continuă. Acest lucru se datorează faptului că măsurătorile unei variabile aleatoare continue conțin mai multe informații decât măsurătorile datelor categorice. Cu alte cuvinte, datele categorice care iau doar două valori conțin informații insuficiente pentru a estima parametrii distribuției lor.

ÎNcalcularea estimărilor extrase dintr-o populație finită

Estimarea așteptărilor matematice. Factorul de corecție pentru populația finală ( fpc) a fost folosit pentru a reduce eroarea standard cu un factor. La calcularea intervalelor de încredere pentru estimările parametrilor populației, se aplică un factor de corecție în situațiile în care probele sunt extrase fără a fi returnate. Astfel, un interval de încredere pentru așteptarea matematică având un nivel de încredere egal cu (1 – α)х100%, se calculează prin formula:

Exemplul 4. Pentru a ilustra utilizarea factorului de corecție pentru o populație finită, să revenim la problema calculării intervalului de încredere pentru suma medie a facturilor, discutată mai sus în Exemplul 3. Să presupunem că o companie emite 5.000 de facturi pe lună și X= 110,27 dolari, S= 28,95 USD N = 5000, n = 100, α = 0,05, t 99 = 1,9842. Folosind formula (6) obținem:

Estimarea cotei unei caracteristici. Atunci când alegeți fără returnare, intervalul de încredere pentru proporția atributului având un nivel de încredere egal cu (1 – α)х100%, se calculează prin formula:

Intervale de încredere și probleme etice

Atunci când se eșantionează o populație și se trag concluzii statistice, apar adesea probleme etice. Principalul este modul în care intervalele de încredere și estimările punctuale ale statisticilor eșantionului sunt de acord. Publicarea estimărilor punctuale fără a specifica intervalele de încredere asociate (de obicei la nivelul de încredere de 95%) și dimensiunea eșantionului din care sunt derivate pot crea confuzie. Acest lucru poate da utilizatorului impresia că estimarea punctuală este exact ceea ce are nevoie pentru a prezice proprietățile întregii populații. Astfel, este necesar să înțelegem că în orice cercetare accentul ar trebui să nu fie pe estimările punctuale, ci pe estimările pe intervale. In afara de asta, Atentie speciala ar trebui dat alegerea corecta dimensiunile probei.

Cel mai adesea, obiectele manipulării statistice sunt rezultatele anchetelor sociologice ale populației pe anumite probleme politice. În același timp, rezultatele sondajului sunt publicate pe primele pagini ale ziarelor, iar eroarea de eșantionare și metodologia de analiză statistică sunt publicate undeva la mijloc. Pentru a demonstra validitatea estimărilor punctuale obţinute este necesar să se indice mărimea eşantionului pe baza căruia au fost obţinute, limitele intervalului de încredere şi nivelul său de semnificaţie.

Următoarea notă

Sunt utilizate materiale din cartea Levin et al. – M.: Williams, 2004. – p. 448–462

Teorema limitei centrale afirmă că, cu o dimensiune a eșantionului suficient de mare, distribuția eșantionului de medii poate fi aproximată printr-o distribuție normală. Această proprietate nu depinde de tipul de distribuție a populației.

Calculul intervalului de încredere se bazează pe eroarea medie a parametrului corespunzător. Interval de încredere arată în ce limite cu probabilitate (1-a) se află adevărata valoare a parametrului estimat. Aici a este nivelul de semnificație, (1-a) se mai numește și probabilitate de încredere.

În primul capitol am arătat că, de exemplu, pentru media aritmetică, media reală a populației în aproximativ 95% din cazuri se află în 2 erori standard ale mediei. Astfel, limitele intervalului de încredere de 95% pentru medie vor fi separate de media eșantionului de două ori eroarea medie a mediei, i.e. înmulțim eroarea medie a mediei cu un anumit coeficient în funcție de nivelul de încredere. Pentru media și diferența de medii se ia coeficientul Student (valoarea critică a testului Student), pentru ponderea și diferența de cote, valoarea critică a criteriului z. Produsul dintre coeficient și eroarea medie poate fi numit eroarea maximă a unui parametru dat, adică maximul pe care îl putem obţine la evaluarea acestuia.

Interval de încredere pentru medie aritmetică : .

Iată media eșantionului;

Eroarea medie a mediei aritmetice;

s – abaterea standard a probei;

f = n-1 (Coeficientul elevului).

Interval de încredere pentru diferențe de medii aritmetice :

Iată diferența dintre mediile eșantionului;

- eroarea medie a diferenţei dintre mediile aritmetice;

s 1 , s 2 – abateri standard ale probei;

n1,n2

Valoarea critică a testului Student pentru un anumit nivel de semnificație a și numărul de grade de libertate f=n 1 + n 2-2 (Coeficientul elevului).

Interval de încredere pentru acțiuni :

Aici d este fracția eșantionului;

– eroare medie de fracție;

n– dimensiunea eșantionului (mărimea grupului);

Interval de încredere pentru diferenta de actiuni :

Iată diferența dintre acțiunile eșantionului;

– eroarea medie a diferenței dintre mediile aritmetice;

n1,n2– volume de probe (număr de grupuri);

Valoarea critică a criteriului z la un nivel de semnificație dat a ( , , ).

Prin calcularea intervalelor de încredere pentru diferența dintre indicatori, în primul rând, vedem direct valorile posibile ale efectului, și nu doar estimarea punctuală a acestuia. În al doilea rând, putem trage o concluzie despre acceptarea sau respingerea ipotezei nule și, în al treilea rând, putem trage o concluzie despre puterea testului.

Când se testează ipoteze folosind intervale de încredere, trebuie să se respecte următoarea regulă:

Dacă intervalul de încredere de 100(1-a) procente al diferenței de medii nu conține zero, atunci diferențele sunt semnificative statistic la nivelul de semnificație a; dimpotrivă, dacă acest interval conține zero, atunci diferențele nu sunt semnificative statistic.

Într-adevăr, dacă acest interval conține zero, înseamnă că indicatorul comparat poate fi fie mai mare, fie mai mic într-unul dintre grupuri comparativ cu celălalt, adică. diferenţele observate se datorează întâmplării.

Puterea testului poate fi judecată după locația lui zero în intervalul de încredere. Dacă zero este aproape de limita inferioară sau superioară a intervalului, atunci este posibil ca, cu un număr mai mare de grupuri comparate, diferențele să ajungă la semnificație statistică. Dacă zero este aproape de mijlocul intervalului, înseamnă că atât o creștere, cât și o scădere a indicatorului în grupul experimental sunt la fel de probabile și, probabil, chiar nu există diferențe.

Exemple:

Pentru a compara mortalitatea chirurgicală la utilizarea a două tipuri diferite de anestezie: 61 de persoane au fost operate cu primul tip de anestezie, 8 au murit, cu al doilea tip – 67 de persoane, 10 au murit.

d 1 = 8/61 = 0,131; d2 = 10/67 = 0,149; d1-d2 = - 0,018.

Diferența de letalitate a metodelor comparate va fi în intervalul (-0,018 - 0,122; -0,018 + 0,122) sau (-0,14; 0,104) cu o probabilitate de 100(1-a) = 95%. Intervalul conține zero, adică. ipoteză despre aceeași letalitate în doi tipuri diferite Anestezia nu poate fi respinsă.

Astfel, rata mortalității poate și va scădea la 14% și crește la 10,4% cu o probabilitate de 95%, adică. zero este aproximativ la mijlocul intervalului, așa că se poate susține că, cel mai probabil, aceste două metode într-adevăr nu diferă în ceea ce privește letalitatea.

În exemplul discutat mai devreme, timpul mediu de apăsare în timpul testului de atingere a fost comparat în patru grupuri de studenți care au diferit în ceea ce privește scorurile la examen. Să calculăm intervalele de încredere pentru timpul mediu de presare pentru studenții care au promovat examenul cu clasele 2 și 5 și intervalul de încredere pentru diferența dintre aceste medii.

Coeficienții lui Student se găsesc folosind tabelele de distribuție a lui Student (vezi anexa): pentru prima grupă: = t(0,05;48) = 2,011; pentru a doua grupă: = t(0,05;61) = 2,000. Astfel, intervale de încredere pentru primul grup: = (162,19-2,011*2,18; 162,19+2,011*2,18) = (157,8; 166,6), pentru al doilea grup (156,55- 2.000*1,88 ; 156,805*1,88 ; =+1,805*1,805) 160,3). Deci, pentru cei care au promovat examenul cu 2, timpul mediu de apăsare variază de la 157,8 ms la 166,6 ms cu o probabilitate de 95%, pentru cei care au promovat examenul cu 5 – de la 152,8 ms la 160,3 ms cu o probabilitate de 95% .

De asemenea, puteți testa ipoteza nulă folosind intervale de încredere pentru medii și nu doar pentru diferența de medii. De exemplu, ca și în cazul nostru, dacă intervalele de încredere pentru medii se suprapun, atunci ipoteza nulă nu poate fi respinsă. Pentru a respinge o ipoteză la un nivel de semnificație ales, intervalele de încredere corespunzătoare nu trebuie să se suprapună.

Să aflăm intervalul de încredere pentru diferența în timpul mediu de presare la loturile care au promovat examenul cu note 2 și 5. Diferența de medii: 162,19 – 156,55 = 5,64. Coeficientul studentului: = t(0,05;49+62-2) = t(0,05;109) = 1,982. Abaterile standard de grup vor fi egale cu: ; . Calculăm eroarea medie a diferenței dintre medii: . Interval de încredere: =(5,64-1,982*2,87; 5,64+1,982*2,87) = (-0,044; 11,33).

Așadar, diferența de timp mediu de presare în grupele care au promovat examenul cu 2 și 5 va fi în intervalul de la -0,044 ms la 11,33 ms. Acest interval include zero, adică Timpul mediu de presare pentru cei care au promovat bine examenul poate fie să crească, fie să scadă în comparație cu cei care au promovat examenul nesatisfăcător, adică. ipoteza nulă nu poate fi respinsă. Dar zero este foarte aproape de limita inferioară, iar timpul de presare este mult mai probabil să scadă pentru cei care au trecut bine. Astfel, putem concluziona că există încă diferențe în timpul mediu de presare între cei care au trecut de 2 și 5, pur și simplu nu le-am putut detecta având în vedere modificarea timpului mediu, răspândirea timpului mediu și dimensiunile eșantionului.

Puterea unui test este probabilitatea de a respinge o ipoteză nulă incorectă, i.e. găsiți diferențele acolo unde acestea există de fapt.

Puterea testului este determinată pe baza nivelului de semnificație, a mărimii diferențelor dintre grupuri, a răspândirii valorilor în grupuri și a mărimii eșantioanelor.

Pentru testul t Student și analiza varianței, pot fi utilizate diagrame de sensibilitate.

Puterea criteriului poate fi utilizată pentru a determina preliminar numărul necesar de grupuri.

Intervalul de încredere arată în ce limite se află valoarea adevărată a parametrului estimat cu o probabilitate dată.

Folosind intervale de încredere, puteți testa ipoteze statistice și puteți trage concluzii despre sensibilitatea criteriilor.

LITERATURĂ.

Glanz S. – Capitolul 6,7.

Rebrova O.Yu. – p.112-114, p.171-173, p.234-238.

Sidorenko E.V – p.32-33.

Întrebări pentru autotestarea elevilor.

1. Care este puterea criteriului?

2. În ce cazuri este necesară evaluarea puterii criteriilor?

3. Metode de calcul al puterii.

6. Cum se testează o ipoteză statistică folosind un interval de încredere?

7. Ce se poate spune despre puterea criteriului la calcularea intervalului de încredere?

Sarcini.

Adesea, evaluatorul trebuie să analizeze piața imobiliară a segmentului în care se află proprietatea evaluată. Dacă piața este dezvoltată, poate fi dificil să se analizeze întregul set de obiecte prezentate, așa că pentru analiză se folosește un eșantion de obiecte. Acest eșantion nu se dovedește întotdeauna a fi omogen, uneori este necesar să îl curățați de punctele extreme - oferte de piață prea mari sau prea scăzute. În acest scop este folosit interval de încredere. Scopul acestui studiu este de a efectua o analiză comparativă a două metode de calculare a intervalului de încredere și de a selecta opțiunea optimă de calcul atunci când se lucrează cu diferite eșantioane în sistemul estimatica.pro.

Intervalul de încredere este un interval de valori ale atributelor calculate pe baza unui eșantion, care, cu o probabilitate cunoscută, conține parametrul estimat al populației generale.

Scopul calculării unui interval de încredere este de a construi un astfel de interval pe baza datelor eșantionului, astfel încât să se poată afirma cu o probabilitate dată că valoarea parametrului estimat se află în acest interval. Cu alte cuvinte, intervalul de încredere conține valoarea necunoscută a valorii estimate cu o anumită probabilitate. Cu cât intervalul este mai larg, cu atât este mai mare inexactitatea.

Există diferite metode pentru determinarea intervalului de încredere. În acest articol ne vom uita la 2 metode:

prin abaterea mediană și standard;
prin valoarea critică a t-statisticilor (coeficientul Student).

Etape analiza comparativa în diverse feluri calcul CI:

1. formați un eșantion de date;

2. o procesăm folosind metode statistice: calculăm valoarea medie, mediana, varianța etc.;

3. calculați intervalul de încredere în două moduri;

4. analizați probele curățate și intervalele de încredere rezultate.

Etapa 1. Eșantionarea datelor

Eșantionul a fost format folosind sistemul estimatica.pro. Eșantionul a inclus 91 de oferte pentru vânzarea de apartamente cu 1 cameră în zona a 3-a de preț cu aspectul de tip „Hrușciov”.

Tabelul 1. Proba inițială

	Pret 1 mp, unitate

Fig.1. Proba inițială

Etapa 2. Prelucrarea probei inițiale

Procesarea unui eșantion folosind metode statistice necesită calcularea următoarelor valori:

1. Media aritmetică

2. Mediana este un număr care caracterizează eșantionul: exact jumătate dintre elementele eșantionului sunt mai mari decât mediana, cealaltă jumătate sunt mai mici decât mediana

(pentru un eșantion cu un număr impar de valori)

3. Interval - diferența dintre valorile maxime și minime din eșantion

4. Varianta - folosită pentru a estima mai precis variația datelor

5. Abaterea standard eșantion (în continuare - SD) este cel mai frecvent indicator al dispersării valorilor de ajustare în jurul mediei aritmetice.

6. Coeficient de variație – reflectă gradul de împrăștiere a valorilor de ajustare

7. coeficient de oscilație - reflectă fluctuația relativă a valorilor extreme ale prețurilor din eșantion în jurul valorii medii

Masa 2. Indicatori statistici mostra originală

Coeficientul de variație, care caracterizează omogenitatea datelor, este de 12,29%, dar coeficientul de oscilație este prea mare. Astfel, putem spune că eșantionul original nu este omogen, așa că să trecem la calcularea intervalului de încredere.

Etapa 3. Calculul intervalului de încredere

Metoda 1. Calcul folosind mediana și abaterea standard.

Intervalul de încredere se determină astfel: valoare minimă - abaterea standard se scade din mediană; valoarea maximă - abaterea standard se adaugă la mediană.

Astfel, intervalul de încredere (47179 CU; 60689 CU)

Orez. 2. Valori care se încadrează în intervalul de încredere 1.

Metoda 2. Construirea unui interval de încredere folosind valoarea critică a statisticilor t (coeficientul studentului)

S.V. Gribovsky în cartea sa „Metode matematice pentru estimarea valorii proprietății” descrie o metodă de calculare a intervalului de încredere prin coeficientul Student. Atunci când calculează folosind această metodă, estimatorul trebuie să stabilească el însuși nivelul de semnificație ∝, care determină probabilitatea cu care va fi construit intervalul de încredere. În mod obișnuit, sunt utilizate niveluri de semnificație de 0,1; 0,05 și 0,01. Ele corespund probabilităților de încredere de 0,9; 0,95 și 0,99. Cu această metodă, se presupune că adevăratele valori ale așteptării și varianței matematice sunt practic necunoscute (ceea ce este aproape întotdeauna adevărat atunci când se rezolvă probleme practice de estimare).

Formula intervalului de încredere:

n - dimensiunea eșantionului;

Valoarea critică a t-statisticilor (distribuția Student) cu un nivel de semnificație ∝, numărul de grade de libertate n-1, care se determină din tabele statistice speciale sau folosind MS Excel (→„Statistice”→ STUDIST);

∝ - nivelul de semnificație, luați ∝=0,01.

Orez. 2. Valori care se încadrează în intervalul de încredere 2.

Etapa 4. Analiza diferitelor metode de calcul a intervalului de încredere

Două metode de calcul a intervalului de încredere - prin mediană și coeficientul Student - au condus la valori diferite ale intervalelor. În consecință, am primit două mostre diferite curățate.

Tabelul 3. Statistici pentru trei eșantioane.

Index	Proba inițială	1 opțiune	Opțiunea 2
Valoarea medie


Dispersia

Coef. variatii
Coef. oscilații
Număr de obiecte retrase, buc.

Pe baza calculelor efectuate, putem spune că valorile intervalului de încredere obținute prin diferite metode se intersectează, astfel încât puteți utiliza oricare dintre metodele de calcul la discreția evaluatorului.

Considerăm însă că atunci când lucrăm în sistemul estimatica.pro, este indicat să alegeți o metodă de calcul a intervalului de încredere în funcție de gradul de dezvoltare a pieței:

dacă piața este nedezvoltată, utilizați metoda de calcul folosind mediana și abaterea standard, deoarece numărul de obiecte retrase în acest caz este mic;
dacă piața este dezvoltată, aplicați calculul prin valoarea critică a t-statisticilor (coeficientul Student), deoarece este posibil să se formeze un eșantion inițial mare.

La pregătirea articolului s-au folosit următoarele:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Metode matematice de evaluare a valorii proprietății. Moscova, 2014

2. System data estimatica.pro

Să construim un interval de încredere în MS EXCEL pentru a estima valoarea medie a distribuției în cazul unei valori de dispersie cunoscute.

Desigur, alegerea nivelul de încredere depinde complet de problema rezolvată. Astfel, gradul de încredere al unui pasager aerian în fiabilitatea unui avion ar trebui să fie, fără îndoială, mai mare decât gradul de încredere al unui cumpărător în fiabilitatea unui bec electric.

Formularea problemei

Să presupunem că de la populatia fiind luate probă marimea n. Se presupune că deviație standard această distribuţie este cunoscută. Necesar pe baza acestui lucru mostre evalua necunoscutul mijloc de distribuție(μ, ) și construiți corespunzătoare cu două fețe interval de încredere.

Estimarea punctuala

După cum se știe din statistici(să o notăm medie X) este estimare imparțială a mediei acest populatiași are o distribuție N(μ;σ 2 /n).

Notă: Ce să faci dacă trebuie să construiești interval de încredereîn cazul unei distribuţii care nu este normal?În acest caz, vine în ajutor, care afirmă că cu o dimensiune suficient de mare mostre n din distribuție a nu fi normal, distribuția eșantionului de statistici X avg voi aproximativ corespund distributie normala cu parametrii N(μ;σ 2 /n).

Asa de, estimare punctuală in medie valorile de distribuție avem - asta eșantion mediu, adică medie X. Acum să începem interval de încredere.

Construirea unui interval de încredere

De obicei, cunoscând distribuția și parametrii acesteia, putem calcula probabilitatea ca variabila aleatoare să ia o valoare din intervalul pe care îl specificăm. Acum să facem invers: găsiți intervalul în care variabila aleatoare va cădea cu o probabilitate dată. De exemplu, din proprietăți distributie normala se ştie că, cu o probabilitate de 95%, o variabilă aleatoare distribuită peste legea normală, se va încadra în intervalul de aproximativ +/- 2 de la valoarea medie(vezi articolul despre). Acest interval ne va servi drept prototip interval de încredere.

Acum să vedem dacă știm distribuția , pentru a calcula acest interval? Pentru a răspunde la întrebare, trebuie să indicăm forma distribuției și parametrii acesteia.

Cunoaștem forma de distribuție - aceasta este distributie normala(rețineți că vorbim despre distribuția eșantionării statistici medie X).

Parametrul μ ne este necunoscut (trebuie doar estimat folosind interval de încredere), dar avem o estimare a acesteia medie X, calculat pe baza mostre, care poate fi folosit.

Al doilea parametru - abaterea standard a mediei eșantionului îl vom considera cunoscut, este egal cu σ/√n.

Deoarece nu știm μ, atunci vom construi intervalul +/- 2 abateri standard nu de la valoarea medie, și din estimarea sa cunoscută medie X. Acestea. la calcul interval de încredere NU vom presupune că medie X se încadrează în intervalul +/- 2 abateri standard de la μ cu o probabilitate de 95% și vom presupune că intervalul este +/- 2 abateri standard din medie X cu o probabilitate de 95% va acoperi μ – media populației generale, din care se ia probă. Aceste două afirmații sunt echivalente, dar a doua declarație ne permite să construim interval de încredere.

În plus, să clarificăm intervalul: o variabilă aleatoare distribuită peste legea normală, cu o probabilitate de 95% se încadrează în intervalul +/- 1.960 abateri standard, nu +/- 2 abateri standard. Aceasta poate fi calculată folosind formula =NORM.ST.REV((1+0,95)/2), cm. fișier exemplu Sheet Interval.

Acum putem formula o afirmație probabilistică care ne va servi să formăm interval de încredere:
„Probabilitatea ca media populatiei situat din medie a probeiîn termen de 1.960" abaterile standard ale mediei eșantionului", egal cu 95%”.

Valoarea probabilității menționată în declarație are o denumire specială , care este asociat cu nivelul de semnificație α (alfa) printr-o expresie simplă nivel de încredere =1 -α . În cazul nostru nivelul de semnificație α =1-0,95=0,05 .

Acum, pe baza acestei afirmații probabilistice, scriem o expresie pentru calcul interval de încredere:

unde Z α/2 – standard distributie normala(această valoare a variabilei aleatoare z, Ce P(z>=Z α/2 )=α/2).

Notă: α/2-quantila superioară definește lățimea interval de încredere V abateri standard eșantion mediu. α/2-quantila superioară standard distributie normalaîntotdeauna mai mare decât 0, ceea ce este foarte convenabil.

În cazul nostru, cu α=0,05, α/2-quantila superioară este egal cu 1.960. Pentru alte niveluri de semnificație α (10%; 1%) α/2-quantila superioară Z α/2 poate fi calculat folosind formula =NORM.ST.REV(1-α/2) sau, dacă este cunoscută nivel de încredere, =NORM.ST.OBR((1+nivel de încredere)/2).

De obicei, la construirea intervale de încredere pentru estimarea mediei utilizați numai α superioară/2-cuantilă si nu folositi mai mic α/2-cuantilă. Acest lucru este posibil pentru că standard distributie normala simetric fata de axa x ( densitatea sa de distribuție simetric despre medie, adică 0). Prin urmare, nu este nevoie să se calculeze α/2-cuantilă mai mică(se numește pur și simplu α /2-quantila), deoarece este egal α superioară/2-cuantilă cu semnul minus.

Să ne amintim că, în ciuda formei distribuției valorii x, variabila aleatoare corespunzătoare medie X distribuite aproximativ Amenda N(μ;σ 2 /n) (vezi articolul despre). Prin urmare, în general, expresia de mai sus pentru interval de încredere este doar o aproximare. Dacă valoarea x este distribuită peste legea normală N(μ;σ 2 /n), apoi expresia pentru interval de încredere este exactă.

Calcul intervalului de încredere în MS EXCEL

Să rezolvăm problema.
Timpul de răspuns al unei componente electronice la un semnal de intrare este o caracteristică importantă a dispozitivului. Un inginer dorește să construiască un interval de încredere pentru timpul mediu de răspuns la un nivel de încredere de 95%. Din experiența anterioară, inginerul știe că abaterea standard a timpului de răspuns este de 8 ms. Se știe că pentru a evalua timpul de răspuns, inginerul a făcut 25 de măsurători, valoarea medie a fost de 78 ms.

Soluţie: Inginerul vrea să știe timpul de răspuns dispozitiv electronic, dar înțelege că timpul de răspuns nu este o valoare fixă, ci o variabilă aleatoare care are propria sa distribuție. Deci, cel mai bun lucru la care poate spera este să determine parametrii și forma acestei distribuții.

Din păcate, din condițiile problemei nu cunoaștem forma distribuției timpului de răspuns (nu trebuie să fie normal). , această distribuție este de asemenea necunoscută. Numai el este cunoscut deviație standardσ=8. Prin urmare, în timp ce nu putem calcula probabilitățile și construi interval de încredere.

Cu toate acestea, în ciuda faptului că nu cunoaștem distribuția timp răspuns separat, știm că conform CPT, distribuția eșantionării timpul mediu de răspuns este de aproximativ normal(vom presupune că condițiile CPT sunt efectuate, deoarece mărimea mostre destul de mare (n=25)) .

În plus, in medie această distribuţie este egală cu valoarea medie distribuția unui singur răspuns, de ex. μ. A deviație standard a acestei distribuții (σ/√n) poate fi calculată folosind formula =8/ROOT(25) .

De asemenea, se știe că inginerul a primit estimare punctuală parametrul μ egal cu 78 ms (X avg). Prin urmare, acum putem calcula probabilități, deoarece cunoaștem forma de distribuție ( normal) și parametrii săi (X avg și σ/√n).

Inginerul vrea să știe valorea estimataμ distribuțiile timpului de răspuns. După cum sa menționat mai sus, acest μ este egal cu așteptarea matematică a distribuției eșantionului a timpului mediu de răspuns. Dacă folosim distributie normala N(X avg; σ/√n), atunci μ dorit va fi în intervalul +/-2*σ/√n cu o probabilitate de aproximativ 95%.

Nivel de semnificație este egal cu 1-0,95=0,05.

În cele din urmă, să găsim marginile din stânga și din dreapta interval de încredere.
Chenarul din stânga: =78-NORM.ST.REV(1-0,05/2)*8/ROOT(25) = 74,864
Chenarul din dreapta: =78+NORM.ST.INV(1-0,05/2)*8/ROOT(25)=81,136

Chenarul din stânga: =NORM.REV(0,05/2; 78; 8/ROOT(25))
Chenarul din dreapta: =NORM.REV(1-0,05/2; 78; 8/ROOT(25))

Răspuns: interval de încredere la Nivel de încredere de 95% și σ=8msec egală 78+/-3,136 ms.

ÎN exemplu de fișier pe foaia Sigma cunoscut, a creat o formă de calcul și construcție cu două fețe interval de încredere pentru arbitrar mostre cu σ dat și nivelul de semnificație.

Funcția CONFIDENCE.NORM().

Dacă valorile mostre sunt în gamă B20:B79 , A nivelul de semnificație egal cu 0,05; apoi formula MS EXCEL:
=MEDIE(B20:B79)-ÎNCREDERE.NORMĂ(0,05;σ; NUMĂRĂ (B20:B79))
va întoarce marginea stângă interval de încredere.

Aceeași limită poate fi calculată folosind formula:
=AVERAGE(B20:B79)-NORM.ST.REV(1-0,05/2)*σ/ROOT(COUNT(B20:B79))

Notă: Funcția CONFIDENCE.NORM() a apărut în MS EXCEL 2010. În versiunile anterioare ale MS EXCEL, a fost folosită funcția TRUST().