Statisticile au fost de mult timp o parte integrantă a vieții. Oamenii se confruntă peste tot. Pe baza statisticilor, se trag concluzii despre unde și ce boli sunt comune, ce este mai solicitat într-o anumită regiune sau în rândul unui anumit segment al populației. Chiar și construcția programelor politice ale candidaților la organele guvernamentale se bazează pe date statistice. Ele sunt, de asemenea, folosite de lanțurile de comerț cu amănuntul atunci când cumpără bunuri, iar producătorii sunt ghidați de aceste date în propunerile lor.
Statistica joacă un rol important în viața societății și afectează fiecare dintre membrii ei individuali, chiar și în lucruri mărunte. De exemplu, dacă, conform statisticilor, majoritatea oamenilor preferă culorile închise în hainele dintr-un anumit oraș sau regiune, atunci găsirea unei haine de ploaie galben strălucitor cu imprimeu floral în magazinele locale va fi extrem de dificilă. Dar ce cantitățise adună aceste date pentru a avea un asemenea impact? De exemplu, ce este „semnificativ statistic”? Ce se înțelege exact prin această definiție?
Ce este asta?
Statistica ca știință este alcătuită dintr-o combinație de cantități și concepte diferite. Unul dintre ele este conceptul de „semnificație statistică”. Acesta este numele valorii variabilelor, probabilitatea apariției altor indicatori în care este neglijabilă.
De exemplu, 9 din 10 persoane își pun pantofi de cauciuc în picioare în timpul unei plimbări de dimineață după ciuperci în pădurea de toamnă, după o noapte ploioasă. Probabilitatea ca la un moment dat 8 dintre ei să pună mocasini de pânză este neglijabilă. Astfel, în acest exemplu special, numărul 9 este ceea ce se numește „semnificație statistică”.
În consecință, dacă dezvoltăm în continuare exemplul practic dat, magazinele de pantofi cumpără cizme de cauciuc până la sfârșitul sezonului estival în cantități mai mari decât în alte perioade ale anului. Astfel, mărimea valorii statistice are un impact asupra vieții obișnuite.
Bineînțeles, în calculele complexe, să zicem, atunci când se prezică răspândirea virușilor, se ia în considerare un număr mare de variabile. Dar însăși esența determinării unui indicator semnificativ al datelor statistice este similară, indiferent de complexitatea calculelor și de numărul de valori variabile.
Cum se calculează?
Folosit la calcularea valorii indicatorului „semnificație statistică” al ecuației. Adică, se poate argumenta că în acest caz totul este decis de matematică. Cea mai simplă opțiune de calcul este un lanț de operații matematice, în care sunt implicați următorii parametri:
- două tipuri de rezultate obținute din sondaje sau din studiul datelor obiective, cum ar fi valoarea achizițiilor, notate cu a și b;
- indicator de dimensiunea eșantionului pentru ambele grupuri – n;
- valoarea cotei eșantionului combinat - p;
- eroare standard - SE.
Următorul pas este determinarea scorului general al testului - t, valoarea acestuia este comparată cu numărul 1,96. 1,96 este valoarea medie, care transmite un interval de 95%, conform funcției de distribuție t a Studentului.
Se pune adesea întrebarea care este diferența dintre valorile lui n și p. Această nuanță este ușor de clarificat cu un exemplu. Să presupunem că se calculează semnificația statistică a loialității față de orice produs sau marcă de bărbați și femei.
În acest caz, literele vor fi urmate de următoarele:
- n - numărul de respondenți;
- p - numărul de mulțumiți de produs.
Numărul de femei intervievate în acest caz va fi desemnat ca n1. În consecință, bărbații - n2. Aceeași valoare va avea numerele „1” și „2” ale simbolului p.
Compararea scorului la test cu media foilor de calcul ale Studentului devine ceea ce se numește „semnificație statistică”.
Ce se înțelege prin verificare?
Rezultatele oricărui calcul matematic pot fi întotdeauna verificate, acest lucru este predat copiilor din școala primară. Este logic să presupunemcă, deoarece statisticile sunt determinate folosind lanțul de calcule, atunci acestea sunt verificate.
Totuși, testarea semnificației statistice nu este doar matematică. Statistica se ocupă de un număr mare de variabile și de diverse probabilități, care sunt departe de a fi întotdeauna susceptibile de calcul. Adică, dacă revenim la exemplul pantofilor de cauciuc de la începutul articolului, atunci construcția logică a datelor statistice pe care se vor baza cumpărătorii de bunuri pentru magazine poate fi perturbată de vremea uscată și caldă, ceea ce nu este tipic pentru toamnă.. Ca urmare a acestui fenomen, numărul de persoane care achiziționează cizme de cauciuc va scădea, iar punctele de vânzare vor suferi pierderi. Desigur, o formulă matematică nu este capabilă să prevadă o anomalie meteorologică. Acest moment se numește „greșeală”.
Aceasta este doar probabilitatea unor astfel de erori și ia în considerare verificarea nivelului de semnificație calculată. Ia în considerare atât indicatorii calculați, cât și nivelurile acceptate de semnificație, precum și cantitățile numite convențional ipoteze.
Care este nivelul de semnificație?
Conceptul de „nivel” este inclus în principalele criterii de semnificație statistică. Este folosit în statistica aplicată și practică. Acesta este un fel de valoare care ia în considerare probabilitatea unor posibile abateri sau erori.
Nivelul se bazează pe identificarea diferențelor în probele gata făcute, vă permite să stabiliți semnificația acestora sau, dimpotrivă, aleatorietatea. Acest concept nu are doar semnificații digitale, ci și interpretările lor specifice. Ei explicăcum trebuie să înțelegeți valoarea, iar nivelul în sine este determinat prin compararea rezultatului cu indicele mediu, acest lucru dezvăluie gradul de fiabilitate al diferențelor.
Astfel, ne putem imagina conceptul de nivel simplu - este un indicator al unei erori sau erori acceptabile, probabile în concluziile desprinse din datele statistice obținute.
Ce niveluri de semnificație sunt folosite?
Semnificația statistică a coeficienților de probabilitate de eroare în practică se bazează pe trei niveluri de bază.
Primul nivel este pragul la care valoarea este de 5%. Adică, probabilitatea de eroare nu depășește nivelul de semnificație de 5%. Aceasta înseamnă că încrederea în impecabilitatea și infailibilitatea concluziilor făcute pe baza datelor cercetării statistice este de 95%.
Al doilea nivel este pragul de 1%. În consecință, această cifră înseamnă că cineva poate fi ghidat de datele obținute în timpul calculelor statistice cu o încredere de 99%.
Al treilea nivel - 0,1%. Cu această valoare, probabilitatea unei erori este egală cu o fracțiune de procent, adică erorile sunt practic eliminate.
Ce este o ipoteză în statistici?
Erorile ca concept sunt împărțite în două domenii, referitoare la acceptarea sau respingerea ipotezei nule. O ipoteză este un concept în spatele căruia, conform definiției, se ascunde un set de rezultate ale sondajului, alte date sau afirmații. Adică, o descriere a distribuției de probabilitate a ceva legat de subiectul contabilității statistice.
Există două ipoteze în calcule simple - zero și alternativă. Diferența dintre ele este că ipoteza nulă se bazează pe ideea că nu există diferențe fundamentale între eșantioanele implicate în determinarea semnificației statistice, iar cea alternativă este complet opusă acesteia. Adică, ipoteza alternativă se bazează pe prezența unei diferențe semnificative în aceste eșantioane.
Care sunt greșelile?
Erorile ca concept în statistică sunt direct proporționale cu acceptarea cutare sau cutare ipoteză ca adevărată. Ele pot fi împărțite în două direcții sau tipuri:
- primul tip se datorează acceptării ipotezei nule, care s-a dovedit a fi incorectă;
- secundă - cauzat de respectarea alternativei.
Primul tip de eroare se numește fals pozitiv și este destul de comun în toate domeniile în care sunt utilizate statistici. În consecință, eroarea celui de-al doilea tip se numește fals negativ.
De ce avem nevoie de regresie în statistici?
Semnificația statistică a regresiei este că cu ajutorul ei se poate stabili cât de mult corespunde realității modelul diferitelor dependențe calculate pe baza datelor; vă permite să identificați suficiența sau lipsa factorilor pentru contabilitate și concluzii.
Valoarea regresiei este determinată prin compararea rezultatelor cu datele enumerate în tabelele Fisher. Sau folosind analiza varianței. Indicatorii de regresie sunt importanți cândstudii și calcule statistice complexe care implică un număr mare de variabile, date aleatorii și modificări probabile.