Erori în testarea ipotezelor, putere

studiu general

Cele mai multe ipoteze testate este comparată între un grup de obiecte care sunt afectate de diverși factori.

De exemplu, este posibil să se compare eficacitatea a două tipuri de tratament, pentru a reduce mortalitatea de 5 ani de cancer de san. Pentru acest rezultat (de exemplu, moartea) compararea de interes (de exemplu, o varietate de mortalitate în 5 ani), numit efectul sau, dacă este cazul, efectul tratamentului.






Ipoteza nulă este exprimată ca absența efectului (de exemplu, mortalitatea de 5 ani de cancer-mo glandei mamare identice in cele doua grupuri, pentru a primi-ing tratament diferit); ipoteză alternativă cu două fețe ar însemna că diferența de efecte nu este zero.

Criteriul pentru a testa ipoteza permite să se determine dacă suficiente argumente pentru a respinge ipoteza nulă. Numai unul dintre cele două soluții pot fi luate:

  1. respinge ipoteza nulă și să accepte ipoteza alter-nativă
  2. să rămână în cadrul ipotezei nule

Important: În literatura de specialitate, destul de des conceptul este găsit „acceptă ipoteza nulă.“ Aș dori să clarific faptul că din punct de vedere statistic, pentru a accepta ipoteza nulă nu este posibilă deoarece ipoteza nulă este suficient de aprobare strict (de exemplu, valorile medii din cele două grupuri sunt egale).

Prin urmare, teza privind adoptarea ipotezei nule ar trebui să fie înțeles ca ceva ce tocmai a rămas în ipoteza.

decizii greșite

Poate că decizia greșită atunci când de respingere / nu respinge ipoteza nulă, pentru că există numai informații selectate.

H0 a respins în mod greșit
(Eroare de primul tip)

H0 este adevărat este respinsă

Eroarea de primul tip: respinge ipoteza nulă atunci când este adevărat, și a concluzionat că există un efect, atunci când, în realitate, nu este. șansă maximă (probabilitate) a unei greșeli de primul tip este desemnat alfa (alfa). Acest nivel de criteriu de semnificație; ipoteza nulă este respinsă dacă noastre p-valoare mai mică decât nivelul de semnificație, adică. e. dacă p <α.

Ar trebui să decidă cu privire la valorile și înainte de datele sunt colectate; de obicei, prescris valoarea implicită de 0,05, deși este posibil să se selecteze mai mult decât valoarea limită, de exemplu, 0,01.

O șansă de a face o greșeală de primul tip nu va depăși nivelul de semnificație ales, spun α = 0,05, deoarece ipoteza nulă este respinsă numai dacă p <0,05. Если обнаружено, что p> 0,05, ipoteza nulă nu este respinsă și, prin urmare, nu permite eroarea de primul tip.







Eroare doilea tip: nu respinge ipoteza nulă atunci când aceasta este falsă, și a concluzionat că nu există nici un efect, în timp ce în realitate există. Șansa unei erori a doilea tip este desemnat β (beta); și valoarea (1-β), numit criteriu de putere.

În consecință, puterea - este probabilitatea de respingere a ipotezei nule atunci când aceasta este falsă, și anume, este o șansă (de obicei, exprimată în procente) pentru a detecta un efect real al tratamentului într-un anumit volum de probă pentru a fi semnificativă statistic.

În mod ideal, aș vrea la putere a testului a fost de 100%; dar este imposibil, așa cum este întotdeauna șansa, deși ușoară, greși doilea fel.

Din fericire, știm ce factori afectează producția și, prin urmare, este posibil să se controleze criteriul puterii, considerându-le.

Putere și factori legati

În planificarea studiului, este necesar să se cunoască puterea testului propus. Evident, puteți începe să studieze dacă există un „bun“ șansa de a descoperi un efect relevant, în cazul în care există (sub „bun“ înțelegem că puterea ar trebui să fie de cel puțin 70-80%).

Iresponsabil punct de vedere etic pentru a începe un studiu în care, să zicem, doar 40% șanse de a descoperi efectul real al tratamentului; este o pierdere de timp și bani.

Mai mulți factori au legătură directă cu criteriul de putere.

Dimensiunea eșantionului: crește puterea de test cu un volum de probă. Acest lucru înseamnă că un eșantion mai mare mai multe oportunități decât mici, găsi efect important, în cazul în care acesta există.

În cazul în care volumul eșantionului este mic criteriu momentul poate fi insuficient de putere pentru a detecta un singur efect. Aceste metode pot fi utilizate și pentru estimarea puterii criteriu pentru a stabili cu precizie volumul eșantionului.

observații Variabilitatea: creșteri de putere ca variabilitatea observațiilor reduse.

Interesul efectului cercetătorilor: puterea testului mai mult pentru efecte mai mari. Criteriul de ipoteze de testare este mai probabil pentru a detecta un efect real, semnificativ decât o ușoară.

Nivelul de semnificație: de putere va fi mai mare în cazul în care nivelul de importanță este mai mare (acest lucru este echivalent cu creșterea greșelile de primul fel, α, iar greșelile doilea tip, β, scade).

Astfel, cel mai probabil, cercetatorii au descoperit un efect real, în cazul în care decide în etapa de planificare, care este considerată ca fiind o valoare semnificativă p, în cazul în care este probabil să fie mai mică de 0,05, mai mică de 0,01.

Vă rugăm să rețineți că verificarea Configuratie efectul de interes indică dacă puterea adecvată. interval de încredere de mare ar trebui să fie un mic eșantion și / sau datele prevăzute cu o variabilitate considerabilă și indică o capacitate insuficientă.

Verificarea mai multe ipoteze

De multe ori au nevoie pentru a efectua un criteriu pentru a testa semnificația de mai multe ipoteze asupra setului de date cu multe variabile și există mai mult de două tipuri de tratament.

Eroarea de primul fel crește dramatic cu numărul de comparații, ceea ce duce la concluzii false cu privire la ipotezele. Prin urmare, ar trebui să verificați doar un număr mic de ipoteze selectate pentru a atinge obiectivele inițiale ale studiului și a stabilit cu precizie a priori.

Puteți utiliza orice formă a unei valori P de rafinare a posteriori. ținând seama de numărul de inspecții efectuate ipoteze.

De exemplu, atunci când abordarea Bonferroni (este adesea considerată o destul de conservatoare) multiplică fiecare valoare p de numărul de teste efectuate; întrucât orice decizii cu privire la semnificația acestui se va baza pe valoarea proxim a p.