Statistická významnost: definice, koncept, významnost, regresní rovnice a testování hypotéz

Obsah:

Statistická významnost: definice, koncept, významnost, regresní rovnice a testování hypotéz
Statistická významnost: definice, koncept, významnost, regresní rovnice a testování hypotéz

Video: Statistická významnost: definice, koncept, významnost, regresní rovnice a testování hypotéz

Video: Statistická významnost: definice, koncept, významnost, regresní rovnice a testování hypotéz
Video: 3. Odhad parametrů pomocí BMNČ | Konstrukce ekonometrického modelu | SW Gretl | Zdarma verze 2024, Smět
Anonim

Statistika je již dlouho nedílnou součástí života. Lidé se s tím potýkají všude. Na základě statistik se vyvozují závěry o tom, kde a jaká onemocnění jsou běžná, po čem je větší poptávka v konkrétním regionu nebo u určitého segmentu populace. I konstrukce politických programů kandidátů do vládních orgánů vychází ze statistických údajů. Používají je také obchodní řetězce při nákupu zboží a výrobci se těmito údaji řídí ve svých návrzích.

Statistika hraje důležitou roli v životě společnosti a ovlivňuje každého jejího jednotlivého člena, a to i v maličkostech. Pokud například podle statistik většina lidí preferuje tmavé barvy v oblečení v konkrétním městě nebo regionu, pak bude nalezení jasně žluté pláštěnky s květinovým potiskem v místních prodejnách extrémně obtížné. Ale jaké množstvísčítají se tyto údaje, aby měly takový dopad? Co je například „statisticky významné“? Co přesně znamená tato definice?

Co je to?

Statistika jako věda je tvořena kombinací různých veličin a pojmů. Jedním z nich je koncept „statistické významnosti“. Toto je název hodnoty proměnných, pravděpodobnost výskytu dalších ukazatelů, u kterých je zanedbatelná.

Výpočet statistických ukazatelů
Výpočet statistických ukazatelů

Například 9 z 10 lidí si při ranní procházce na houby v podzimním lese po deštivé noci nazouvá na nohy gumové boty. Pravděpodobnost, že si někdy 8 z nich navlékne plátěné mokasíny, je mizivá. V tomto konkrétním příkladu je tedy číslo 9 to, čemu se říká „statistická významnost“.

Pokud tedy uvedený praktický příklad dále rozvedeme, prodejny obuvi nakupují gumáky do konce letní sezóny ve větším množství než jindy v roce. Velikost statistické hodnoty má tedy dopad na běžný život.

Samozřejmě ve složitých výpočtech, řekněme při předpovídání šíření virů, se bere v úvahu velké množství proměnných. Ale samotná podstata stanovení významného ukazatele statistických dat je podobná, bez ohledu na složitost výpočtů a počet proměnných hodnot.

Jak se počítá?

Používá se při výpočtu hodnoty ukazatele "statistické významnosti" rovnice. To znamená, že lze namítnout, že v tomto případě o všem rozhoduje matematika. Nejjednodušší možností výpočtu je řetězec matematických operací, ve kterém jsou zahrnuty následující parametry:

  • dva typy výsledků získaných z průzkumů nebo studiem objektivních údajů, jako je množství nákupů, označených aab;
  • indikátor velikosti vzorku pro obě skupiny – n;
  • hodnota kombinovaného podílu vzorku - p;
  • standardní chyba – SE.

Dalším krokem je stanovení celkového skóre testu – t, jeho hodnota se porovná s číslem 1,96.

Vzorec pro jednoduchý výpočet
Vzorec pro jednoduchý výpočet

Často vyvstává otázka, jaký je rozdíl mezi hodnotami n a p. Tuto nuanci lze snadno objasnit příkladem. Řekněme, že se vypočítá statistická významnost loajality k jakémukoli produktu nebo značce mužů a žen.

V tomto případě budou za písmeny následovat následující:

  • n – počet respondentů;
  • p – počet spokojených s produktem.

Počet dotazovaných žen v tomto případě bude označen jako n1. V souladu s tím muži - n2. Stejná hodnota bude mít čísla "1" a "2" symbolu p.

Porovnání skóre testu s průměrem studentových tabulek se stává tím, co se nazývá „statistická významnost“.

Co znamená ověření?

Výsledky jakéhokoli matematického výpočtu lze vždy zkontrolovat, to se učí děti na základní škole. Je logické předpokládatže jelikož jsou statistiky určeny pomocí řetězce výpočtů, jsou následně kontrolovány.

Testování statistické významnosti však není jen matematika. Statistika se zabývá velkým množstvím proměnných a různými pravděpodobnostmi, které zdaleka ne vždy lze počítat. Čili pokud se vrátíme k příkladu gumových bot na začátku článku, tak logickou konstrukci statistických dat, na které se budou kupující zboží pro obchody spoléhat, může narušit sychravé a horké počasí, které není pro podzim typické.. V důsledku tohoto jevu se sníží počet lidí nakupujících gumové holínky a prodejny utrpí ztráty. Matematický vzorec samozřejmě není schopen předvídat anomálii počasí. Tento okamžik se nazývá „chyba“.

Nástroje pro statistickou vizualizaci dat
Nástroje pro statistickou vizualizaci dat

To je pouze pravděpodobnost takových chyb a zohledňuje kontrolu hladiny vypočítané významnosti. Bere v úvahu jak vypočítané indikátory, tak přijaté úrovně významnosti, stejně jako veličiny běžně nazývané hypotézy.

Jaká je hladina významnosti?

Pojem „úroveň“je součástí hlavních kritérií statistické významnosti. Používá se v aplikované i praktické statistice. Jedná se o druh hodnoty, která zohledňuje pravděpodobnost možných odchylek nebo chyb.

Úroveň je založena na identifikaci rozdílů v hotových vzorcích, umožňuje stanovit jejich významnost nebo naopak náhodnost. Tento pojem má nejen digitální významy, ale také jejich zvláštní interpretace. Vysvětlujíjak potřebujete porozumět hodnotě a samotná úroveň je určena porovnáním výsledku s průměrným indexem, což odhaluje míru spolehlivosti rozdílů.

Diskuse o statistikách
Diskuse o statistikách

Pojem úrovně si tedy můžeme představit jednoduše - je to indikátor přijatelné, pravděpodobné chyby nebo chyby v závěrech vyvozených ze získaných statistických dat.

Jaké úrovně významnosti se používají?

Statistická významnost koeficientů pravděpodobnosti chyby v praxi je založena na třech základních úrovních.

První úroveň je práh, při kterém je hodnota 5 %. To znamená, že pravděpodobnost chyby nepřesahuje hladinu významnosti 5 %. To znamená, že důvěra v bezchybnost a neomylnost závěrů učiněných na základě statistických výzkumných dat je 95 %.

Druhou úrovní je hranice 1 %. Toto číslo tedy znamená, že se lze s 99% spolehlivostí řídit údaji získanými během statistických výpočtů.

Třetí úroveň – 0,1 %. S touto hodnotou je pravděpodobnost chyby rovna zlomku procenta, to znamená, že chyby jsou prakticky vyloučeny.

Co je to hypotéza ve statistice?

Chyby jako koncept jsou rozděleny do dvou oblastí, které se týkají přijetí nebo zamítnutí nulové hypotézy. Hypotéza je pojem, za kterým se podle definice skrývá soubor výsledků průzkumu, jiných údajů nebo tvrzení. Tedy popis rozdělení pravděpodobnosti něčeho, co souvisí s předmětem statistického účetnictví.

statistická významnost regrese
statistická významnost regrese

V jednoduchých výpočtech existují dvě hypotézy – nulová a alternativní. Rozdíl mezi nimi je v tom, že nulová hypotéza je založena na myšlence, že mezi vzorky podílejícími se na stanovení statistické významnosti nejsou žádné zásadní rozdíly a alternativní je zcela opačná. To znamená, že alternativní hypotéza je založena na přítomnosti významného rozdílu v těchto vzorcích.

Jaké jsou chyby?

Chyby jako pojem ve statistice jsou přímo úměrné přijetí té či oné hypotézy jako pravdivé. Lze je rozdělit do dvou směrů nebo typů:

  • první typ je způsoben přijetím nulové hypotézy, která se ukázala jako nesprávná;
  • sekunda – způsobená následováním alternativy.
Zobrazení statistických grafů
Zobrazení statistických grafů

První typ chyby se nazývá falešně pozitivní a je zcela běžný ve všech oblastech, kde se používají statistiky. Podle toho se chyba druhého typu nazývá falešně negativní.

Proč potřebujeme regresi ve statistikách?

Statistická významnost regrese spočívá v tom, že s její pomocí lze zjistit, nakolik model různých závislostí vypočítaný na základě dat odpovídá skutečnosti; umožňuje identifikovat dostatek nebo nedostatek faktorů pro účetnictví a závěry.

Regresní hodnota je určena porovnáním výsledků s údaji uvedenými ve Fisherových tabulkách. Nebo pomocí analýzy rozptylu. Regresní ukazatele jsou důležité, kdyžkomplexní statistické studie a výpočty zahrnující velké množství proměnných, náhodných dat a pravděpodobných změn.

Doporučuje: