O způsobu výpočtu střední hodnoty (na rozdíl od „nové“ metody vyvinuté matematiky z ministerstva vnitra)
Tento příspěvek sice nemá se Střední Amerikou nic společného , ale přesto .
Rád bych jen ukázal , jak měl být vypočítán počet platných podpisů , jež obdržela například Madame Bobošíková , jakkoliv mne politika odpuzuje .
Zde mne jen fascinuje to neuvěřitelné neumění spočítat střední hodnotu .
Takže: N = 56 191 = počet podpisů
Dále byl vytvořen výběrový soubor V1 = 8 500 (počet podpisů, jež byly přezkoumány)
Ten však byl vytvořen z původního souboru N = 56 191
Dále byl vytvořen výběrový soubor V2 = 8 500 (počet podpisů , jež byly rovněž přezkoumány)
Ten však byl vytvořen ne z původního souboru N= 56 191 , avšak již umenšeného o oněch prvních V1 = 8 500 .
Tudíž tyto již byly odděleny a nebyly již znovu zařazeny do náhodného výběru .
Tudíž jevový prostor se zmenšil na N´= N – V1 = 56 191 – 8 500 = 47 691 podpisů .
Dále
v prvním souboru je počet chybných podpisů CH1 = 651
ve druhém souboru je počet chybných podpisů CH2 = 977
Tudíž : můžme v souboru V1 a v souboru V2 vypočíst poměr, znamenající zastoupení chybných popisů : (neuvádím zde procenta, jsou zavádějící , počítám zde na potřebný počet platných cifer)
Tedy
R1 = CH1/V1 = 651/8 500 = 0.076 588 2
R2 = CH2/V2 = 977/8 500 = 0.114 941 2
Jelikož se jedná o značně triviální případ, tak se samozřejmě nabízí vypočíst střední hodnotu relativní chyby , vyjadřující poměrné zastoupení chybných podpisů jako prostý aritmetický průměr.
Jenže to není správná úvaha, jelikož jak výše uvedeno, oba soubory , z nichž vznikly, jsou odlišného charakteru.
První soubor V1 byl vytvořen náhodným (snad) pseudonáhodným (spíše) výběrem z N
Druhý soubor V2 byl však již vytvořen ze souboru sice nejprve původního, avšak umenšeného o počet odebraných výběrových podpisů V1 , tedy bylo jinými slovy podruhé vybíráno z počtu N´= N-V1 = 47 691 .
Tudíž je nutno použít pro výpočet střední hodnoty nikoliv prostý aritmetický průměr, ale vážený průměr .
Matematicky vzato je vlastně i aritmetický průměr zvláštním případem váženého průměru , avšak s tím , že váhy jednotlivých pozorování se rovnají výrazu 1/n , jejich součet pochopitelně dává 1 , jelikož to n= 2 (jsou výběrové soubory Vi v počtu n=2 , tedy V1 , Vn=V2)
Takže zavedeme váhy pozorování takto :
Vyrobíme poměry :
a1 = V1/N , tedy a1 = 8 500/ 56 191 = 0.151 269 78
a2=V2/(N-V1) ,tedy a2=V2/N´, tedy a2 = 8 500/ (56 191-8 500) = 8 500/47 691 = 0.178 230 69
Nyní provedeme výpočet vah znormováním :
p1 = a1/(a1+a2) = 0.459 088 2
p2 = a2/(a1+a2) = 0.540 911 8
—————————————
[pi] = p1+p2 = 1.000 000 0
Pro kontrolu musí součet vah být roven 1
___________________________________________________________________________________
(Poznámka):
váhy můžeme stanovit též neznormovaně , pak ale musíme užít tento výraz :
SR = [pi*li]/[pi]
V našem případě sice platí totéž :
SR = [pi*li]/[pi] , ale jelikož v něm platí [pi] = 1 , tak psát do jmenovatele jedničku je totéž , jako ji nepsat .
pak by
p1 = 8 500/56 191
p2 = 8 500/(56 191-8 500) = 8 500/47 691
Pak
SR = (8 500/56 191*0.076 588 2 + 8 500/47 691*0.114 941 2)/(8 500/56 191 + 8 500/47 691) = 0.097 333 8
_____________________________________________________________________________________
Nyní přistoupíme k výpočtu střední hodnoty relativní odchylky :
Tudíž SR = p1* R1 + p2*R2 = 0.459 088 2 * 0.076 588 2 + 0.540 911 8 * 0.114 941 2 = 0.097 333 8
Tudíž od původního souboru N je nutné odečíst odhad počtů podpisů , kterých je N*SR = 56 191 * 0.097 333 8 = 5 469.28
Tedy, jelikož počet podpisů je číslo celé, je výsledný počet chybných podpisů = 5 469 kusů .
Počet správných podpisů činí N*(1-SR) = 56 191 * (1-0.093 483 8) = 56 191 * 0.902 666 2= 50 721.72 ,
Tedy po zaokrouhlení 50 722 podpisů .
Počet chybných bez zaokrouhlení 5 469.28
Počet správných bez zaokrouhlení 50 721.72
——————————————————–
Celkem 56 191
Počet chybných 5 469
Počet správných 50 722
——————————
Celkem 56 191
Je nabíledni, proč váha prvního pozorování je menší než 1/2 a váha druhého pozorování je zas větší než 1/2 , na rozdíl od váhy u aritmetického průměru, kdy by byla v tomto jednoduchém případě rovna 1/2.
V podstatě to je jasné každému hazardnímu hráči:
Mějme dvě hry, v obou má hazardní hráč možnost 8 500 hodů kostkou
Ale v prvním způsobu hry má jevový prostor celkem 56 191 možností a ve druhé hře má již jen 47 691 možností.
Takže z podstaty věci vyplývá, že příznivější je pro hráče druhá hra, kde při stejném počtu hodů je méně možností, jež mohou nastat, tedy jinými slovy větší šance na výhru .
__________________________________________________________________________________
Poznámka :
Kdybychom se chtěli dobrat k odhadu chybných hlasů , šlo by to též bez relativních chyb.
Do váženého průměru bychom místo poměrů počet chybných / V , kde V = 8500 , dosadili jen přímo absolutní hodnotu .
Pak by nám ale vyšel odhad střední absolutní hodnoty počtu chybných podpisů, připadajících na vzorek o velikosti 8 500 podpisů .
A ten bychom extrapolovali lineárně úměrně na celý soubor N
Např.:
Odhad střední hodnoty počtu podpisů , připadajících na vzorek V = 8500 (váhy jsou zde znormované)
SCH(V) = p1*651 + p2 * 977 = 827.3
Pak počet chybných podpisů přepočtený na celý soubor činí :
CH(N) = 827.3/8 500*56 191 = 5469 .03 = 5 469 (po zaokrouhlení na celé číslo) počet podpisů chybných v rámci celého souboru .
Jak vidět, vyšlo totéž .
Někdy bývá jednodušší počítat s relativními chybami , ale zde to nebylo až tak nutné , naopak výstižnější bylo provést výpočet v absolutních hodnotách .
Jelikož stejně bylo nutno střední odhad relativní chyby přepočíst na absolutní hodnotu .
V jakési knize z 19.stl. ve španělštině Mano nera bylo uvedeno , že královská policie ve Španělsku neměla dlouhou dobu důmyslných náčelníků , takže zde je to asi podobné , když jeden z nich obhajuje jakýsi podivný postup a jeho nadřízený v tom „jede“ též .
-
Archiv
- Květen 2015 (1)
- Únor 2015 (1)
- Prosinec 2014 (1)
- Září 2014 (1)
- Červenec 2014 (1)
- Únor 2014 (1)
- Leden 2014 (1)
- Listopad 2013 (1)
- Říjen 2013 (3)
- Červenec 2013 (1)
- Červen 2013 (1)
- Květen 2013 (1)
-
Kategorie
-
RSS
Entries RSS
Comments RSS