Mexiko v dávné minulosti

Just another WordPress.com weblog

O způsobu výpočtu střední hodnoty (na rozdíl od „nové“ metody vyvinuté matematiky z ministerstva vnitra)

Tento příspěvek sice nemá se Střední Amerikou nic společného , ale přesto .

Rád bych jen ukázal , jak měl být vypočítán počet platných podpisů , jež obdržela například Madame Bobošíková , jakkoliv mne politika odpuzuje .

Zde mne jen fascinuje to neuvěřitelné neumění spočítat střední hodnotu .

Takže: N = 56 191 = počet podpisů

Dále byl vytvořen výběrový soubor V1 = 8 500 (počet podpisů, jež byly přezkoumány)

Ten však byl vytvořen z původního souboru N = 56 191

Dále byl vytvořen výběrový soubor V2 = 8 500 (počet podpisů , jež  byly rovněž přezkoumány)

Ten však byl vytvořen ne z původního souboru N= 56 191 , avšak již umenšeného o oněch prvních V1 = 8 500 .

Tudíž tyto již byly odděleny a nebyly již znovu zařazeny do náhodného výběru .

Tudíž jevový prostor se zmenšil na N´= N – V1 = 56 191 – 8 500 = 47 691 podpisů .

Dále

v prvním souboru je počet chybných podpisů  CH1 = 651

ve druhém souboru je počet chybných podpisů CH2 = 977

Tudíž : můžme v souboru V1 a v souboru V2 vypočíst poměr, znamenající zastoupení chybných popisů : (neuvádím zde procenta, jsou zavádějící , počítám zde na potřebný počet platných cifer)

Tedy

R1 = CH1/V1 = 651/8 500 = 0.076 588 2

R2 = CH2/V2 = 977/8 500 = 0.114 941 2

Jelikož se jedná o značně triviální případ, tak se samozřejmě nabízí vypočíst střední hodnotu relativní chyby , vyjadřující poměrné zastoupení chybných podpisů jako prostý aritmetický průměr.

Jenže to není správná úvaha, jelikož jak výše uvedeno, oba soubory , z nichž vznikly, jsou odlišného charakteru.

První soubor V1 byl vytvořen náhodným (snad) pseudonáhodným (spíše) výběrem z N

Druhý soubor V2 byl však již vytvořen ze souboru sice nejprve původního, avšak umenšeného o počet odebraných výběrových podpisů V1 , tedy bylo jinými slovy podruhé vybíráno z počtu N´= N-V1 = 47 691 .

Tudíž je nutno použít pro výpočet střední hodnoty nikoliv prostý aritmetický průměr, ale vážený průměr .

Matematicky vzato je vlastně i aritmetický průměr zvláštním případem váženého průměru , avšak s tím , že váhy jednotlivých pozorování se rovnají výrazu 1/n , jejich součet pochopitelně dává 1 , jelikož to n= 2 (jsou výběrové soubory Vi v počtu n=2 , tedy V1 , Vn=V2)

Takže zavedeme váhy pozorování takto :

Vyrobíme poměry :

a1 = V1/N , tedy a1 = 8 500/ 56 191 = 0.151 269 78

a2=V2/(N-V1) ,tedy a2=V2/N´,  tedy a2 =  8 500/ (56 191-8 500) = 8 500/47 691 = 0.178 230 69

Nyní provedeme výpočet vah znormováním :

p1 = a1/(a1+a2) = 0.459 088 2

p2 = a2/(a1+a2) = 0.540 911 8

—————————————

[pi] = p1+p2 = 1.000 000 0

Pro kontrolu musí součet vah být roven 1

___________________________________________________________________________________

(Poznámka):

váhy můžeme stanovit též neznormovaně , pak ale musíme užít tento výraz :

SR = [pi*li]/[pi]

V našem případě sice platí totéž :

SR = [pi*li]/[pi] , ale jelikož v něm platí  [pi] = 1 , tak psát do jmenovatele jedničku je totéž , jako ji nepsat .

pak by

p1 = 8 500/56 191

p2 = 8 500/(56 191-8 500) = 8 500/47 691

Pak

SR = (8 500/56 191*0.076 588 2 + 8 500/47 691*0.114 941 2)/(8 500/56 191 + 8 500/47 691) = 0.097 333 8

_____________________________________________________________________________________

Nyní přistoupíme k výpočtu střední hodnoty relativní odchylky :

Tudíž SR =  p1* R1 + p2*R2 = 0.459 088 2 * 0.076 588 2 + 0.540 911 8 * 0.114 941 2 = 0.097 333 8

Tudíž od původního souboru N je nutné odečíst odhad počtů podpisů , kterých je N*SR = 56 191 * 0.097 333 8 = 5 469.28

Tedy, jelikož počet podpisů je číslo celé, je výsledný počet chybných podpisů = 5 469 kusů .

Počet správných podpisů činí N*(1-SR) = 56 191 * (1-0.093 483 8) = 56 191 * 0.902 666 2= 50 721.72 ,

Tedy po zaokrouhlení 50 722 podpisů .

Počet chybných bez zaokrouhlení 5 469.28

Počet správných bez zaokrouhlení 50 721.72

——————————————————–

Celkem 56 191

Počet chybných 5 469

Počet správných 50 722

——————————

Celkem 56 191

Je nabíledni, proč váha prvního pozorování je menší než 1/2 a váha druhého pozorování je zas větší než 1/2 , na rozdíl od váhy u aritmetického průměru, kdy by byla v tomto jednoduchém případě rovna 1/2.

V podstatě to je jasné každému hazardnímu hráči:

Mějme dvě hry, v obou má hazardní hráč možnost  8 500 hodů kostkou

Ale v prvním způsobu hry má jevový prostor celkem 56 191 možností a ve druhé hře má již jen 47 691 možností.

Takže z podstaty věci vyplývá, že příznivější je pro hráče druhá hra, kde při stejném počtu hodů je méně možností, jež mohou nastat, tedy jinými slovy větší šance na výhru .

__________________________________________________________________________________

Poznámka :

Kdybychom se chtěli dobrat k odhadu chybných hlasů , šlo by to též bez relativních chyb.

Do váženého průměru bychom místo poměrů počet chybných / V , kde V = 8500 , dosadili jen přímo absolutní hodnotu .

Pak by nám ale vyšel odhad  střední absolutní hodnoty počtu chybných podpisů, připadajících na vzorek o velikosti 8 500 podpisů .

A ten bychom extrapolovali lineárně úměrně na celý soubor N

Např.:

Odhad střední hodnoty počtu podpisů , připadajících na vzorek V = 8500 (váhy jsou zde znormované)

SCH(V) = p1*651 + p2 * 977 = 827.3

Pak počet chybných podpisů přepočtený na celý soubor činí :

CH(N) = 827.3/8 500*56 191  = 5469 .03  = 5 469 (po zaokrouhlení na celé číslo) počet podpisů chybných v rámci celého souboru .

Jak vidět, vyšlo totéž .

Někdy bývá jednodušší počítat s relativními chybami , ale zde to nebylo až tak nutné , naopak výstižnější bylo provést výpočet v absolutních hodnotách .

Jelikož stejně bylo nutno střední odhad relativní chyby přepočíst na absolutní hodnotu .

V jakési knize z 19.stl. ve španělštině Mano nera bylo uvedeno , že královská policie ve Španělsku neměla dlouhou dobu důmyslných náčelníků , takže zde je to asi podobné , když jeden z nich obhajuje jakýsi podivný postup a jeho nadřízený v tom „jede“ též .

Reklamy

Listopad 26, 2012 Posted by | Různé | 1 komentář