Leto v USA (5)

1 - 2 - 3 - 4 - 5

Bayesov vzorec

Sobotné vyučovanie začal Eliezer dvojdielnou lekciou na tému počítanie pravdepodobností podľa Bayesovho vzorca. Začali sme jednoduchými matematickými cvičeniami a postupne prešli cez slovné úlohy na príklady z reálneho života.

Samotný výpočet je pomerne jednoduchý, len si pri ňom treba dať pozor. Mnohí ľudia si pletú "ak A, tak B" a "ak B, tak A", a toto je to podobné, akurát s pravdepodobnosťami. Treba rozlišovať medzi tvrdeniami "každé tretie jablko je hnilé" a "každé tretie hnilé ovocie je jablko". Ešte presnejšie, cieľom je vedieť z jedného z týchto údajov vypočítať druhý, za pomoci ďalších potrebných údajov.

Predstavme si napríklad nebezpečnú chorobu, ktorá postihuje jedno promile populácie. Vedci vyvinú test, ktorý so spoľahlivosťou 95% určí, či je človek zdravý alebo chorý. (Vyšetrený pacient sa s pravdepodobnosťou 95% dozvie správnu informáciu o svojom zdravotnom stave, a s pravdepodobnosťou 5% nesprávnu.) Necháte sa preventívne otestovať, a test vám povie, že ste chorý. S akou pravdepodobnosťou ste naozaj chorý?

Väčšina ľudí uvažuje asi takto: "Test mi s pravdepodobnosťou 95% povie správnu informáciu, s pravdepodobnosťou 5% nesprávnu. Test mi povedal, že som chorý. Takže na 95% som chorý a na 5% zdravý."

Táto úvaha obsahuje napohľad drobnú metodologickú chybičku, ktorá však dramaticky zmení výsledok. Pointa je v tom, že s novými informáciami sa pravdepodobnosti môžu zmeniť. Prv než ste sa dozvedeli výsledok testu, ste naozaj mali 95% pravdepodobnosť dostať správny výsledok. Informáciou, že test vás určil ako chorého, sa však táto pravdepodobnosť zmenila. Po tejto informácii už nie ste náhodným predstaviteľom množiny pacientov, ale náhodným predstaviteľom množiny pacientov s pozitívnym nálezom.

Jednoduchšie to vysvetlíme pomocou lotérie. Prv než hodíte kockou, pravdepodobnosť hodenia šestky je 1/6. Hodíte kockou, ale nepozriete sa na výsledok. Ešte stále môžete povedať, že je na nej šestka s pravdepodobnosťou 1/6. Pozriete sa na kocku a vidíte, že... Bez ohľadu na to, čo konkrétne na nej vidíte, pravdepodobnosť šestky už nie je 1/6. Ak vidíte, že padla šestka, potom sa táto pravdepodobnosť zmenila na prakticky 100%. (Slovami "prakticky 100%" zohľadňujem maličkú pravdepodobnosť, že ste sa pomýlili pri počítaní bodiek, alebo máte halucinácie.) Naopak, ak vidíte, že padla jednotka, dvojka, trojka, štvorka, či päťka, potom sa pravdepodobnosť šestky zmenila na prakticky 0%. Získaním novej informácie ste sa z množiny ľudí, ktorí hodili kockou, presunuli do množiny ľudí, ktorí hodili šestku, prípadne do množiny ľudí, ktorí šestku nehodili. V prvej množine je pravdepodobnosť šestky prakticky 100%, v druhej prakticky 0%, a keďže v druhej množine je päťkrát viac ľudí, vážený priemer je naďalej 1/6. Lenže to je vážený priemer za obe skupiny, zatiaľ čo vy ste už v jednej konkrétnej z nich.

Podobne sa množina pacientov skladá z množiny pacientov s pozitívnym nálezom a množiny pacientov s negatívnym nálezom. Pravdepodobnosť správneho výsledku testu, ako vážený priemer pre obe skupiny, je 95%. My sa však pýtame, aká je pravdepodobnosť pre množinu pacientov s pozitívnym nálezom, a tam môže byť odpoveď veľmi odlišná.

Teraz to asi znie komplikovane, ale v skutočnosti je to veľmi ľahké, akurát treba výpočet začať zo správneho konca. Tým správnym koncom je časť, ktorú možno mnohí preskočia, že danú chorobu má jedno promile populácie. (Keby som túto informáciu neuviedol, koľkí by si uvedomili, že je na správny výpočet nevyhnutná?) Pomer chorých a zdravých ľudí v populácii je teda 1 : 999. Zložité? Dúfam, že nie.

Nasledujúcim krokom je zohľadnenie pozitívneho nálezu, na oboch stranách uvedeného pomeru. Aká je šanca, že chorému človeku vyjde, že je chorý? 95%. Aká je šanca, že zdravému človeku vyjde, že je chorý? 5%. Každú stranu aktualizujeme príslušným číslom a dostaneme 1 × 95% : 999 × 5%. Pôvodné hodnoty sme prenásobili podmienenými pravdepodobnosťami pozorovaného javu (pozitívneho nálezu testu) v prvom a druhom prípade. Po vynásobení dostaneme 95 : 4995. Aj bez výpočtu vidíme, že ľavá strana je omnoho menšia než pravá, čiže aj pri pozitívnom náleze je choroba stále menej pravdepodobná než zdravie. Po výpočte dostaneme cca 2% : 98%.

Ako je možné, že test je na 95% spoľahlivý, a napriek tomu je pri pozitívnom náleze pravdepodobnosť choroby iba 2%? Celá záhada spočíva v tom, že výskyt choroby je omnoho nižší než chybovosť testu, preto je pozitívny nález s vyššou pravdepodobnosťou dôsledkom chyby testu než skutočnej choroby.

Iný príklad: V sude máme červené a žlté jablká. Každé tretie červené jablko je hnilé. Každé desiate žlté jablko je hnilé. Náhodne som zo suda vytiahol jedno jablko, a bolo hnilé. S akou pravdepodobnosťou bolo červené?

Skúste vypočítať samostatne...

Pozorný čitateľ si všimol, že v zadaní chýba kľúčová informácia: aký je pomer červených a žltých jabĺk v sude. Bez toho sa úloha nedá vyriešiť. Ak by v sude boli napríklad iba červené jablká (alebo povedzme milión červených jabĺk na jedno žlté, aby sme dodržali literu zadania), potom je naše hnilé jablko zrejme červené. Ak by v sude naopak boli iba žlté jablká, potom je naše hnilé jablko zrejme žlté. A čo pre zvyšné pomery?

Ak je pôvodný pomer červených jabĺk k žltým 1 : 1, vynásobíme obe strany pravdepodobnosťou, že dané jablko je hnilé, čiže 1 × 1/3 : 1 × 1/10 = 1/3 : 1/10 = 10 : 3 = 10/13 : 3/13. Vybrané hnilé jablko je teda s pravdepodobnosťou 77% červené, a s pravdepodobnosťou 23% žlté.

Keby však v sude bolo žltých jabĺk trikrát viac ako červených, pôvodný pomer by bol 1 : 3, a po vynásobení podmienenými pravdepodobnosťami by sme dostali 1 × 1/3 : 3 × 1/10 = 1/3 : 3/10 = 10 : 9 = 10/19 : 9/19. Vybrané hnilé jablko by teda bolo s pravdepodobnosťou 53% červené, a s pravdepodobnosťou 47% žlté.

Ešte jeden príklad, tentokrát už s úplným zadaním: V škole je 40% chlapcov a 60% dievčat. Všetci chlapci nosia nohavice; polovica dievčat nosí nohavice a polovica sukňu. Ak vidíme v diaľke postavu v nohaviciach, je to chlapec alebo dievča? Pôvodný pomer 4 : 6, po vynásobení pravdepodobnosťou nohavíc 4 × 1 : 6 × 1/2 = 4 : 3 = 4/7 : 3/7, čiže s pravdepodobnosťou 57% je to chlapec, s pravdepodobnosťou 43% dievča.

S trochou cviku by ste tento výpočet, možno okrem záverečného vydelenia, mohli zvládnuť aj spamäti.

Mimochodom, pri pomeroch nemusíme uvádzať iba dve čísla, môžeme aj viac. Ak sú v sude červené, žlté a zelené jablká v pomere 1 : 3 : 2, a ak je hnilé každé tretie červené, každé desiate žlté, a každé piate zelené, pomer hnilých jabĺk je 1 × 1/3 : 3 × 1/10 : 2 : 1/5 = 1/3 : 3/10 : 2/5 = 10 : 9 : 12 = 10/31 : 9/31 : 12/31, čiže vybrané hnilé jablko je na 32% červené, 29% žlté, 39% zelené.

Ak postupne získame viacero informácií, môžeme dané čísla aktualizovať viackrát. Predstavme si krajinu, kde koluje veľa falošných mincí, na ktorých jedna strana padá dvakrát častejšie než druhá. Konkrétne, na 25% mincí padá hlava dvakrát častejšie ako znak, 50% mincí je pravých, a na 25% mincí padá znak dvakrát častejšie ako hlava. Postupne nám padlo: hlava, hlava, znak, hlava. Aká je pravdepodobnosť, že daná minca je pravá?

Pôvodný pomer je 1 : 2 : 1. Pravdepodobnosť hodenia hlavy na pravej minci je 1/2, na falošnej 2/3 alebo 1/3, čiže dostaneme 1 × 2/3 : 2 × 1/2 : 1 × 1/3. Po druhom hode je to (1 × 2/3) × 2/3 : (2 × 1/2) × 1/2 : (1 × 1/3) × 1/3, a po všetkých štyroch hodoch je to 1 × 2/3 × 2/3 × 1/3 × 2/3 : 2 × 1/2 × 1/2 × 1/2 × 1/2 : 1 × 1/3 × 1/3 × 2/3 × 1/3 = 8/81 : 2/16 : 2/81 = 128 : 162 : 32 = cca 40% : 50% : 10%. S pravdepodobnosťou 50% je daná minca pravá.

Ak danou mincou hodíme ešte piatykrát a padne znak, môžeme vo výpočte pokračovať tam, kde sme prestali. 128 × 1/3 : 162 × 1/2 : 32 × 2/3 = 256 : 486 : 128 = 29% : 56% : 15%, čím sa pravdepodobnosť pravej mince zvýšila na 56%.

Ak by naopak pri piatom hode padla hlava, výpočet by pokračoval 128 × 2/3 : 162 × 1/2 : 32 × 1/3 = 512 : 486 : 64 = 48% : 46% : 6%, čím by sa pravdepodobnosť pravej mince znížila na 46%.

Dôležité je zapamätať si, že na výslednú pravdepodobnosť vplývajú nielen podmienené pravdepodobnosti, ale aj pôvodné pravdepodobnosti. Inak sa vám môže stať, že stretnete človeka, ktorý bude tvrdiť, že má nadprirodzené schopnosti a že vám to dokáže hodením šestky na dvoch kockách... a potom tie dve šestky naozaj hodí, čím svoje nadprirodzené schopnosti vedecky potvrdil na hladine významnosti p = 0,05, čo je v nejednom vedeckom časopise dostatočným dôvodom na publikovanie. Kiež by som iba žartoval...

Pre tých, čo trochu rozumejú štatistike a pri predchádzajúcich slovách zneisteli: Háčik je opäť v otočení implikácie, ako som naznačil v úvode tohto článku. Hladina významnosti p = 0,05 znamená "ak je to náhoda, pravdepodobnosť takéhoto výsledku je menšia ako 0,05". Neznamená to "ak nastal takýto výsledok, pravdepodobnosť, že to bola náhoda, je menšia ako 0,05". Na správny výpočet toho druhého potrebujeme ešte jeden údaj, a tým je percento ľudí s nadprirodzenými schopnosťami v populácii. Ak je toto percento veľmi nízke, daný výsledok je skôr dôsledkom náhody než schopností. Spomeňte si na test so spoľahlivosťou 95%, ktorý sa napriek tomu vo väčšine prípadov diagnostikovania choroby mýlil.

Mikroekonómia

Po úvodnej matematickej prednáške sme sa rozdelili do skupín. Anna mala prvé zo série mikroekonomických cvičení, s názvom: "Používanie zameniteľnosti".

Ak sa pokúsim zhrnúť spoločnú tému všetkých mikroekonomických cvičení, vychádza mi asi toto: V živote máme mnoho cieľov, ktoré chceme dosiahnuť, naše prostriedky sú však obmedzené. Máme na výber viaceré možnosti ako premieňať to, čo máme, na to, čo chceme mať. Ak budeme postupovať rozumne, môžeme z rovnakých štartových prostriedkov vyťažiť viac. Rozumný postup však neznamená rozmýšľať nad každou maličkosťou; čas je predsa tiež jedným z obmedzených prostriedkov. Rozmýšľanie o efektivite konania má byť tiež efektívne. Na týchto cvičeniach sme teda prediskutovali časté životné situácie a svoje ciele, a snažili sme sa na ne pozerať z ekonomického uhla.

Prvé cvičenie sa týkalo našich cieľov. Napokon, na minitábor sme mnohí prišli s cieľom naučiť sa ich lepšie dosahovať. Aké ciele máme? Vieme si ich dostatočne jasne predstaviť a popísať, alebo nám niečo chýba? Máme z nich dobrý pocit, alebo cítime vnútorný konflikt? Ktoré z nich pravdepodobne dosiahneme o mesiac, o rok, neskôr?

Niektoré ciele dosahujeme kvôli nim samotným. Iné sú pre nás prostriedkom na dosiahnutie ďalších cieľov. V tom prípade sa oplatí povedať, čo si od danej veci sľubujeme... a akými inými spôsobmi by sa to dalo dosiahnuť.

Niekedy si od jedného plánu sľubujeme niekoľko vecí naraz. Aj v tom prípade si však môžeme vypísať jednotlivé zamýšľané výsledky a pokúsiť sa nájsť alternatívu pre každý z nich. Niekedy má jeden plán aj želané aj neželané výsledky. To je len o dôvod viac zamyslieť sa nad alternatívnymi plánmi pre tie želané.

(No a keby ste teraz neboli na webe, ale na minitábore, bola by správna chvíľa vybrať pero a papier, zamyslieť sa, napísať zoznam svojich cieľov na najbližšie obdobie, vybrať z nich jeden alebo dva a rozpísať, aké výsledky si od nich sľubujete, a akými alternatívnymi spôsobmi by sa dali dosiahnuť. A potom prediskutovať v skupine, na čo ste došli, a čo ďalšie by sa ešte dalo vymyslieť. Väčšinu úžitku z toho cvičenia nemáme z prečítania si teórie, ale z toho, že sa naozaj zastavíme a poriadne sa nad svojimi možnosťami zamyslíme, a prípadne dôjdeme na niečo, čo sme si dovtedy neuvedomovali. A to asi platí aj pre väčšinu nasledujúcich cvičení.)

 

Ďalšie cvičenie mal Critch, a jeho témou bolo uvedomovanie si emócií. Vzťah medzi rozumom a emóciami je... no, povedzme že trochu iný než sa zobrazuje v hollywoodskych filmoch, kde akože "rozumní" a "logickí" ľudia popierajú, že by nejaké emócie mali, aj keď divákovi je zrejmé, že ich tvrdenia majú od pravdy ďaleko. Popieranie alebo ignorovanie niečoho, čo má na ľudský život významný vplyv, nie je súčasťou našej definície rozumnosti. Cieľom tohto cvičenia bolo sledovanie prežívania emócií u seba a u druhých.

Rôzni autori majú trochu rôzne názory na to, ktoré emócie sú základné. Tu je jeden zo zoznamov základných emócií, ktoré máme spoločný so zvieratami: hravosť, láskavosť, panika, strach, vášeň, zlosť, zvedavosť. Pridajme si ľudské emócie známe vo všetkých kultúrach: hnus, prekvapenie, smútok, šťastie.

Každá emócia má svoje charakteristiky. Je nezmysel povedať, že nejaká emócia je "opakom" inej emócie. To je ako keby sme povedali, že noha je opakom ruky, alebo pečeň opakom srdca (možno zaujímavá metafora, ale o fungovaní pečene sa z nej veľa nedozvieme). Ako sa daná emócia prejavuje vnútri? Kde v tele ju cítime? Aké zmyslové vnemy (farba, zvuk, teplota, povrch...) sa nám s ňou spájajú? Aký druh myšlienok sa s ňou spája?

Ako sa daná emócia prejavuje navonok? Ako sa pri nej zvyčajne správame? Čo hovoríme? V akých konkrétnych situáciách ju pociťujeme? Čo z tohto si môžeme všímať aj u iných ľudí?

Ak sa snažíme stať rozumnejšími, osobitný význam má pre nás zvedavosť. Často zanedbávaná emócia; mnohí ľudia by ju do zoznamu emócií zabudli zaradiť, alebo by sa hádali, že tam nepatrí.

Zložitejšie emócie v sebe zahŕňajú kombináciu základných emócií. Sú to napríklad: hanba, hrdosť, ľútosť, márnosť, nervozita, optimizmus, pobavenie, podráždenie, pohŕdanie, rozpaky, spokojnosť, sebaľútosť, sklamanie, súcit, úľava, vina, vzrušenie, zadosťučinenie, závisť. Môžeme si o nich položiť rovnaké otázky; plus otázku, z akých zložiek sa skladajú.

pokračovanie nabudúce...

viliam@bur.sk