Úvod do racionality

Tento článok bol pôvodne napísaný pre časopis Mensy Slovensko na základe mojej predchádzajúcej prednášky v Mense. Prednáška aj článok vznikli ešte pred Minitáborom racionality; preto ho vkladám pred štvrtú časť série článkov „Leto v USA“ ako ilustráciu, čo ma motivovalo zúčastniť sa tohto minitábora. Zároveň do textu vkladám odkazy na konkrétne miesta na stránke LessWrong, kde sa preberajú spomínané témy (po anglicky).

Mensa združuje ľudí, ktorým príroda nadelila vysokú inteligenciu. Ľudský rozum je však nástroj, ktorý sa treba naučiť používať, inak ho často používame neefektívne alebo nesprávne, na vlastnú škodu. Skúmaním a rozvíjaním rozumnosti sa zaoberá webová stránka LessWrong. Obsahuje stovky článkov a diskusií na rôzne témy (pravda, poznanie, štatistika, veda, kvantová fyzika, evolúcia, ľudské myslenie, etika, umelá inteligencia, globálne riziká, rozumný životný štýl) a tento článok je stručným zhrnutím úvodných cca desiatich percent obsahu, ktoré som v apríli 2012 prerozprával v Mense. Ak vás zaujme, odporúčam pozrieť viac na stránke „lesswrong.com“. (Zakladateľ stránky, Eliezer Yudkowski, píše aj fan fiction Harry Potter a Metódy Racionality; nájdete ho na stránke „hpmor.com“, existuje aj čiastočný český preklad.)

Ak chceme poznávať svet, musíme zároveň poznávať sami seba. Keď astronóm uvidí v ďalekohľade škvrnu, potrebuje vedieť, či je tá škvrna na oblohe alebo na skle ďalekohľadu. Ľudský rozum je nástroj, ktorý dokáže skúmať svet, ale aj produkovať množstvo nezmyslov. Našťastie, ľudia majú schopnosť sebareflexie; dokážu využiť svoj rozum na skúmanie vlastností ľudského rozumu, a hľadať postupy na prekonávanie vlastných chýb. (Zároveň dokážu vyprodukovať aj množstvo nezmyslov o ľudskom rozume; tie však možno preskúmať v ďalšom kole, atď.) Nebudem teraz menovať sto druhov logických chýb; dôležité je uvedomiť si, že ľudský mozog je výsledkom evolúcie, ktorá odmeňovala nielen poznanie a ovládanie prírody, ale aj šikovné oblbnutie svojich blížnych. Ako sa rozvíjala ľudská schopnosť klamať a odhaľovať lži, rozvíjala sa aj schopnosť sebaklamu; kto vhodne oklame sám seba, dokáže klamať aj úprimnosťou. Sebaklam sa nedá len tak vypnúť; sami seba klameme inštinktívne a často sa nám to vypomstí. Ako môže byť inštinkt taký škodlivý? Evolúcia postupuje pomaly a ľudské prostredie sa mení pomerne rýchlo. Naše inštinkty sú naladené na podmienky, v ktorých ľudia žili pred desaťtisíc až stotisíc rokmi. (Inštinkt jesť sladké veci sme získali, pretože najčastejším zdrojom cukru bolo ovocie, obsahujúce vitamíny. Dnes máme rafinovaný cukor a sladené nápoje, a ten istý inštinkt, pokiaľ ho vedome nepotláčame, spôsobuje obezitu, cukrovku, predčasnú smrť.) Kedysi mali členovia jednej tlupy viacmenej rovnaké vedomosti. Keď lovec objavil, že za kopcom sa pasú jelene, všetci jasne vedeli, čo znamená „kopec“ a „jeleň“, takže informácie sa ľahko zdieľali. Inštinktívne čakáme, že každá vec sa dá vysvetliť, ak nie jednou vetou, tak nanajvýš za hodinu. (Klasický názor z internetu: načo sa učiť, keď sa všetko dá vygoogliť? Iste, ale keď nepoznáš terminológiu a nepoznáš stovky súvislostí, pochopíš to nesprávne. Nerozoznáš ani správne vysvetlenie od totálnej hlúposti, ktorých je na internete neúrekom.) Veda je spôsob poznávania sveta využívajúci kontrolné mechanizmy proti klamu a sebaklamu (presné popisy, pokusy, štatistika, odborné recenzie), vďaka čomu sme dosiahli mnohé úžasné výsledky. Žiaľ, ani mnohí vedci týmto mechanizmom presne nerozumejú, a používajú ich viacmenej rituálne. Vďaka tomu sa aj v karentovaných odborných časopisoch občas vyskytne poriadna hlúposť. Ešte horšie je na tom verejnosť, pre ktorú slovo „veda“ označuje správu z tlače, prerozprávanú novinárom, ktorý danej téme nerozumie, z pôvodnej informácie dôležité časti vynechal a zvyšok prispôsobil vlastnej fantázii. (Ak chcete mať prehľad o vede, čítanie populárnych článkov o najnovších vedeckých objavoch je tá najhoršia možnosť. Rozumný postup je prečítať si učebnice a potom prípadne listovať v odborných časopisoch.) Aby sme mohli diskutovať o zložitých veciach, potrebujeme najprv kvalitné základy.

Čo je to vlastne pravda? Touto otázkou sa zvyčajne bránia ľudia pristihnutí pri lži a zatlačení do kúta. Vyhnime sa však argumentu „ad hominem“ a vážne sa zamyslime. Príklad: je pravda, že 2+2=4? Nuž, myslím si, že 2+2=4; odborníci hovoria, že 2+2=4; vieme logicky zdôvodniť, že 2+2=4; jednoznačne to vyzerá, že 2+2=4... ale je to naozaj naozaj naozaj pravda? Vieme predsa, že ľudia si v minulosti mysleli a logicky vyargumentovali kadečo a potom sa občas ukázalo, že je to inak. Ako sa teda správne zachovať v podobnej situácii? Rozumná odpoveď je, že ak to tak podľa našich terajších vedomostí naozaj vyzerá, a nič lepšie k tomu momentálne nevieme povedať, mohli by sme to predbežne označiť za pravdu, aby sme sa posunuli ďalej. Ak sa však v budúcnosti vyskytne niečo, čo túto informáciu spochybní, vrátime sa k nej a prehodnotíme ju vo svetle nových poznatkov. Môže byť? Inak to totiž nejde. Vždy predsa z niečoho vychádzame, vždy používame nejaké postupy; niečo z toho sa môže neskôr ukázať ako nesprávne. Doslova z nuly sa však začať nedá, nulová myseľ neexistuje. Ani novorodenec nemá nulovú myseľ; má inštinkty, má určitú stavbu mozgu, to už sú predpoklady. Nulovou mysľou by mohol byť kameň; nemá ani mozog, ani inštinkt, neprodukuje však žiadne poznatky; na fyzikálne podnety reaguje priamočiaro. Ako je možné, že na rozdiel od kameňa, my dokážeme svet vnímať? Máme zmyslové orgány, ktoré v dôsledku evolučného tlaku ako-tak odzrkadľujú svet. Máme rozum, ktorý dokáže vnímať nielen iné veci, ale nepriamo aj sám seba. Skrátka, s nevyhnutnými predpokladmi rozumnosti sme sa už narodili, ďalej ich iba rozvíjame. Nepotrebujeme od prírody dokonalú myseľ, potrebujeme však myseľ schopnú sebazdokonaľovania, plus nejaké zmyslové orgány. Mimochodom, informáciu, že 2+2=4, sme tiež získali cez zmysly. Dve jabĺčka a dve jabĺčka sú štyri jabĺčka, a platí to aj pre iné predmety, vrátane imaginárnych. (Keby sme žili vo svete, kde dve jabĺčka a dve jabĺčka budú dokopy päť jabĺčok, aj keď si to teraz neviem predstaviť, a keby to tak bolo vždy a so všetkými predmetmi, v takom svete by sme vedeli, že 2+2=5. Pretože v tom svete by to bola pravda.)

Každá informácia má určitú pravdepodobnosť; to je nejaké číslo medzi nulou a jednotkou, medzi 0% a 100%. Ak sa chceme vyjadriť celkom presne, samotná nula a jednotka nie sú pravdepodobnosti. (Aby sme o niečom získali nekonečnú istotu, potrebovali by sme nekonečné množstvo informácií, a to nemáme.) Niektoré pravdepodobnosti sú však také nízke alebo vysoké, že ich v praktickom živote považujeme za nuly a jednotky. (Výrok „2+2=4“ má pravdepodobnosť prakticky 100%.) Hodnoty medzi nulou a jednotkou však nemôžeme všetky hodiť do jedného vreca, čo je častá forma nerozumnosti. (Pravdepodobnosť výhry prvej ceny v športke je 0, 000 000 07. Takže mám šancu, paráda! Áno, ale skoro nulovú.) Zanedbateľne malá pravdepodobnosť síce nie je nulová, ale rozdiel medzi ňou a nulou je zanedbateľne malý.

Dôležité: pravdepodobnosť existuje v mysli, nie vo svete. Ak niekto hodí mincou a skryje ju predo mnou, z môjho pohľadu je 50% pravdepodobnosť, že padla jednou stranou, a 50% že druhou. V skutočnosti však padla jedným konkrétnym spôsobom, a tým druhým nepadla. Číslo „50%“ v tomto prípade vyjadruje iba úroveň mojej nevedomosti. Zmení sa niečo, ak najprv poviem pravdepodobnosť a potom hodím mincou? V princípe nie, číslo „50%“ stále vyjadruje iba moju neschopnosť odhadnúť silu a rýchlosť hodenia mince, a spočítať jej otáčky; keby som to dokázal, nebol by rozdiel medzi hodením a obyčajným položením mince. Aj keď je pravdepodobnosť subjektívna, jej výpočet sa musí riadiť istými pravidlami, inak je nesprávny. Dobre vypočítaná pravdepodobnosť vyjadruje, ako často sa moje očakávanie bude zhodovať so skutočnosťou. (Ak si chcete natrénovať odhad pravdepodobnosti, zaveďte si zošit so stranami povedzme „60%“, „70%“, „80%“, „90%“ a zapisujte si tam predpovede, ktorých splnenie viete po istom čase overiť. Až budete mať veľa záznamov a vyhodnotíte ich, percento úspešných predpovedí v každej kategórii by malo zhruba zodpovedať odhadovanej pravdepodobnosti. Podľa toho zistíte, či svoje odhady podceňujete alebo preceňujete.)

Ako počítať pravdepodobnosti? Príklad: Predstavme si školu, kde je 40% chlapcov a 60% dievčat. Všetci chlapci nosia nohavice. Polovica dievčat nosí nohavice, polovica nosí sukňu. Na školskom dvore vidíte žiacku postavu, ale z diaľky rozoznáte iba to, že má nohavice. S akou pravdepodobnosťou je to chlapec? (Teraz prestaňte čítať a spočítajte to.) Keďže som dal jednoduché čísla, najľahšie je predstaviť si to konkrétne: z desiatich žiakov sú štyria chlapci, šesť dievčat; z toho tri dievčatá majú nohavice, tri majú sukne; to je spolu sedem žiakov v nohaviciach, štyria chlapci, tri dievčatá; čiže pravdepodobnosť, že postava v nohaviciach je chlapec, je štyri zo siedmich, zhruba 57%. Aké ľahké zadanie, a predsa to veľa ľudí nezráta! Mnohí nerozlišujú medzi „ak A, tak B“ a „ak B, tak A“, nieto ešte „ak A, tak s pravdepodobnosťou x aj B“ a „ak B, tak s pravdepodobnosťou x aj A“. Bez toho však nemožno robiť vedu, ani mnohé logické úvahy. Ak niečo nevieme zrátať z hlavy, pomôže nám matematický zápis.

Trieda 9.A :-D

Označme p(A) pravdepodobnosť javu A, napríklad p(ch) je pravdepodobnosť, že náhodne vybraný žiak školy je chlapec. Ak je jeden jav opakom druhého, súčet ich pravdepodobností je 100%, napríklad p(ch) + p(d) = 0,4 + 0,6 = 1. Označme p(A|B) pravdepodobnosť javu A za predpokladu B, napríklad p(ch|n) je pravdepodobnosť, že náhodná postava v nohaviciach je chlapec; cieľ našej úlohy. Rozlišujme od p(n|ch), čo je pravdepodobnosť, že náhodný chlapec nosí nohavice; podľa zadania 100%. Podmienenú pravdepodobnosť vypočítame ako p(A|B) = p(A˄B)/p(B); pravdepodobnosť, že nastali oba javy zároveň, vydelíme pravdepodobnosťou predpokladu. Z toho vyplýva p(A˄B) = p(A)·p(B|A); aby nastali oba javy, musí nastať jav A, a potom za predpokladu A aj jav B; analogicky aj p(A˄B) = p(B)·p(A|B). Opačné javy dávajú súčet 100% aj keď k obidvom dáme ten istý predpoklad, napríklad p(n|ch) + p(s|ch) = 1 + 0 = 1, p(n|d) + p(s|d) = 0,5 + 0,5 = 1. Podľa týchto pravidiel odvodíme, že p(ch|n) = p(ch˄n)/p(n) = p(ch)·p(n|ch)/p(n), pričom p(n) = p(ch˄n) + p(d˄n) = p(ch)·p(n|ch) + p(d)·p(n|d). Spolu teda p(ch|n) = p(ch)·p(n|ch) / (p(ch)·p(n|ch) + p(d)·p(n|d)) = 0,4·1 / (0,4·1 + 0,6·0,5) = 0,4 / (0,4 + 0,3) = 0,4 / 0,7 ≈ 0,57, rovnaký výpočet ako v predchádzajúcom odstavci, len formálne zapísaný. Tento vzorec objavil pán Bayes a možno si ľahšie zapamätáte jeho všeobecnú verziu p(Ak|B) = p(Ak˄B) / p(B) = p(Ak˄B) / ∑(p(Ai˄B)) = p(Ak)·p(B|Ak) / ∑( p(Ai)·p(B|Ai)), kde Ai sú navzájom disjunktné javy so súčtom 100%, B je náhodná udalosť, a my chceme vedieť, ako táto udalosť ovplyvňuje pravdepodobnosť konkrétneho javu Ak, pokiaľ poznáme pravdepodobnosť udalosti B pri jednotlivých javoch Ai (čiže ako informácia, že náhodný žiak školy má nohavice, ovplyvňuje pravdepodobnosť, že je to chlapec, pokiaľ poznáme pravdepodobnosti nosenia nohavíc u chlapcov a u dievčat).

Praktické využitie Bayesovho vzorca? Prakticky všade, kde sa hovorí o pravdepodobnostiach, čiže prakticky všade, kde sa hovorí o informáciách a poznaní. Predstavte si nebezpečné ochorenie, ktoré postihuje jedno promile populácie; vedci vyvinú test, ktorého spoľahlivosť je 95% (zdravému človeku na 95% určí, že je zdravý, na 5%, že je chorý; chorému naopak); vy idete na test, ktorý určí, že ste chorý; s akou pravdepodobnosťou ste naozaj chorý? p(ch|t) = p(ch)·p(t|ch) / (p(ch)·p(t|ch) + p(z)·p(t|z)) = 0,001·0,95 / (0,001·0,95 + 0,999·0,05) = 0,000 95 / (0,000 95 + 0,049 98) = 0,000 95 / 0,050 93 ≈ 0,02, čiže napriek hrozivej správe ste s pravdepodobnosťou cca 98% zdravý. (Čo myslíte, s akou pravdepodobnosťou takéto veci správne vypočíta váš lekár?) Alebo pliaga internetu: spam. Označíte pár legitímnych mailov, označíte pár spamov, počítač si na vzorke urobí štatistiku rôznych javov, a keď príde nový mail, vypočíta s akou pravdepodobnosťou je to spam. Ak sa pomýli, manuálne ho opravíte, daný príklad sa pridá do vzorky a aktualizuje sa štatistika. (Aké ďalšie javy by sme mohli podobnou technikou predpovedať?) Pre vedcov: vedeli ste, že oficiálny vzorec na výpočet hladiny spoľahlivosti experimentálneho výsledku je nesprávny? Nezohľadňuje totiž pôvodnú pravdepodobnosť (že na škole je 40% chlapcov a 60% dievčat; že ochorenie postihuje iba 1‰ populácie), čo sa z matematického hľadiska rovná nevyslovenému predpokladu, že pôvodné pravdepodobnosti dokazovanej a nulovej hypotézy sú v pomere 1:1. Dokazovanej hypotéze tým dávame pôvodnú pravdepodobnosť 50%, a experimentálne dáta to už len musia doťuknúť na požadovanú úroveň 95% či 99%. To je ale hrubá chyba! Napríklad v medicíne je pravdepodobnosť, že náhodný liečebný postup vylieči danú chorobu, podstatne menšia ako 50%, čo by malo byť vo výpočte zohľadnené. Inak vzniká situácia, že pri reprodukcii záverov publikovaných v odborných lekárskych časopisoch sa viac ako polovica nepotvrdí; pravdepodobnosť, že sa takýmto výpočtom náhodou potvrdí nesprávna hypotéza, je totiž väčšia ako pravdepodobnosť natrafenia na správnu hypotézu. (Akoby sme výpočet začali úvahou „každá hypotéza je buď pravdivá alebo nepravdivá, takže pravdepodobnosť našej hypotézy je 50%“, a až od tohto bodu pokračovali serióznym výpočtom.)

Ako získavame informácie? Interakciou so svetom. Zo Slnka príde fotón, odrazí sa od jablka, dopadne na sietnicu môjho oka, tá vyšle nervový impulz do zrakového centra. Stav povrchu jablka sa tak prepojil so stavom fotónu, so stavom mojej sietnice, a so stavom môjho mozgu. Sietnica vie toto prepojenie presúvať ďalej. Keby odrazený fotón dopadol na kameň, informácia by sa v ňom rozptýlila. Keby mi sietnica posielala vždy rovnaké signály, bez ohľadu na dopadajúce fotóny, bol by som slepý. Bez interakcie so svetom nemôžeme získať pravdivé informácie (mohli by sme ich uhádnuť, ale pravdepodobnosť je zanedbateľne nízka). Získané informácie môžu zvýšiť pravdepodobnosť mojej hypotézy. Čím nižšia je jej pôvodná pravdepodobnosť, tým viac dôkazov potrebujem, aby som ju zvýšil na rozumnú úroveň. (Pozn: slovo „dôkaz“ je tu prekladom anglického „evidence“, ako dôkaz na súde; nie v zmysle „proof“ ako matematický dôkaz.) Aká je pôvodná pravdepodobnosť hypotézy? Čím je hypotéza zložitejšia, tým nižšia; každý ďalší bit informácie v hypotéze znižuje jej pravdepodobnosť na polovicu. Ak mám dve hypotézy, ktoré obe vysvetľujú rovnakú množinu faktov, čiže majú rovnako veľa dôkazov, pravdepodobnejšia je tá s vyššou pôvodnou pravdepodobnosťou, čiže tá jednoduchšia. (Pravdepodobnostné vysvetlenie „Occamovej britvy“.) Jednoduchosť hypotézy sa meria počtom bitov, nie počtom slov; inak by najjednoduchšia hypotéza znela: „spôsobila to bosorka“. Vysvetlenie, že blesky vrhá rozhnevaný Thor, znie jednoduchšie ako elektromagnetické rovnice, pretože ako ľudia podceňujeme zložitosť antropomorfných vysvetlení. (Predstavte si, že neurofyziológiu rozhnevaného humanoidného božstva musíte do najmenšieho detailu vysvetliť mimozemšťanovi.) Dôležitá je algoritmická zložitosť hypotézy: hypotéza „vo vesmíre je milión hviezd“ nie je tisíckrát zložitejšia ako „vo vesmíre je tisíc hviezd“ (slovo „milión“ nie je milión slov).

Mnohé filozofické problémy sú len hranie so slovíčkami. Ak v lese padne strom a nikto to nepočuje, vzniká pritom zvuk? Fakty sú: vzduch začne vibrovať v dôsledku pádu; nie je tam žiadne ľudské sluchové ústrojenstvo, ktoré by vibrácie spracovalo. Ak sa bavíme o tom, čo budeme v danej situácii vnímať, k nedorozumeniu nedochádza. Jednotlivé atómy síce zmyslami nevnímame, ale vieme na to zostrojiť prístroje, ktorých výstupy už zmyslami vnímame. Na otázky „čo budeme vnímať zmyslami, ak...?“ existujú konkrétne, testovateľné odpovede. Ak váš názor neviete nijako preložiť do reči zmyslových vnemov, buď hovoríte o ničom, alebo tomu nerozumiete. Ľudia však majú názory aj z iných dôvodov. Niekedy je to póza, ktorou vyjadrujeme príslušnosť k nejakej skupine; verbálna uniforma; hoci niektorí ľudia aj takúto pózu myslia smrteľne vážne. Niekedy je to len „viera vo vieru“, ak napríklad verím, že mám v garáži neviditeľného draka, ktorý absolútne žiadnym spôsobom nie je odhaliteľný. (Kto v draka v garáži naozaj verí, ten predpokladá, že drak je nejako merateľný, hoci zatiaľ nevie ako. Kto iba verí, že verí, ten má očakávania totožné s tým, kto v draka vôbec neverí; hoci subjektívne môže byť pevne presvedčený, že v draka verí, lebo ho napríklad vychovali, že všetci dobrí ľudia veria v neviditeľného draka. Niekedy je toto záverečná etapa náboženského presvedčenia.) Názor nemusí predvídať presné dôsledky, ale mal by aspoň u niektorých javov očakávanú pravdepodobnosť zvyšovať, u iných znižovať. Názor, ktorý nič nehovorí, zbytočne zaberá miesto v hlave. Ak sa naše očakávanie v dôsledku nejakej udalosti X zvýši, v dôsledku opačnej udalosti by sa malo znížiť; platí zákon zachovania očakávania: p(A) = p(A˄X) + p(A˄~X) = p(X)·p(A|X) + p(~X)·p(A|~X), preto ak p(A|X) > p(A), potom p(A|~X) < p(A). (Je nerozumné tvrdiť, že ste o niečom presvedčení na 80%, ale ak zajtra bude pršať, vaše presvedčenie sa tým zvýši na 90%, a ak pršať nebude, tiež sa tým zvýši na 90%. Ak rozumný človek už dnes pozná svoje zajtrajšie presvedčenie, je to jeho dnešné presvedčenie.)

Znakom profesionála je presnosť. Automechanik rozozná karburátor od alternátora, africký lovec rozozná leva od pantera, upratovačka rozozná čistidlo na okná od čistidla na podlahu. Mimo práce však ľudia na toto zabúdajú a nechajú na seba robiť dojem všeobecnými rečami; za najhlbšiu múdrosť sa považuje „všetko so všetkým súvisí“, čo je asi tá najmenej použiteľná informácia na svete. Áno, abstraktné myslenie má svoje miesto a je aj príznakom inteligencie, ale dôležité je poznať aj spoločné vlastnosti, aj rozdiely. (Ak niekto pozná iba „súčiastky“ všeobecne, ale žiadnu konkrétne, nepúšťajte ho k motoru svojho auta.) Používaním príliš širokých pojmov sa diskusia iba zahmlieva; šanca na užitočný výsledok sa znižuje. Dá sa tak robiť dobrý dojem na nerozumných ľudí, ale ak vám na niečom naozaj záleží, takýmto diskusiám sa vyhýbajte. Aj presná informácia je však užitočná len vtedy, keď jej rozumieme. Žiaľ, v škole sa žiaci často iba učia naspamäť vety od učiteľov; potom ich nevedia použiť v praxi. Je to ako keby sa učili vysloviť správne heslo, po ktorého vyslovení ich pustia cez skúšku. Ak človeku na niečom naozaj záleží, s takýmto poznaním sa neuspokojí.

Ak boli informácie v tomto článku príliš nahustené, inak to nešlo. Na stránke LessWrong je toho naozaj veľa (toto je iba malá časť) a mojím cieľom bolo ukázať vám, že má zmysel ísť sa tam pozrieť. Dúfam, že myšlienka rozumnosti nájde svojich priaznivcov aj medzi členmi Mensy.

viliam@bur.sk