Falošná kauzalita

Preklad anglického článku "Fake Causality". Autor: Eliezer Yudkowsky

Pokračovanie k: Falošné vysvetlenia, Hádanie učiteľovho hesla

Flogiston bol odpoveďou 18. storočia na elementárny oheň gréckych alchymistov. Zapáľte drevo a nechajte ho horieť. Čo je to ten oranžovo svetlý „oheň“? Prečo sa drevo premieňa na popol? Chemici 18. storočia na obe otázky odpovedali: „flogiston“.

...a to je všetko. To bola ich odpoveď: „flogiston“.

Flogiston uniká z horiacej hmoty ako viditeľný oheň. Ako flogiston uniká, horiaca hmota stráca flogiston a stáva sa z nej popol, „pravá hmota“. Oheň v uzavretej nádobe zhasne, pretože vzduch sa nasýti flogistonom a už ho viac neprijme. Uhlie zanecháva po spálení málo zvyškov, pretože je to takmer čistý flogiston.

Teória flogistonu sa samozrejme nedala použiť na predpovedanie výsledku chemickej reakcie. Najprv ste sa pozreli na výsledok, potom ste použili teóriu flogistonu na jeho vysvetlenie. Nebolo to tak, že by teoretickí flogistonisti predpovedali, že oheň v uzavretej nádobe zhasne; namiesto toho zapálili oheň v nádobe, videli ako zhasol, a potom povedali: „Vzduch musel byť nasýtený flogistonom.“ Nemohli ste použiť teóriu flogistonu na povedanie, čo by ste nemali uvidieť; dokázala vysvetliť čokoľvek.

To bolo v raných časoch vedy. Dlho si nikto neuvedomil, že je to problém. Falošné vysvetlenia neznejú falošne. To je to, čo ich robí nebezpečnými.

Moderný výskum naznačuje, že ľudia rozmýšľajú o príčinách a následkoch používaním niečoho ako orientované acyklické grafy (DAGy) bayesovských sietí. Pretože pršalo, chodník je mokrý; pretože chodník je mokrý, šmýka sa.

[Dážď] -> [Chodník je mokrý] -> [Chodník sa šmýka]

Z tohto dokážeme odvodiť – alebo v bayesovskej sieti presne spočítať pravdepodobnosť – že ak sa chodník šmýka, pravdepodobne pršalo; ale ak už vieme, že chodník je mokrý, nová informácia, že chodník sa šmýka, nám nepovie nič nové ohľadom toho, či pršalo.

Prečo je oheň horúci a jasný keď horí?

[„Flogiston“] -> [Oheň je horúci a jasný]

Znie to ako vysvetlenie. Je to zapísané v rovnakom formáte kognitívnych údajov. Ľudská myseľ však nedokáže automaticky rozoznať, kedy má príčina neobmedzujúcu šípku na následok. Čo je horšie, vďaka skresleniu spätného pohľadu sa nám zdá, že príčina obmedzovala následok, aj keď bola iba upravená, aby ladila s následkom.

Čo je zaujímavé, naše moderné chápanie pravdepodobnostného uvažovania o kauzalite dokáže presne opísať, čo robili teoretickí flogistonisti nesprávne. Jednou z hlavných inšpirácií pre bayesovské siete bolo uvedomenie si problému dvojitého započítania indícií ak odvodzovanie rezonuje medzi následkom a príčinou. Povedzme napríklad, že som dostal kúsok nespoľahlivej informácie, že chodník je mokrý. To by malo spôsobiť, že si pomyslím, že je o čosi pravdepodobnejšie, že pršalo. Ale ak je pravdepodobnejšie, že pršalo, nie je potom pravdepodobnejšie, že chodník je mokrý? A neznamenalo by to, že je pravdepodobnejšie, že chodník sa šmýka? Ale ak sa chodník šmýka, asi je mokrý; a potom by som mal opäť zvýšiť pravdepodobnosť, že pršalo...

Judea Pearl použil ako metaforu algoritmus, ako sa počítajú vojací v rade. Predstavte si, že stojíte v rade, a vidíte dvoch vedľajších vojakov, jedného pred vami a jedného za vami. To ste dokopy traja vojaci. Opýtate sa vojaka vedľa vás: „Koľkých vojakov vidíš ty?“ Obzrie sa a povie: „Troch.“ Tak to máme dokopy šesť vojakov. Očividne toto nie je správny spôsob, ako to robiť.

Rozumnejšie je opýtať sa vojaka pred vamí: „Koľko vojakov je pred tebou?“ a vojaka za vami: „Koľko vojakov je za tebou?“ Otázka: „Koľko vojakov je pred tebou?“ sa dá ďalej odovzdať bezo zmätku. Ak som na začiatku radu, poviem výsledok: „1 vojak vpredu“. Osoba stojaca hneď za mnou dostane správu: „1 vojak vpredu“ a odovzdá výsledok: „2 vojaci vpredu“ vojakovi za ním. Podobne, každý vojak, ktorý dostane správu: „N vojakov vzadu“ od vojaka tesne za ním, ju odovzdá ako: „N+1 vojakov vzadu“ vojakovi pred ním. Koľko je dokopy vojakov? Spočítajte dve čísla, ktoré dostanete, pridajte jednotku za seba: toľko je spolu v rade vojakov.

Pointa je, že každý vojak musí osobitne sledovať dve správy: správu o vojakoch vpredu a správu o vojakoch vzadu, a sčíta ich až na záver. Nikdy nepridávate vojakov z prijatej správy o vojakoch vzadu do správy o vojakoch vpredu, ktorú odovzdáte dozadu. A vôbec, celkové množstvo vojakov sa nikdy neodovzdáva ako správa – nikto ho nikdy nepovie nahlas.

Analogický princíp funguje pri dôkladnom pravdepodobnostnom uvažovaní o kauzalite. Ak sa niečo dozviete o tom, či pršalo, z nejakého iného zdroja než pozorovania, že chodník je mokrý, toto pošle správu dopredu z [dážď] do [chodník je mokrý] a zvýši naše očakávanie, že chodník je mokrý. Ak pozorujete, že chodník je mokrý, toto pošle správu dozadu nášmu názoru, že pršalo, a táto správa pokračuje z [dážď] do všetkých susedných uzlov okrem uzla [chodník je mokrý]. Každý kus indície započítame presne raz; žiadna správa sa „neodráža“ dopredu a dozadu. Presne tento algoritmus nájdete v klasickej knihe Judeu Pearla: „Pravdepodobnostné uvažovanie v inteligentných systémoch: Siete s dôveryhodným odvodzovaním.

Čo bolo teda zlé na teórii flogistonu? Keď pozorujeme, že oheň je horúci, uzol [oheň] môže poslať správu dozadu do uzla [„flogiston“], čím aktualizujeme svoj názor o flogistone. Ale ak sa stalo toto, nemôžeme to považovať za úspešnú predpoveď teórie flogistonu smerom dopredu. Správa by mala ísť iba jedným smerom a neodrážať sa naspäť.

Žiaľ, ľudia nepoužívajú presné algoritmy na aktualizáciu sietí názorov. Učíme sa o rodičovských uzloch z pozorovania potomkovských uzlov, a predpovedáme potomkovské uzly podľa názoroch o rodičovských. Pritom však prísne neoddeľujeme záznamy o správach dozadu a správach dopredu. Pamätáme si len, že flogiston je horúci, čo spôsobuje, že oheň je horúci. Takže sa zdá, že teória flogistonu predpovedá horúcosť ohňa. Ešte horšie, vyzerá to, že flogiston spôsobuje, že oheň je horúci.

Dokiaľ si nevšimnete, že sa tu nerobia žiadne predpovede dopredu, nebudete tento neobmedzujúci kauzálny uzol považovať za „falošný“. Je zakreslený úplne rovnakým spôsobom ako hocijaký iný uzol vo vašej sieti názorov. Vyzerá ako fakt, ako všetky ostatné fakty, ktoré poznáte. Flogiston spôsobuje, že oheň je horúci.

Správne navrhnutá UI by si tento problém všimla hneď. Nevyžadovalo by to ani špeciálny kód na tento účel, iba správne záznamy o sieti názorov. (Žiaľ, my ľudia nedokážeme prepísať svoj vlastný kód tak, ako by to dokázala správne navrhnutá UI.)

Hovoriť o „skreslení spätného pohľadu“ je iba netechnický spôsob, ako povedať, že ľudia presne nerozdeľujú správy dopredu a správy dozadu, čím umožnia, aby správy dopredu boli kontaminované správami dozadu.

Tí, čo kedysi dávno šli cestou flogistonu, sa nesnažili byť hlúpi. Žiaden vedec sa úmyselne nepokúša zaseknúť v slepej uličke. Sú aj vo vašej hlave nejaké falošné vysvetlenia? Ak sú, ručím vám za to, že nie sú označené ako „falošné vysvetlenia“, takže hľadanie kľúčového slova „falošný“ vo vašich myšlienkach ich nevráti.

Vďaka skresleniu spätného pohľadu takisto nestačí skontrolovať, ako dobre vaša teória „predpovedá“ fakty, ktoré už poznáte. Musíte predpovedať zajtrajšok, nie včerajšok. Je to jediný spôsob, ako zamotaná ľudská myseľ môže mať istotu, že posiela čistú správu dopredu.

viliam@bur.sk