Koľko indície treba?

Preklad anglického článku "How Much Evidence Does It Take?". Autor: Eliezer Yudkowsky

Pokračovanie k: Čo je indícia?

Nedávno som definoval indíciu ako „udalosť previazanú väzbou príčiny a následku s tým, čo chcete vedieť“, a previazanosť ako „musí sa stať rôzne, spôsobom prepojeným s rôznymi možnými stavmi cieľa“. Takže, koľko previazanosti – koľko indície – treba, aby podporila nejaký názor?

Začnime otázkou dosť jednoduchou na to, aby bola matematická: ako silne by ste sa potrebovali previazať s lotériou, aby ste ju vyhrali? Predpokladajme, že sa žrebuje zo sedemdesiatich loptičiek bez opakovania, a na výhru potrebujete uhádnuť šesť čísel. Potom máme 131 115 985 možných výherných kombinácií, čiže náhodne vybraný žreb má šancu vyhrať 1 / 131 115 985 (0,000 000 7%). Aby ste vyhrali lotériu, potrebujete indíciu dosť vyberavú na to, aby jasne uprednostnila jednu kombináciu pred jej 131 115 984 alternatívami.

Predpokladajme, že existujú nejaké testy, pomocou ktorých môžete rozlíšiť, pravdepodobnostne, medzi vyhrávajúcimi a prehrávajúcimi číslami v lotérii. Napríklad zadáte kombináciu do malej čiernej krabičky, ktorá vždy zapípa, ak je to vyhrávajúca kombinácia, ale má iba šancu 1/4 (25%) zapípať, ak je kombinácia nesprávna. Bayesiánskymi slovami, pomer šancí je 4 k 1. To znamená, že krabička má 4-krát väčšiu šancu zapípať, ak zadáme správnu kombináciu, v porovnaní so šancou zapípať, ak zadáme nesprávnu kombináciu.

To je stále celá kopa možných kombinácií. Ak napíšete 20 neprávnych kombinácií, krabička zapípa pri 5 z nich čistou náhodou (v priemere). Ak zadáte všetkých 131 115 985 možných kombinácií, krabičke síce naisto zapípa pri vyhrávajúcej kombinácii, ale zapípa aj pri 32 778 996 prehrávajúcich kombináciách (v priemere).

Takže táto krabička vám neumožní vyhrať lotériu, ale je lepšia než nič. Ak použijete túto krabičku, vaše šance vyhrať stúpnu z 1 z 31 115 985 na 1 z 32 778 997. Trochu ste pokročili smerom k nájdeniu vášho cieľa, pravdy, v širokom priestore možností.

Predpokladajme, že použijete inú čiernu krabičku, aby ste otestovali kombinácie dvakrát, nezávisle. Obe krabičky naisto zapípajú pre vyhrávajúci žreb. Ale šanca, že krabička zapípa pre prehrávajúcu kombináciu, je 1/4 nezávisle pre každú krabičku; teda šanca, že obe krabičky zapípajú pre prehrávajúcu kombináciu je 1/16. Môžeme povedať, že kumulatívna indícia dvoch nezávislých testov má pomer šancí 16:1. Počet prehrávajúcich žrebov lotérie, ktoré prejdú cez oba testy je (v priemere) 8 194 749.

Keďže je 131 115 985 možných žrebov v lotérii, asi ste uhádli, že potrebujete indíciu, ktorej sila je okolo 131 115 985 k 1 – udalosť, alebo sériu udalostí, ktorá má 131 115 985-krát väčšiu šancu stať sa pri vyhrávajúcej kombinácii než pri prehrávajúcej. Vlastne aj toto množstvo indície by stačilo iba na to, aby vám dalo šancu pol na pol vyhrať lotériu. Prečo? Lebo ak použijete filter takejto sily na 131 miliónov prehrávajúcich lístkov, jeden prehrávajúci lístok, v priemere, prejde týmto filtrom. Vyhrávajúci lístok tiež prejde filtrom. Zostanú vám teda dva lístky, ktoré prešli filtrom, iba jeden z nich je vyhrávajúci. Ak si môžete kúpiť iba jeden lístok, máte šancu vyhrať 50%.

Lepší spôsob, ako si problém znázorniť: Na začiatku je 1 vyhrávajúci lístok a 131 115 984 prehrávajúcich lístkov, takže vaša šanca vyhrať je 1 : 131 115 984. Ak použijete jednu krabičku, šanca zapípania je 1 pre vyhrávajúci lístok a 0,25 pre prehrávajúci lístok. Takže vynásobíme 1 : 131 115 984 s 1 : 0,25 a dostaneme 1 : 32 778 996. Pridanie ďalšej krabičky indície opäť vynásobí šance 1 : 0,25, takže šance sú teraz 1 vyhrávajúci lístok na 8 194 749 prehrávajúcich lístkov.

Je pohodlné merať indíciu v bitoch – nie ako bity na pevnom disku, ale matematické bity, ktoré sú koncepčne iné. Matematické bity sú logaritmy pravdepodobností, pri základe 1/2. Napríklad ak sú štyri možné výsledky A, B, C a D, ktorých pravdepodobnosti sú 50%, 25%, 12,5% a 12,5%, a ja vám poviem, že výsledok bol „D“, dal som vám tri bity informácie, pretože som vás informoval o výsledku, ktorého pravdepodobnosť bola 1/8.

Zhodou okolností je 131 115 984 o čosi viac než 2 na 27. Takže 14 krabičiek, alebo 28 bitov indície – udalosť, ktorá má 268 435 456 : 1 -krát väčšiu šancu stať sa, ak je hypotéza lístka pravdivá než ak je nepravdivá – by posunula šance z 1 : 131 115 984 na 268 435 456 : 131 115 984, čo sa vykráti na 2 : 1. Šanca 2 ku 1 znamená dve šance na výhru pre každú šancu na prehru, čiže pravdepodobnosť výhry s 28 bitmi indície je 2/3. Pridanie ďalšej krabičky, ďalších 2 bitov indície, by posunulo šance na 8:1. Pridanie ešte ďalších dvoch krabičiek by posunulo šance na výhru na 128 : 1.

Ak teda chcete licenciu na silné presvedčenie, že vyhráte lotériu – ktoré tu svojvoľne definujeme ako pravdepodobnosť omylu menšiu než 1% – 34 bitov indície ohľadom vyhrávajúcej kombinácie by malo stačiť.

Vo všeobecnosti, pravidlo na zvažovanie „koľko indície treba“ sa riadi podobným vzorom: Čím väčší je priestor možností, v ktorom leží daná hypotéza, alebo čím menej pravdepodobná táto hypotéza vyzerá a priori v porovnaní s jej susedmi, alebo čím viac si chcete byť istí, tým viac indície potrebujete.

Nemôžete vzdorovať týmto pravidlám; nemôžete si vytvoriť presné názory na základe nedostatočnej indície. Povedzme, že máte 10 krabičiek v rade a začnete zadávať kombinácie do krabičiek. Nemôžete a zastaviť pri prvej kombinácii, ktorá dostane zapípanie od všetkých 10 krabičiek a povedať: „Ale veď šanca, že by sa toto stalo pre prehrávajúcu kombináciu je milión ku jednej! Môžem ignorovať tieto teoretické bayesiánske pravidlá a skončiť tu.“ V priemere, na jeden vyhrávajúci lístok prejde takýmto testom aj 131 prehrávajúcich. Ak vezmeme do úvahy priestor pravdepodobností a prvotnú nepravdepodobnosť, skočili ste k príliš silnému záveru na základe nedostatočnej indície. To nie je samoúčelná byrokratická regulácia, to je matematika.

Samozrejme, aj tak môžete veriť na základe nedostatočnej indície, ak je to váš rozmar; ale nebudete môcť veriť presne. Je to ako keby ste sa pokúšali šoférovať auto bez paliva, pretože neveríte na nejaké hala-bala predstavy, že na jazdenie treba palivo. Nebolo by omnoho zábavnejšie a lacnejšie, keby sme sa rozhodli zrušiť pravidlo, že autá potrebujú palivo? Nebolo by to očividne lepšie pre každého? Nuž, môžete skúsiť, ak je to váš rozmar. Môžete dokonca aj zavrieť oči a predstierať, že auto sa hýbe. Ale aby ste naozaj docestovali k presným názorom, na to potrebujete palivo indícií, a čím ďalej chcete ísť, tým viac paliva potrebujete.

viliam@bur.sk