Preklady stránky LessWrong.com

Originál: "What Evidence Filtered Evidence?"

Autor: Eliezer Yudkowsky

Filtrovaná indícia

Včera som rozoberal dilemu chytrého rečníka, najatého, aby vám predal krabicu, ktorá možno obsahuje diamant a možno nie. Chytrý rečník vám zdôrazní, že na krabici je modrá pečiatka, a že je známy fakt, že krabice obsahujúce diamant majú väčšiu šancu mať modrú pečiatku než prázdne krabice. Čo sa v tomto bode deje z bayesiánskeho pohľadu? Musíte bezmocne aktualizovať svoje pravdepodobnosti tak, ako si to chytrý rečník želá?

Ak sa môžete pozrieť na danú krabicu osobne, môžete si všetky príznaky zrátať sami. Čo ak sa nemôžete pozrieť? Čo ak jediná indícia, ktorú máte, je slovo chytrého rečníka, ktorý je zákonom obmedzený na hovorenie iba pravdivých výrokov, ale nehovorí vám všetko, čo vie? Každý výrok, ktorý povie, je platná indícia – ako by ste mohli neaktualizovať svoje pravdepodobnosti? Prestalo azda byť pravdou, že v takom a takom percente Everettových vetiev alebo Tegmarkových duplikátov, v ktorých krabica B má modrú pečiatku, krabica B obsahuje diamant? Podľa Jaynesa, bayesiánec musí vždy zohľadniť všetky známe indície, pod hrozbou paradoxu. Lenže potom vás chytrý rečník dokáže presvedčiť o hocičom, čo bude chcieť, pokiaľ je dostatočná paleta príznakov, o ktorých vás môže selektívne informovať. To neznie správne.

Vezmite si jednoduchý prípad, nevyváženú mincu, na ktorej buď padá 2/3 hlava a 1/3 znak, alebo 1/3 hlava a 2/3 znak; obe tieto možnosti sú a priori rovnako pravdepodobné. Každé pozorované H je 1 bit indície pre H-nevyváženú mincu; každé pozorované T je jeden bit indície pre T-nevyváženú mincu. Hodím mincou desaťkrát a potom vám poviem: „Pri 4. hode, 6. hode, a 9. hode padla hlava.“ Aká je vaša výsledná pravdepodobnosť, že minca je H-nevyvážená.

A odpoveď je, že to môže byť takmer čokoľvek, podľa toho, aká reťaz príčin a následkov leží za mojím vyslovením týchto slov – mojím výberom, ktoré hody vám oznámiť.

  • Možno sa riadim algoritmom, že poviem výsledok 4., 6. a 9. hodu bez ohľadu na výsledky, ktoré padli v týchto alebo ostatných hodoch. Ak viete, že som použil tento algoritmus, výsledné šance sú 8:1 v prospech H-nevyváženej mince.
  • Možno oznamujem všetky hody, na ktorých padla hlava, a nič iné. V tom prípade viete, že vo všetkých zvyšných 7 hodoch padol znak, a výsledné šance sú 1:16 proti H-nevyváženej minci.
  • Možno som sa dopredu rozhodol, že vám poviem výsledok 4., 6. a 9. hodu iba vtedy, ak pravdepodobnosť, že minca je H-nevyvážená prekročí 98%. A tak ďalej.

Alebo si vezmite problém Montyho Halla:

V hernej show dostanete na výber tri dvere vedúce do troch miestností. Viete, že v jednej miestnosti je 100 000 dolárov, a zvyšné dve sú prázdne. Moderátor vás požiada, aby ste si vybrali dvere, a vy si vyberiete dvere číslo 1. Potom moderátor otvorí dvere číslo 2 a ukáže prázdnu izbu. Chcete zameniť svoje rozhodnutie za číslo 3 alebo zostávate s dverami číslo 1?

Odpoveď závisí od moderátorovho algoritmu. Ak moderátor vždy otvorí niektoré dvere a vždy si vyberie dvere vedúce do prázdnej miestnosti, potom by ste mali zameniť rozhodnutie za dvere číslo 3. Ak moderátor vždy otvára dvere číslo 2 bez ohľadu na to, čo je za nimi, dvere 1 aj 3 majú obe pravdepodobnosť 50%, že obsahujú peniaze. Ak moderátor otvára nejaké dvere iba v tých prípadoch, keď ste si na prvýkrát vybrali dvere s peniazmi, potom by ste mali jednoznačne zostať s číslom 1.

Nemali by ste zohľadniť iba to, že dvere číslo 2 sú prázdne, ale tento fakt plus fakt, že sa moderátor rozhodol otvoriť dvere číslo 2. Mnohí ľudia sú zo štandardného problému Montyho Halla zmätení, pretože aktualizujú len o informáciu, že číslo 2 je prázdne, a v tom prípade majú čísla 1 a 3 rovnakú pravdepodobnosť obsahovať peniaze. To je dôvod, prečo majú bayesiánci prikázané zohľadňovať všetky svoje vedomosti, pod hrozbou paradoxu.

Keď niekto povie: „Pri 4. hode mincou padla hlava,“ nezohľadňujeme iba to, že pri 4. hode mincou padla hlava – neberieme si podmnožinu všetkých možných svetov, kde v 4. hode padla hlava – ale zohľadňujeme podmnožinu všetkých možných svetov, kde rečník riadiaci sa nejakým konkrétnym algoritmom povedal: „Pri 4. hode mincou padla hlava.“ Vyslovená veta nie je sama osebe faktom; nenechajte sa zviesť z cesty púhym významom slov.

Väčšina súdnych procesov funguje podľa teórie, že každý prípad má práve dve odporujúce si strany, a že je jednoduchšie nájsť dvoch zaujatých ľudí než jedného nezaujatého. Či už žalobca alebo obhajca, niekto z nich má motív predložiť každý kúsok indície, takže súd uvidí všetky indície; to je teória. Ak sú v dileme s dvoma krabicami dvaja chytrí rečníci, nie je to až také dobré ako jeden zvedavý výskumník, ale je to skoro také dobré. Ale to platí keď sú dve krabice. Skutočnosť často obsahuje mnohostranné problémy, a hlboké problémy, a nesamozrejmé odpovede, ktoré sa nenájdu ľahko tým, že Modrí a Zelení kričia jeden na druhého.

Dajte si pozor, aby ste nezneužívali pojem filtrovania indície ako Úplne Všeobecný Protiargument na vylúčenie všetkých indícií, ktoré sa vám nepáčia: „Tento argument bol filtrovaný, preto ho môžem ignorovať.“ Ak vás podráždil argument opačnej strany, potom ste už zoznámení s prípadom, a dosť zaujatí na to, aby ste si vybrali jednu stranu. Pravdepodobne už poznáte najsilnejšie argumenty vašej strany. Nemáte žiaden dôvod dedukovať na základe argumentu proti, že existujú nové príznaky a znamenia vo váš prospech, ktoré ste ešte nevideli. Zostávajú vám teda samotné nepohodlné fakty; modrá pečiatka na krabici B je stále indíciou.

Ale ak počujete daný argument po prvýkrát, a ak počujete iba jednu stranu argumentu, potom by ste si veru mali dať pozor! V istom zmysle, nikto nemôže naozaj veriť teórii prirodzeného výberu, dokiaľ nepočúval kreacionistov aspoň päť minút; až potom vie, že je to nabetón.

viliam@bur.sk