Kontroverzia ohľadom konjunkcie (alebo, ako za tým oni urobili bodku)

Preklad anglického článku "Conjunction Controversy (Or, How They Nail It Down)". Autor: Eliezer Yudkowsky

Pokračovanie k: Klam konjunkcie

Keď sa zdá, že jeden pokus ukazuje, že sa pokusné osoby previnili nejakým ohavným hriešnym skreslením – napríklad myslením si, že výrok „Bill je účtovník, ktorý rád hrá jazz“ má vyššiu pravdepodobnosť než „Bill je účtovník“ – ľudia majú sklon tieto pokusné údaje zamiesť pod koberec (nie vzdorovať im). Najčastejšie spochybňovaním, či si pokusné osoby nevysvetlili pokyny nejakým nečakaným spôsobom – možno nepochopili, čo myslíte slovami „viac pravdepodobné“.

Nie je zakázané spochybňovať pokusy; na druhej strane, vždy by mala byť možná nejaká hora dôkazov, ktorá postačí na to, aby vás presvedčila. Nie je vylúčené, že výskumníci robia chyby. Takisto nie je vylúčené, že pokusné osoby majú naozaj skutočné skreslenia. To sa stáva. To sa stáva na oboch stranách. Všetci sme len ľudia.

Ak chcete prejaviť zhovievavosť voči pokusným osobám, vykresliť ich v lepšom svetle, mali by ste zvážiť aj prejavenie zhovievavosti voči vedcom. Viete, oni nie sú sprostí. Ak si dokážete predstaviť alternatívne vysvetlenie, oni to dokážu tiež. Je zvlášť dôležité mať to na mysli, keď čítate o nejakom skreslení a jednom či dvoch ilustrujúcich pokusoch v článku na blogu. Áno, keby tých pár pokusov bolo jedinou indíciou, potom by sa naozaj oplatilo zamyslieť. Ale oplatí sa aj zamyslieť, či ste videli všetky indície v prospech štandardného vysvetlenia. Najmä ak dané pokusy majú dátum ako „1982“ a uvádzajú sa s prídavnými menami ako „slávny“ alebo „klasický“.

Teda tak! Toto je dlhý článok. Je dlhý preto, lebo urobiť bodku za nejakou teóriou si vyžaduje viac pokusov než jedna či dve ilustrácie, ktoré stačia na púhe vysvetlenie. Budem tu citovať možno jeden z dvadsiatich pokusov, o ktorých som čítal, čo je možno stotina z toho, čo existuje. Ak chcete viac informácií, pozrite si Tversky a Kahneman (1983) alebo Kahneman a Frederick (2002), oboje dostupné na internete, z čoho tento článok prevažne čerpal.

Tu je (pravdepodobne) najspochybňovanejší pokus v literatúre o heuristikách a skresleniach, ktorý tu zopakujem presne tak, ako je uvedený v Tversky a Kahneman (1982):

Linda má 31 rokov, je slobodná, úprimná, a veľmi bystrá. Ako študentka sa hlboko zaujímala o otázky diskriminácie a sociálnej spravodlivosti, a zúčastňovala sa na protijadrových demonštráciách.

Prosím ohodnoťte nasledujúce výroky podľa ich pravdepodobnosti, označiac číslom 1 najviac pravdepodobný a číslom 8 najmenej pravdepodobný:

(5,2) Linda je učiteľka na základnej škole.

(3,3) Linda pracuje v kníhkupectve a chodí na kurzy jogy.

(2,1) Linda je aktívna vo feministickom hnutí. (F)

(3,1) Linda je sociálna pracovníčka na psychiatrii.

(5,4) Linda je členka Ligy žien voličiek.

(6,2) Linda je banková úradníčka. (U)

(6, 4) Linda je poisťovacia agentka.

(4, 1) Linda je banková úradníčka a je aktívna vo feministickom hnutí. (U + F)

(Čísla na začiatku každého riadku sú priemerné poradie v rebríčku každého z daných výrokov; nižšie číslo znamená vyššiu pravdepodobnosť.)

Odkiaľ viete, že pokusné osoby si nevysvetlili „Linda je banková úradníčka“ v zmysle „Linda je banková úradníčka a nie je aktívna vo feministickom hnutí“? Po prvé, drahí čitatelia, ponúkam vám pozorovanie, že väčšina bankových úradníkov, dokonca aj tých, ktorí sa na vysokej škole zúčastňovali na protijadrových demonštráciách, pravdepodobne nie je aktívna vo feministickom hnutí. Takže ešte aj tak by sa Úradníčka malo umiestniť vyššie než Úradníčka + Feministka. A mali by ste byť skeptickí aj voči svojim vlastným námietkam; inak je to skreslenie nesúhlasu. Ale výskumníci sa nezastavili pri tomto pozorovaní; naopak, Tversky a Kahneman (1983) vytvorili pokus s rozdelením účastníkov na skupiny, kde buď vymazali danú konjunkciu alebo jej dve zložky. Čiže, v tomto skupinovom pokuse, každá z pokusných osôb videla buď (U+F) alebo (U), ale nikdy nie obe. Z celkového počtu piatich výrokov na zoradenie, priemerné poradie (U+F) bolo 3,3 a priemerné poradie (U) bolo 4,4, kde N=86. Takže, tento klam nie je spôsobený púhou interpretáciou „Linda je banková úradníčka“ v zmysle „Linda je banková úradníčka a nie je aktívna vo feministickom hnutí.“

Podobne, včera popisovaný pokus používal rozdelenie na skupiny (kde v každej skupine videli iba jeden výrok) a získal nižšiu pravdepodobnosť pre „Úplne prerušenie diplomatických vzťahov medzi USA a Sovietskym Zväzom, niekedy v roku 1983“ v porovnaní s „Ruská invázia Poľska a úplné prerušenie diplomatických vzťahov medzi USA a Sovietskym Zväzom, niekedy v roku 1983“.

Ďalší spôsob, ako zistiť, či si pokusné osoby nesprávne vysvetlili pokus, je opýtať sa pokusných osôb priamo. Ďalej, v Tversky a Kahneman (1983), celkový počet 103 lekárov internistov (kde bolo 37 internistov, ktorí si robili postdoktorát na Harvarde, a 66 internistov, ktorí boli prednostne prijatí do New England Medical Center) dostalo nasledujúce úlohy:

55-ročná žena má pľúcnu embóliu dokumentovanú angiograficky 10 dní po cholecystektómii. Prosím zoraďte nasledujúce možnosti podľa pravdepodobnosti, že budú medzi stavmi, ktoré pacientka zažíva (použite 1 pre najviac pravdepodobné a 6 pre najmenej pravdepodobné). Prirodzene, pacientka môže zažívať viac než jeden z uvedených stavov.

  • Dýchavičnosť a hemiparéza
  • Bolesť lýtka
  • Pleuritická bolesť na hrudníku
  • Synkopa a tachykardia
  • Hemiparéza
  • Hemoptýza

Ako poznamenávajú Tversky a Kahneman: „Príznaky vymenované v každej úlohe zahŕňali B, ktoré bolo podľa našich konzultujúcich lekárov hodnotené ako nereprezentatívne pre pacientkin stav, a konjunkciu B s ďalším vysoko reprezentatívnym symptómom označeným A. V horeuvedenom príklade pľúcnej embólie (zrazeniny krvi v pľúcach) je dýchavičnosť (lapanie po dychu) typickým príznakom, zatiaľ čo hemiparéza (čiastočná paralýza) je veľmi netypická.“

V nepriamych testoch priemerné poradia A+B a B v danom poradí boli 2,8 a 4,3; v priamych testoch boli 2,7 a 4,6. V priamych testoch pokusné osoby hodnotili A+B nad B v 73% až 100% prípadoch, v priemere 91%.

Experiment bol navrhnutý tak, aby štyrmi spôsobmi vylučoval možnosť, že si pokusné osoby vysvetlia B ako „iba B (nie A)“. Po prvé, opatrne volené slová pokynov „...pravdepodobnosť, že budú medzi stavmi, ktoré pacientka zažíva“, plus výslovná pripomienka, že „pacientka môže zažívať viac než jeden z uvedených stavov“. Po druhé, zahrnutím nepriamych testov na porovnanie. Po tretie, po skončení pokusu výskumníci dali dotazník:

Pri odhade pravdepodobnosti, že opísaná pacientka má nejaký konkrétny príznak X, chápali ste to tak, že (vyberte jedno):

X je jediný stav, ktorý pacientka zažíva?

X je jeden zo stavov, ktoré pacientka zažíva?

60 zo 62 lekárov pri tejto otázke zaškrtlo druhú odpoveď.

Po štvrté, a to už je koniec, ako Tversky a Kahneman píšu: „Ďalšia skupina 24 lekárov, väčšinou zamestnancov Stanfordskej nemocnice, sa zúčastnila na skupinovej diskusii, v ktorej boli konfrontovaní so svojimi klammi konjunkcie v rovnakom dotazníku. Respondenti neobhajovali svoje odpovede, aj keď niektorí odkazovali na „praktickú klinickú skúsenosť“. Väčšina účastníkov vyzerala prekvapená a zhrozená z toho, že urobili elementárnu chybu v uvažovaní.“

Ďalší experiment, tiež popisovaný v Tversky a Kahneman (1983), v ktorom 93 pokusných osôb odhadovalo pravdepodobnosť, že Bjorn Borg, silný hráč tenisu, vo finále vo Wimbledone „vyhrá zápas“, „prehrá prvý set“, „prehrá prvý set, ale vyhrá zápas“ a „vyhrá prvý set, ale prehrá zápas“. Klam konjunkcie sa prejavil: „prehrá prvý set, ale vyhrá zápas“ bolo hodnotené ako pravdepodobnejšie než „prehrá prvý set“. Pokusné osoby dostali aj kontrolnú otázku, či by sa rôzne reťazce výhier a prehier počítali ako príklad pre jednotlivé možnosti, a naozaj, pokusné osoby interpretovali prípady ako konjunkcie, ktoré boli splnené vtedy a práve vtedy, keď boli splnené obe podmienky, a neinterpretovali ich ako implikácie, podmienečné výroky, ani disjunkcie; takisto, zložka B nebola interpretovaná ako vylučujúca zložku A. Genialita tohto pokusu bola v tom, že výskumníci mohli priamo testovať, ako pokusné osoby pochopili význam každého výroku, čím vylúčili veľmi širokú množinu nedorozumení.

Vyskytuje sa klam konjunkcie preto, lebo pokusné osoby zle pochopia, čo sa myslí slovom „pravdepodobnosť“? To sa dá vylúčiť tým, že ponúkneme študentom stávkovať za odmeny. Okrem včera spomínanej farebnej kocky, pokusných osôb sa pýtali, na ktorú z možností v klasickom pokuse s Lindou by boli ochotní staviť 10 dolárov. To zmenšilo výskyt klamu konjunkcie, ale iba na 56% (N=60), čo je stále viac ako polovica študentov.

Ale posledný dôkaz klamu konjunkcie je zároveň ten najelegantnejší. Podľa bežnej interpretácie experimentu s Lindou, pokusné osoby dosadzujú odhad reprezentatívnosti namiesto odhadu pravdepodobnosti: Ich pocit podobnosti medzi každým z výrokov a popisom Lindy určuje, nakoľko pravdepodobný im pripadá každý z týchto výrokov o Linde. Ak je táto ústredná teória pravdivá, potom je fungovanie klamu konjunkcie samozrejmé – Linda viac pripomína feministku než feministickú bankovú úradníčku, ale viac pripomína feministickú bankovú úradníčku než bankovú úradníčku. Nuž, to je naša teória ohľadom toho, čo sa deje v hlavách pokusných osôb, ale ako to môžeme vedieť? Nemôžeme sa pozrieť priamo do ich nervových dráh – zatiaľ nie! Takže ako by ste zostavili pokus, ktorým priamo overíte štandardný model experimentu s Lindou?

Veľmi jednoducho. Vezmete proste ďalšiu skupinu pokusných osôb a opýtate sa ich, nakoľko každý z výrokov „pripomína“ Lindu. To sa urobilo – viď Kahneman a Frederick (2002) – a korelácia medzi reprezentatívnosťou a pravdepodobnosťou bola takmer dokonalá. V skutočnosti 0,99. Tu je (pomerne zbytočný) graf:

korelácia

Toto sa opakovalo v mnohých ďalších experimentoch. Napríklad v hore opísanom lekárskom pokuse bola nezávislá skupina 32 lekárov zo Stanfordskej univerzity požiadaná, aby ohodnotili každý zoznam príznakov podľa „stupňa nakoľko reprezentujú klinické podmienky pacientky“. Korelácia medzi poradím podľa pravdepodobnosti a poradím podľa reprezentatívnosti prevyšovala 95% v každej z piatich testovaných lekárskych úloh.

Dobre, korelácia takmer 1 ešte nedokazuje, že pokusné osoby dosadzujú hodnotenie reprezentatívnosti za hodnotenie pravdepodobnosti. Ale ak chcete tvrdiť, že pokusné osoby robia niečo iné, rád by som počul vysvetlenie, prečo táto korelácia vychádza tak blízko 1. To vysvetlenie si bude vyžadovať veľmi komplikovaný príbeh, nie iba prečo pokusné osoby majú špeciálny spôsob nepochopenia, pri ktorom klam konjunkcie vychádza ako nevinný, ale aj prečo je jeho dôsledkom úplnou náhodou korelácia takmer 1 s pocitom podobnosti u pokusných osôb. Pri viacerých návrhoch pokusov.

A všetci vieme, čo sa stáva s pravdepodobnosťou komplikovaných príbehov. Znižuje sa, keď pridávate podrobnosti.

Viete, ľudia naozaj občas proste robia chyby. A nehovorím teraz o výskumníkoch.

Klam konjunkcie je asi to najspochybňovanejšie skreslenie, aké bolo kedy nájdené, čo znamená, že je v zozname medzi najčastejšie replikovanými. Za konvenčnou interpretáciou môžeme takmer absolútne napísať bodku. Vo vede spochybňovanie privoláva odpovede.

Zdôrazňujem to, lebo sa zdá, že keď hovorím o skresleniach (najmä obecenstvu, ktoré s touto oblasťou nie je oboznámené), veľa ľudí chce byť zhovievavých k pokusným osobám. Ale nielen pokusné osoby si zaslúžia zhovievavosť. Vedci tiež môžu byť nie hlúpi. Niekto iný už pomyslel na vaše alternatívne vysvetlenie. Niekto iný už zostavil experiment na jeho otestovanie. Možno viac než jeden. Možno viac než dvadsať.

Prázdna mapa nie je prázdne územie; ak neviete, či to niekto testoval, to neznamená, že to nikto netestoval. Toto nie je tlupa lovcov a zberačov skladajúca sa z dvesto ľudí, kde ak niečo neviete, pravdepodobne to v celej tlupe nikto nevie. Na svete je šesť miliárd ľudí, a nikto nemôže naisto povedať, že vedia niečo nevie; na to je tu príliš veľa vedy. Neprítomnosť takejto indície je iba extrémne slabá indícia neprítomnosti. Nemýľte si teda vašu nevedomosť ohľadom toho, sa testovalo alternatívne vysvetlenie, s pozitívnou istotou, že ho nikto netestoval. Buďte zhovievaví aj voči vedcom. Nehovorte: „Stavím sa, že v skutočnosti sa stalo X“, ale pýtajte sa: „Ktoré pokusy rozlišovali medzi štandardnou interpretáciou a X?“

Ak sa vám zdá, že vám túto pointu vtĺkam do hlavy kladivom, nuž, asi áno. Je to občas trochu frustrujúce – vedieť o tejto obrovitánskej hore indícií z tisícov pokusov, o ktorej iní ľudia ani netušia, že existuje. Napokon, ak existujú iné pokusy podporujúce tento výsledok, ako to, že o nich oni nepočuli? Sme predsa malá tlupa; iste by ste počuli. Z rovnakého dôvodu zase ja vynakladám vedomé úsilie pamätať si, že druhí ľudia nevedia o týchto indíciách, a že ich neignorujú úmyselne, aby ma naštvali. A preto je to občas trochu frustrujúce! My jednoducho nie sme stavaní na svet, v ktorom je 6 miliárd ľudí.

Čím samozrejme nehovorím, že sa ľudia majú prestať pýtať. Ak sa prestanete pýtať, nikdy sa nedozviete o tých horách experimentálnych indícií. Viera nie je porozumenie, iba dôvera v heslo. Je zbytočné niečomu veriť, hocijako zapálene, pokiaľ v skutočnosti neviete, čomu presne akože veríte. Takže nehovorím, že toto všetko máte brať ako vec viery. Nehovorím, že máte držať hubu. Nechcem, aby ste sa cítili previnilo za to, že sa pýtate.

Hovorím akurát, že keď krátky popis akceptovanej vedy vyvolá vo vašej mysli ďalšie otázky, mali by ste mať podozrenie, že existujú aj iné indície. Nie veriť v tieto nevidené indície, iba mať podozrenie, že existujú. O to viac, ak je to klasický pokus so štandardnou interpretáciou. Opýtajte sa trochu jemnejšie. Vkladajte menej dôvery do vašej skvelej novej alternatívnej hypotézy. Venujte trochu zhovievavosti aj tým výskumníkom.

Kahneman, D. and Frederick, S. 2002. Representativeness revisited: Attribute substitution in intuitive judgment. Pp 49-81 in Gilovich, T., Griffin, D. and Kahneman, D., eds. Heuristics and Biases: The Psychology of Intuitive Judgment. Cambridge University Press, Cambridge.

Tversky, A. and Kahneman, D. 1982. Judgments of and by representativeness. Pp 84-98 in Kahneman, D., Slovic, P., and Tversky, A., eds. Judgment under uncertainty: Heuristics and biases. New York: Cambridge University Press.

Tversky, A. and Kahneman, D. 1983. Extensional versus intuitive reasoning: The conjunction fallacy in probability judgment. Psychological Review, 90: 293-315.

viliam@bur.sk