„Korelace? Kauzalita? Co na tom záleží, když planeta umírá.“ Přibližně taková věta před časem zazněla ve Studiu Svobodného přístavu; a určitě nejen tam. Zaměňování korelace za kauzalitu je pain in the ass (nejen mé, ale i dnešní doby).
.
Zrovna jsem slyšel mluvit Jindřicha Vobořila, jak je důležité bránit mladým kouřit cigarety, protože kdo kouří cigarety před dosažením nějakých 15 let věku, má asi 8x vyšší šanci, že v dospělosti bude závislý na nějakých „tvrdých drogách“ (konkrétní data v této větě berte s rezervou, možná jsem si je nezapamatoval úplně správně, což je však pro tento komentář irelevantní).
.
Vůbec se s nikým nepřu o tom, že kouření škodí zdraví (a umím si i představit, že u dětí ještě víc); takže souhlasím, že by bylo fajn, kdyby děti nekouřily (a vlastně ani dospělí). Mám však problém s tím zdůvodněním.
.
Řekněme, že platí, že kdo byl před dosažením 15 let věku kuřákem, má 8x větší šanci, že bude v pozdějším věku závislý na něčem horším (nevím, zda to platí přesně takto, možná tam byl třeba jiný věk nebo tak něco, ale klidně vycházejme z tohoto).
.
Selským rozumem by jeden řekl, že z toho plyne, že když zabráníme těm dětem kouřit v dětství, zachráníme je od dalších závislostí v dospělosti. Správně? Špatně! Může to být pravda, ale v žádném případě to neplyne z těch dat!
.
Proč? Zkusím napovědět. Vsadil bych se, že kdybychom sesbírali potřebná data, zjistíme také, že kdo si kupuje vždy ojetá auta a nejezdí na dovolenou do zahraničí, bude závislý s vyšší pravděpodobností než ten, kdo si kupuje auta vždy nová a každoročně vycestuje. A myslíte, že když lidem zakážeme kupovat ojetiny a donutíme je cestovat, budou méně fetovat?
.
To těžko. Jedná se sice o korelaci, ale z té ještě neplyne kauzální vazba (a i když tam je, může být klidně opačná, než předpokládáme). Když z dat vyčteme, že spolu dva jevy nějakým způsobem souvisejí, ještě to neznamená, že se způsobují (a pokud ano, nevíme, který z nich způsobuje který).
.
Když se vrátíme k našemu příkladu s kouřením cigaret: Jedno vysvětlení sice spočívá v tom, že kdo začne už jako dítě kouřit, něco si tím pojebe v mozku, v důsledku čehož pak bude spíš padat do dalších závislostí; ale máme tu i jiná plausibilní vysvětlení – například: Kdo žije v prostředí, kde už v deseti kouřil, dost možná se v tom stejném prostředí dostane za pár let k piku spíše než dítko z „lepší rodiny“. A těch vysvětlení může existovat ještě daleko víc (například genetická predispozice k závislostem obecně).
.
Vyhlášením svaté války domnělé příčině pak můžeme vyplývat spoustu zdrojů na potlačení jevu, který vůbec nezpůsoboval to, co jsme si jeho potlačením přáli napravit.
.
Podobně to bude s těmi auty a dovolenkami: Feťáci budou jezdit spíše v ojetinách a nebudou cestovat, protože na nová auta a dovolené nebudou mít peníze s větší pravděpodobností než zbytek populace (pochopitelně budou výjimky, ale bavíme se o statistice).
.
Proč na tom záleží? Záleží na tom proto, že když pak chceme měnit svět kolem sebe (třeba hýbat s počty závislých), je nutné rozumět příčinným souvislostem, které se v něm odehrávají. A ty nám prostě statistická data sama o sobě neodhalí.
.
Ta data samozřejmě nejsou bezcenná; ukazují nám, na co se můžeme zaměřovat a v čem má smysl hledat další souvislosti. Kauzalita totiž korelaci implikuje; jenže předpokládat opak může být nebezpečné či neefektivní.
Be the first to comment