Čo dokázala vaša analýza?
Dátová analýza v období koronavírusovej krízy nahrádza spoločenské vedy ako ekonómia a politológia, ktoré doteraz držali monopol na interpretáciu súčasnosti i budúcnosti. Je dobré nezabúdať, že pod zdanlivou objektívnosťou matematického modelovania je aj dátová analýza spoločenským procesom, ako každé iné pole expertízy.
Haruspex dnes nosí oblek a namiesto zvieracích vnútorností predpovedá budúcnosť z dátového korpusu. Garanciou jeho či jej charizmy, teda našej viery v to, že skutočne má prístup k forme objektívneho poznania, ktorá je bežným smrteľníkom a smrteľníčkam skrytá, už nie je magický rituál, ale schopnosť kódovať v štatistickom softvéri a, predovšetkým, titul zo zahraničnej univerzity – ideálne nejakej so zvučným názvom. Okázalosť proroctva nahradil farebný graf, na ktorom sa nebezpečne vzdúva zlá červená krivka kolektívneho zlyhania. Ak však zachováme chladnú hlavu a poslúchneme expertov a expertky, naša spoločná trajektória sa priblíži oveľa pozitívnejšej modrej krivke a spoločne vírus porazíme.
Inými slovami, po filozofii a sociológii (ako Radovan Richta), prognostike (Václav Klaus a Miloš Zeman), ekonómii (Ivan Mikloš) a politológii (Grigorij Mesežnikov alebo Eduard Chmelár) sme vďaka aktuálnej kríze objavili nový typ intelektuálnej disciplíny, ktorá vie suverénne objasniť prítomnosť aj budúcnosť – dátovú analýzu. Javí sa to ako prirodzená evolúcia. Od predpotopných neexaktných odborov (ako filozofia) sme sa postupne cez také, ktoré sa ako exaktné tvárili (ekonómia), dostali až k dokonalej forme poznania, ktoré umožňuje budúcnosť odhadnúť na základe kontrolovaných a opakovateľných výpočtov.
Navyše, vďaka tomu, že štatistická kompetencia je dnes pomerne bežnou súčasťou intelektuálnej výbavy absolventiek a absolventov odborov od biológie až po informatiku či marketing, máme dnes širokú ponuku odborníkov, ktorí, neobmedzovaní disciplinárnymi konvenciami, radi ponúknu nespochybniteľný model reality založený na analýze dát – základnej ontologickej jednotke digitálnej spoločnosti. Mentalitu Excelu, za ktorú sme sa smiali Richardovi Sulíkovi, nahradila mentalita R a Matlabu. Dáta sú dáta, ako vyhlásil Aaron Ginn, marketér zo Silicon Valley a autor jednej z dnes už diskreditovaných (no vysoko čítaných) analýz, ktorú zo svojej stránky stiahol portál Medium, skúsený v „šírení virálneho obsahu.“
Celkom jednoducho sa tak potom stane napríklad to, že zmysluplnosť Matovičovho blackoutového projektu zastavenia slovenskej ekonomiky analyzuje s biotechnológom aj vyštudovaný fyzik a dátový vedec, ktorý sa venuje „všetkému okolo neurónových sietí.“ Načo si lámať hlavu s kvalifikáciou, keď dobrý analytik predsa vie modelovať a analyzovať akékoľvek dáta. Naopak, ako vyhlásil tento dátový vedec, nejaký „kvázi odborník” sa venuje „príliš veľkým detailom”.
Všetku moc abstrakcii
Presvedčivosť dátových vedcov má niekoľko dôležitých zdrojov. V prvom rade ide o pozitivisticko-technokratickú predstavu „evidence based“ politiky, ktorá vychádza z hlbokej a najmä vedeckej analýzy situácie. V ideálnom svete vďaka vedeckým postupom takáto politika nerobí žiadne chyby, pretože je vždy perfektne informovaná o stave vecí a na základe odbornej rady vie kompetentne rozhodnúť. V konečnom dôsledku by tak išlo vlastne o nepolitickú politiku, ktorej kvalita je garantovaná nezávislou vedeckou expertízou, ktorá eliminuje hrozbu neracionálneho, ideologického ovplyvňovania politiky. Nie je to nič historicky nové, v rôznych obmenách sa s ideou pokroku, zaručeného technokraciou, stretávame v priebehu celej druhej polovice dvadsiateho storočia. V našom prostredí sa úloha technokracie historicky spájala najmä so socialistickou interpretáciou modernity a expertného plánovania, ktorú nedávno popísal tím českých historikov pod vedením Vítězslava Sommera v knihe Řídit socialismus jako firmu.
Hoci technokracii nemožno uprieť zásluhy za mnoho dobrého, idea odborného riadenia spoločnosti vychádza z idealizovanej predstavy, že experti a expertky (najmä tí v prírodných vedách) sú extraordinárnymi spoločenskými aktérmi, ktorí nemajú žiadne ekonomické, politické a ideologické záväzky okrem záväzkov k vede a objektívnej pravde. Ako však už vieme pomerne dlho, aj tento záväzok má, samozrejme, ideologickú povahu. Vieme aj to, že ani vedci nie sú celkom imúnni voči vlastným sociálnym, kultúrnym a politickým východiskám. No a na dôvažok, aj najlepšie analýzy podliehajú vždy interpretácii a aplikácii politikov a úradníkov, ktorí s nimi narábajú v každodennej praxi. Nie je to inak ani v prípade najnovšej inkarnácie technokratického ideálu.
Predstavu objektívnej a nezávislej odbornosti v prípade dátovej vedy upevňuje aj samotné jej ukotvenie v matematickej analýze. Matematika je totiž ideálny kód, ktorý svojou abstraktnou, symbolickou povahou už vopred vyvracia akúkoľvek pochybnosť o správnosti (a niekedy i spravodlivosti) rozhodnutia. Niekde v jej základoch sa predsa nachádzajú fundamenty, ktoré sú nespochybniteľné – spochybňovať model je niečo ako spochybňovať jedna plus jedna rovná sa dva. A spochybňovať politiky, ktoré sa na ich základe realizujú, je vlastne ako spochybňovať niečo, čo demonštratívne vychádza z prirodzených zákonov fungovania vecí. Slovami Borisa Kollára: matematika nepustí.
Akurát, že GIGO – garbage in, garbage out. Ako sa v posledných týždňoch ukazuje, existujúce modely môžu stále počítať len s obmedzenými a nedostatočnými dátami. Upozornil na to napríklad John Ioannides zo Stanfordu, ktorý poznamenal, že v súčasnosti okrem koronavírusu čelíme i epidémii nespoľahlivých dát. Z nekvalitných dát sa budúcnosť predikuje ťažko, akokoľvek sebavedomo sa pri tom môžeme tváriť.
Vysoká miera abstrakcie však môže i za to, že sa dnes v analýze dát o koronavíruse (a sekundárnej analýze existujúcich modelov) stretávajú viaceré disciplíny, pre ktoré je práca s rôznymi typmi dát bežnou činnosťou. Práve to, že s rôznymi typmi dát, však akosi zostáva v úzadí. V popredí je naopak predstava, že dáta sú dáta a expertízy sú si tak navzájom ekvivalentné – ba priam, že epidemiologická špecializácia je možno až na príťaž. Stretávame sa tak s pomerne paradoxnou krízou expertízy, keď do debaty o šírení vírusu okrem epidemiológov či biológov (alebo napríklad sociálnych psychológov, ktorí sa u nás zatiaľ držia viac-menej mimo diskurzu) vstupujú fyzici, informatici či „Kaggle grandmasteri“, ktorí proti špecifickým disciplinárnym kompetenciám stavajú supra-disciplinárnu schopnosť modelovať a analyzovať dáta. Len ťažko sa tak ubrániť dojmu všemocnosti. Zatiaľ sa však zdá, že výsledky nových dátových epidemiológov z oblasti marketingu a IT sú oproti odborníkom, ktorí určité disciplinárne zázemie rešpektujú, neveľmi spektakulárne.
Dojem neomylnosti dátových analytikov a ich predikcií je do značnej miery aj výsledkom práce novinárov a novinárok. Môžeme sa im však diviť, že podľahli kúzlu dát v čase pandemickej krízy, keď máme veriť expertom radšej ako politikom a keď samotní dátoví analytici prezentovali svoje výsledky nie ako možné scenáre, ale ako predikcie a predikčné modely?
Estetika pandémie
Oproti abstraktnej povahe dát stojí potom veľmi konkrétna estetika vedeckých procesov. Je to možno kontraintuitívne, no práve estetika hrá v sociálnych procesoch vedy veľmi dôležitú rolu. Vedecké vydavateľstvá majú svoje štandardy nielen na to, ako majú byť pripravené ich monografie, ale aj na to, ako majú vyzerať. Štandardy a konvencie sa vzťahujú, samozrejme, aj na to, ako je veda prezentovaná. Triezve schémy, tabuľky a modely sú súčasťou toho, ako vedci a vedkyne prezentujú nielen svoje výsledky, ale aj povahu svojho (triezveho a systematického) myslenia.
Na prvý pohľad sa to môže zdať trocha triviálne, no estetika prezentácie výsledkov vedeckého procesu je dôležitá aj pre publikum, pretože spôsob, akým sú výsledky vizualizované, je kľúčový pri tom, ako ich interpretujeme. Hoci sa grafy na verejnosti obvykle prezentujú ako samozrejmé a prirodzené výsledky analýzy kvantitatívnych dát, aj oni sú výsledkami komplexného procesu selekcie a interpretácie. Účel tohto procesu je prinajmenšom praktický, pretože graf musí byť zrozumiteľný a výstižný – musí ukazovať, čo chce jeho autorka alebo autor povedať, ale zároveň aj vytesniť informácie, ktoré by mohli narušiť jednoznačnosť obsahu. Celkom prirodzene tak graf určuje, čo väčšina z nás vidí a čo nevidí. Práve takto utvára vedecká estetika kategórie, v ktorých ľudia uvažujú a argumentujú.
Dôležitosť prezentácie dát sa ukázala v plnej sile práve v priebehu aktuálnej pandémie, keď mnohí a mnohé trávime čas nad grafmi a tabuľkami, ktoré sa postupne plnia číslami infikovaných a zosnulých. Špeciálny význam získala najmä „krivka“ šírenia koronavírusu, ktorá perfektne vystihuje, ako grafy utvárajú kategórie verejnej politiky a myslenia. Zatiaľ čo ešte pred dvoma mesiacmi mala len menšina ľudí znalosti o tom, ako sa vlastne šíria nejaké vírusy, dnes je heslom zodpovedných vlád a občanov „Flatten the curve!“, teda „Sploštime krivku!“ tak, aby sme sa zo zlej červenej zóny ohrozenia dostali do modrej zóny relatívneho pokoja. Motto pochádza z dnes slávneho textu Thomasa Pueya, ktorého rovnomenný článok bol takpovediac prvým signálom vznikajúceho hnutia novopečených epidemiologických expertov.
Dáta a zmysel
Dátová analýza a modely šírenia pandémie majú nepochybne zmysel. Môžu nám veľa povedať napríklad o tom, aké dôsledky by mohlo mať otvorenie škôl alebo obchodov. Dobrý model napríklad ukáže, že riziko nárastu infikovaných nemusí byť v niektorých prípadoch také dramatické, alebo práve naopak, že aj zdanlivo nevinná akcia môže priniesť problémy. Práve v tom je dátová analýza nesmierne užitočná.
Je však dôležité vedieť, že i dátová analýza má limity a špecifiká. Transdisciplinárnosť – či v tomto prípade až supra-disciplinárnosť – je možno lákavý slogan, ale expertíza je málokedy bezproblémovo prenosná. A takmer nikdy v radoch dní či týždňov. To by mohlo byť i mementom pre novopečených epidemiologických analytikov. Dunning-Krugerov efekt, upozorňujúci na to, že čím menej vieme, tým viac si myslíme, že vieme, je však prefíkaná beštia, ktorá rada poľuje na expertov – vo svete vedcov a vedkýň či expertiek a expertov, kde prestíž záleží na dojme výnimočnosti a neomylnosti (ktorý v nich ich prostredie živí často celý život), nie je sebareflexia práve populárny koncept.
Na záver sa žiada zopakovať, že nezávislá objektívnosť dátovej analýzy môže byť do určitej miery len vonkajším dojmom. Vo viacerých prípadoch bolo cieľom grafov a analýz vyprovokovať adekvátnu reakciu zo strany štátu, zdravotníckeho systému a obyvateľstva. Povedané s nemeckým sociológom Jensom Beckertom, cieľom predikcie bolo niečo viac než predikcia. Predsa sa však tieto predikcie – hoci nie nutne zámerne – stali podkladmi okrem správnych rozhodnutí aj pre také, ktoré sú buď evidentne problematické (karanténa rómskych osád), či ktorých dôsledky a úspešnosť budeme musieť ešte len zhodnotiť v nasledujúcich rokoch.
Autor je sociológ