Zde to máte černé na černém |

Sdílet článek:

MARIAN KECHLIBAR

Milí čtenáři, nezmizel jsem, ba se mi ani nic nestalo. Hlavní důvod, proč ode mne nic neslyšíte, je ten, že jsem se věnoval dokončování Zapomenutých příběhů 7. Teď už mám všechny texty pohromadě a poslal jsem je prvním korektorům k odchytání chyb. Do předprodeje by kniha mohla jít v březnu a vyjít, no, nejpozději v září. (Také znovu dorazily USB disky s audioknihami, jejichž zásoba před Vánocemi došla. Teď jsou ve standardu USB 3.0.)

Mezitím se ve vnějším světě stalo mnohé, takže témata k blogování jen padají z nebe. Dnes mám pro vás něco, co zajímavým způsobem spojuje IT (konkrétně umělou inteligenci), historii, a potenciálně i politiku. Téma přesně takové, jaké se na tento blog hodí.

Každý zná Pompeje, město zasypané na podzim roku 79 výbuchem Vesuvu. (Něco málo z mých cest zde.) Kdo dával v té škole aspoň trochu pozor, většinou si vybaví, že při tom samém výbuchu bylo zasypáno i další město, Herculaneum. Je ale podstatně míň známé, a to hned ze tří důvodů: a) výrazně delší jméno, které se hůř vyslovuje, b) bylo menší, c) je z něj vykopána asi jen jedna čtvrtina, protože nad antickým Herculaneem stojí moderní město a vrstva sopečných produktů je tu taky podstatně silnější než v Pompejích, až 15 metrů místo pouhých 3-4.

Herculaneum, Ercolano a Vesuv za nimi (2010). Autor: Wereldburger758, CC BY-SA 3.0

Vykopávky v Herculaneu už v 18. století “zavadily” i o jeden mimořádně zajímavý objekt, kterému se říká “Papyrová vila” (Villa dei Papiri), rozsáhlý dům, který možná kdysi patřil Caesarovu tchánovi. Je dodnes prokopán jen částečně a většina jej stále zůstává pohřbená pod sopečným popelem.

Kromě jiných artefaktů se tu našly i stovky papyrových svitků, které sopka doslova spálila na uhel, takže se nedají rozvinout a přečíst. V neprokopané části vily můžou být až tisíce dalších, dosud neobjevených svitků. Spálený papyrus je extrémně křehký, tudíž jeho opatrné rozvíjení většinou způsobí jen rozpad na drobné vločky popela. Dodnes nevíme, co všechno v těch svitcích vlastně je, ale působí to jako knihovna.

Kdyby se nalezené svitky podařilo nějak přečíst, patrně bychom se dozvěděli leccos, co dnes nevíme. Z antické literatury se dodnes zachovaly jen žalostné zbytky. Všechny originály řecké a římské literatury by se vešly do jedné menší knihovničky – což u civilizace, která zabírala několik časových zón, trvala tisíc let a vysoce uznávala filozofii či rétoriku, je strašlivě málo. Je sice možné, že se nám zachovala právě ta nejlepší díla – ta, která stála za opakovaný přepis po celá staletí – no, ale kdoví.

Nevíme například prakticky nic o etruštině, jazyku místní civilizace, která Řím předcházela a dlouhá staletí jej ovlivňovala. Hlavním faktorem v těchto ztrátách přitom patrně byla nestálost papyru, nejlevnějšího psacího materiálu, ve vlhkém evropském podnebí. Co se nekopírovalo pořád dokola, nebo co někdo nenapsal na daleko dražší a odolnější pergamen, to zaniklo.

Jak přečíst svitky, aniž byste je rozvinuli? Dnes lze jejich obsah naskenovat bez rozvíjení pomocí klasického medicínského CTčka, a to velmi jemně, až na jednotlivé vrstvy. Kdyby byl inkoust, kterým jsou psány, aspoň železitý, patrně by to stačilo. Stopy kovu by se totiž v naskenovaných obrázcích daly detekovat – to se v minulém desetiletí také povedlo u jiného, hebrejského svitku z Ein Gedi. Bohužel zrovna v případě svitků z Herculanea šlo o nějaký rostlinný inkoust, který se spekl s papyrem do jedné nečitelné, uhelnaté masy. Žádný kontrast mezi inkoustem a papyrem tam není. Černá na černém.

Nicméně i tak je v té černé na černém obsažena aspoň trocha dodatečné informace, která by k tomu rozluštění mohla vést. Písmena mají malinko jinou tloušťku (barva je přece jen hmota navíc, i když jde jen o pár mikronů) a při procesu uhelnatění svitku pod nimi mohlo dojít k trochu jiným změnám. Toto jsou ovšem příliš jemné odchylky na to, aby se daly pochytit lidským zrakem. Proto vypsala univerzita v Kentucky loni v březnu takzvanou Vesuvius Challenge – odměnu milion dolarů pro toho, kdo dokáže na CT skenech několika vybraných svitků rozeznat aspoň kousek textu pomocí strojového učení.

Strojové učení je zhruba to, čemu se dnes říká umělá inteligence, ale nezní to tak nadneseně.

Loni na podzim, půl roku po vyhlášení ceny, byl ohlášen první úspěch: jednadvacetiletý student dokázal přečíst slovo “purpurový” a na dalším řádku “víno”.

(Pokud si kladete otázku, jestli v tomto případě AI takzvaně nehalucinovala, jako v případě ChatGPT, které občas plácá věrohodně znějící nesmysly – dobrá otázka, která prozrazuje, že jste informovaní. Ale neměla by, nebyla totiž vůbec školena v latině a řečtině coby jazycích, pouze v rozeznávání jednotlivých písmen řecké a latinské abecedy. Ukazuje tedy jen jednotlivá identifikovaná písmena a teprve živí lidé z obrázku posoudí, jestli ta písmena tvoří smysluplný text v daném jazyce.)

Od té doby uplynulo dalších pět měsíců, a na světě je ještě větší úspěch: první souvislý text, který tvoří asi 5 % naskenovaného svitku.

Přečtený text je nepříliš hluboká filozofická úvaha na téma toho, že co je vzácné, nemusí být ještě kvalitní – což celkem odpovídá očekávání, že vytáhnete-li z obrovské knihovny nějaký náhodný úryvek, nepůjde o nic světoborného. Ale je to text obnovený ze 2000 let hluboké jámy zapomnění, a to způsobem, který by ještě někdy před patnácti lety byl naprosté sci-fi.

Několik zajímavých pozorování:

Za prvé, formát soutěže, kdy se vypsala odměna za něco konkrétního a různé týmy z celého světa se pustily do práce, očividně funguje, zejména v situacích, kdy nepotřebujete nějaké extra drahé vybavení a specializované laboratoře. A to už dnes k analýze obrazu nepotřebujete, jenom je potřeba, aby ty obrázky nejdřív někdo naskenoval. Tady se celé akce účastnili hlavně “mladí vlčáci” kolem dvacítky, lze-li ovšem informatikům říkat vlčáci.

Za druhé, tyhle postupy se vždycky jen zlepšují. Je možné, že během relativně krátké doby budeme mít načtenou pořádnou hromadu textů a úzké hrdlo procesu nebude v tom luštění, ale v tom, ty další svitky vůbec vykopávat a skenovat. Nikdo přesně neví, kolik jich ještě v Herculaneu leží, může to být klidně deset tisíc.

Za třetí, on ten reálný vývoj obvykle meandruje jinak, než takzvaní odborníci předpovídají. Půlku těch dnešních předpovědí lze zahodit do koše rovnou, ta druhá se splní nanejvýš částečně. Nicméně strojové učení alias umělá inteligence s tou naší civilizací něco udělá, a některé z těch účinků ještě nelze vůbec předvídat.

Chápu onen reflexivní skepticismus lidí, kteří slyší “umělá inteligence” a reagují na to slovy “to bude zase nějaká blbost, jinak by se kolem toho tolik nepovykovalo v novinách”, ale podobně cynickým způsobem mohl žoviální pantáta u piva kdysi “odstřelit” i elektřinu a telefon, aniž by měl pravdu (cynismus vůbec působí inteligentně, ale je to dost povrchní dojem). Číst černý text na černém pozadí je hodně silná schopnost, kterou jsme dříve neměli, a takových věcí ještě přijde nespočet.

Za čtvrté, když tak nad tím uvažujete, bude ještě existovat nějaké listovní tajemství? Jestli lze přečíst antický svitek spálený na uhel, dost možná půjde to samé udělat i s těmi nejlepšími obálkami pro papírovou korespondenci. Jistě, CT není zrovna banální přístroj do ruky, který by se dal nenápadně nainstalovat na každé poště. Ale třeba časem i tam zaúčinkuje technický pokrok a potřebná mašina se vejde, dejme tomu, na běžný pracovní stůl.

A co se právních záruk týče, tak na kontinentě, kde Evropská komise opakovaně prosazovala plošné skenování všech e-mailů a textových zpráv na ilegální obsah, bych se na ně nespoléhal. Tam nás opravdu zatím chrání jen ta technická obtížnost. Jakmile půjde takovou věc dělat levně a hromadně, ihned někdo opět vytáhne z šuplíku osvědčené strašáky jménem Dětská Pornografie a Terorismus, a začne vysvětlovat, že kdo nic zlého nedělá, nemá přece co skrývat.

Neboť jestli se něco od časů římského impéria nezměnilo, tak jsou to charaktery lidí, zvláště těch ve vysokých politických funkcích, a neutuchající vůle různých psychopatů k moci.