ZBYNĚK FIALA
Masakr polovodičových akcií na technologických burzách jako je NASDAQ, který způsobila převratná čínská inovace rozbíjející nadřazenost západních gigantů, má historický rozměr. Přehledně to shrnuje, editorka čínského nezávislého portálu China Talk jménem Hongda Jiang (čti Chung-ta Ťiang) na platformě Substack.
Dám její výklad raději skoro celý, ale napřed ho trochu shrnu. Ještě větší pecku, než odhad rozsahu zmařeného kapitálu, který byl nainvestován do prošlého řešení, představuje následující geopolitická úvaha:
- Finančně a energeticky dostupný DeepSeek, který je jako otevřený kód k volnému použití, nelze zablokovat žádné zemi, ať už velké, nebo malé.
- Může se to lavinovitě šířit po globálním Jihu, a bude to vhodné i pro menší podniky a nižší úřady.
- Zaplaťpámbu za sankce, které Čínu přinutily k budování samostatnosti v celém polovodičovém řetězci a ke schopnosti lépe využít toho, co je. Zmařit to může jen to, že USA se poučí a umrtví domácí vývoj obnovou dodávek nejlepších čipů…
A teď již výklad událostí z čínské perspektivy (zvýrazněno mnou):
Často se cituje (možná špatně) Leninův výrok: „Jsou desetiletí, kdy se nic neděje, a jsou týdny, kdy se dějí desetiletí.“ Bez ohledu na přesnost tohoto výroku se tento týden jednoznačně zapíše do historie v té druhé kategorii. Začátkem tohoto týdne společnost DeepSeek Artificial Intelligence Co., Ltd. – dceřiná společnost čínského hedgeového fondu „High-Flyer Quant“ – vydala nejnovější verzi svého velkého jazykového modelu (LLM) – DeepSeek R1.
Od doby, kdy se ChatGPT zpopularizoval mezi spotřebiteli, pracují významní technologičtí giganti po celém světě na vlastních verzích LLM – ať už jde o Llama společnosti Meta, Grok společnosti X, Claude společnosti Anthropic nebo 01.AI společnosti Beijing Zero One.
Modely společnosti DeepSeek vyčnívají nad výše zmíněnými konkurenty tím, že jsou schopny dosáhnout srovnatelného nebo lepšího výkonu ve všech srovnávaných kategoriích, a přitom vynaložit zlomek času a peněz, které potřebuje další nejlepší konkurent.
Pro srovnání, společnost DeepSeek údajně vynaložila na trénink svého modelu zhruba 6 milionů USD, přičemž spotřebovala přibližně 2,8 milionu hodin grafických procesorů na více než 2000 grafických procesorech Nvidia H800 (které pracují přibližně 1/6 rychlosti nejpokročilejší řady H100 společnosti Nvidia). Tohoto výkonu dosáhla za méně než 2 měsíce.
To je méně než 10 % nákladů dalšího nejlevnějšího modelu – Llama 3 (vynaložených nejméně 70 milionů dolarů) a méně než 6 % GPU-hodin vynaložených dalším nejrychlejším nečínským konkurentem – GPT-4 společnosti OpenAI (přibližně 50-60 milionů vynaložených GPU-hodin), přestože ten má přístup ke špičkovým GPU Nvidia, které daleko předčí horší H800 použité společností DeepSeek. A co víc, většina vlastností a funkcí DeepSeek je open-source podlicencí MIT, což znamená, že kdokoli může bezplatně a bez omezení kopírovat, upravovat a šířit související software a dokumentaci.
Jedná se o revoluční milník ve stále se rodícím odvětví LLM a tato událost má několik zřejmých strategických důsledků:
- Americké sankce proti Číně v oblasti polovodičů rozhodně selhaly. Od prvních vývozních kontrol Trumpova režimu proti společnosti ZTE na konci roku 2017 (& později proti společnosti Huawei v polovině roku 2018) uvalují USA stále přísnější zákazy vývozu polovodičů do Číny. Tyto sankce zakazují nejen prodej pokročilých koncových polovodičových produktů do Číny, ale také prodej zařízení na výrobu polovodičů, aby se Číně zabránilo v přístupu k nejnovějším polovodičům a jejich výrobě, a tím se Čína udržovala za USA, pokud jde o přístup k nejnovějším pokrokům v oblasti umělé inteligence.
Těchto 8 let stále přísnějších sankcí nejenže přinutilo čínské podniky zvýšit soběstačnost v celém hodnotovém řetězci polovodičů (stala by se tak první takovou zemí z hodnotového řetězce polovodičů), ale také využít svůj omezený výpočetní výkon mnohem efektivněji ve srovnání s americkými protějšky, aby dosáhly nadprůměrných výsledků – jak dokazuje nejnovější úspěch společnosti DeepSeek.
Pro učení původního modelu DeepSeek byly použity procesory Nvidia H800 vyrobené v USA, ale je pravděpodobné, že následné modely mohou využívat procesory z čínské výroby, jako je Huawei „Ascend 910C“. Řada Ascend sice nemá přístup k nejnovějším špičkovým výrobním procesům (TSMC má vodiče o šířce jen 2nm), ale je dostatečně dobrou platformou pro spuštění modelu DeepSeek R1 ve velkém měřítku.
Nadšenci z řad kutilů už prokázali, že základní open-source software DeepSeek lze spustit na počítačích nižší třídy, jako je Raspberry Pi (i když bez řady funkcí plného modelu s 671 miliardami parametrů), a to se spotřebou energie, která nepřesahuje spotřebu běžného mobilu.
- Ocenění amerických technologických gigantů musí být revidováno exponenciálně směrem dolů. Ještě v loňském roce se předpokládalo, že každá společnost, která chce vytvořit LLM, potřebuje stovky milionů dolarů na sofistikovaný hardware (který může poskytnout jen několik společností, jako je Nvidia) plus desítky milionů procesorových hodin.
To znamenalo, že pouze nejbohatší technologické společnosti na světě – Google, Meta, Microsoft atd. – si mohou dovolit vybudovat, udržovat a nabízet služby LLM. V důsledku toho se zisky spojené se službami LLM soustředily v rukou několika málo společností, které měly mnohamiliardové ocenění (např. Nvidia).
Uvedení DeepSeek R1 tento předpoklad rozbilo. Ukázalo, že startup s méně než 10 miliony USD může vytvořit a trénovat model s použitím staršího hardwaru, který je daleko za špičkou. Malé společnosti tedy mohou se ziskem nabízet služby za haléře vzhledem k nízké finanční bariéře vstupu. V důsledku toho musí být nyní všechny zisky (a tedy i celkové ocenění společností) předpovídané americkým technologickým oligopolem výrazně revidovány směrem dolů, což může mít nebezpečné důsledky pro americké finanční trhy.
- Globální jih se nyní může těšit z plodů generativní umělé inteligence. Nejvíce transformační dopad DeepSeek se netýká přímo Číny nebo USA, ale spíše zbytku světa (zejména globálního jihu). Nyní, když má každý člověk na světě přístup ke špičkovému, open-source LLM, který má relativně minimální hardwarové nároky, je finanční a hardwarová bariéra vstupu, která globálnímu jihu bránila ve hře o AI, téměř odstraněna.
Navíc žádná země na světě už nemůže zabránit využití vyspělé technologie AI kvůli geopolitickým rozdílům jiné zemi, ať už velké nebo malé. Novými překážkami pro uplatnění umělé inteligence jsou jen vzdělání a představivost. Přitom i vzdělání se stává stále menší překážkou pro AI, protože uživatelé DeepSeek již prokázali schopnost vyvíjet softwarový kód (včetně kódu AI), aniž by sami ručně napsali jediný řádek kódu. Bezplatný open-source LLM DeepSeek uvolní představivost & inovativní schopnosti více než 6 miliard lidí na globálním jihu.
Úspěch společnosti DeepSeek je nepochybně velkou podporou Číny v čínsko-americkém technologickém závodě. Jeho přínosy jdou daleko za pouhé zmírnění dopadu zákazu vývozu polovodičů z USA, jeho větší potenciální přidaná hodnota pochází ze dvou dalších zdrojů:
- Rozšířené možnosti vývozu polovodičů. DeepSeek umožnil provozovat škálovatelný, vysoce výkonný LLM na relativně cenově dostupných, ale výkonnostně omezených hardwarových platformách. V důsledku toho se na globálních jižních trzích výrazně rozšířil dostupný trh pro malou podnikovou a vládní infrastrukturu umělé inteligence s cílenými případy použití.
Jako přední světový výrobce starších polovodičů Čína má ideální pozici pro prodej relativně levných čipů a infrastruktury AI – nebo jejich cloudových služeb – rozvojovým zemím, které si dříve nemohly dovolit nasadit nebo používat vysoce výkonnou výpočetní infrastrukturu pro případy použití AI.
- Posílení možností vývojářů v ekosystému AI. Vzhledem k tomu, že se DeepSeek stává oblíbeným LLM pro vývojáře aplikací, výzkumníky a nadšence z rozvinutých i rozvojových zemí, povede jeho rychlé přijetí k rychlejšímu zlepšování, dostupnějším službám, zrychleným inovacím a širší podpoře komunity, aby se DeepSeek v budoucnu stal ještě atraktivnější alternativou pro větší počet lidí.
Skutečnost, že se jedná z větší části o otevřený zdrojový kód, téměř znemožňuje jakékoli vládě omezit nebo zakázat používání a šíření těchto výše uvedených vylepšení, čímž se stává mnohem odolnější vůči geopolitickým otřesům.
xxx
Navzdory četným kladům pro Čínu existují také významná nekontrolovatelná rizika v důsledku tohoto úspěchu. Autorka má na mysli především možnost, že DeepSeek přiměje Spojené státy k uvolnění kontroly vývozu polovodičů poté, co se přesvědčí o relativní neúčinnosti těchto opatření. Takové opatření by mohlo mít škodlivý účinek, protože by přilákalo čínské podniky zpět do stavu závislosti na výkonnějších amerických technologiích. Peníze na výzkum a vývoj by se přesunuly od místních čínských firem, které se v hodnotovém řetězci ICT prosazují.
Autorka z toho vyvozuje, že navzdory všeobecnému přesvědčení je udržitelnost čínského technologického pokroku mnohem zranitelnější vůči „přátelštějším“ USA než vůči „nepřátelštějším“ USA.
Ale riskantní je pro Čínu i druhá volba, kdy bariéry nepominou. Úspěch DeepSeek se přidává k řadě dalších nedávných „sputnikovských momentů“ – ať už se jedná o úspěch TikTok v Americe, zkušební let dvou stíhaček 6. generace nebo nedávný průlom projektu EAST v udržování jaderné fúze na více než 1000 sekund. To všechno by mohlo povzbudit americkou veřejnost a elity nikoliv k uvolnění sankcí, ale naopak k většímu koordinovanému celospolečenskému úsilí o udržení technologického náskoku před ČLR, píše Hongda Jiang, editorka China Talk.
Její shrnutí historické změny si pečlivě uložím do archivu, abych je mohl po čase konfrontovat se skutečností. Předpovědi jsou vždycky ošidné, zvláště, jde-li o budoucnost…
Buďte první kdo přidá komentář