Rozmach umělé inteligence běží na čipech, ale nemůže si vystačit s nimi

Revoluci v oblasti umělé inteligence přirovnal šéf Googlu k tomu, že lidstvo využilo oheň. Teď jen kdyby se průmyslu podařilo zajistit digitální podpal, který by ho podnítil.

Nedostatek pokročilých čipů, které jsou základem nových generativních systémů umělé inteligence, odstartoval závod o zajištění výpočetního výkonu a hledání řešení. Grafické čipy neboli GPU používané pro umělou inteligenci jsou téměř všechny vyráběny společností Nvidia. Boom poptávky po nich však značně převýšil nabídku díky virálnímu úspěchu ChatGPT, chatbota, který dokáže odpovídat na otázky podobně jako člověk.

„Protože je jich nedostatek, záleží na tom, koho znáte,“ říká Sharon Zhou, spoluzakladatelka a generální ředitelka startupu Lamini, který pomáhá firmám vytvářet modely umělé inteligence, jako jsou chatboti. „Je to jako s toaletním papírem během pandemie.“

Tato situace omezila výpočetní výkon, který mohou poskytovatelé cloudových služeb jako Amazon.com a Microsoft nabídnout klientům, jako je OpenAI, společnost stojící za ChatGPT. Vývojáři umělé inteligence potřebují serverovou kapacitu, aby mohli vyvíjet a provozovat své stále složitější modely a pomáhat dalším společnostem vytvářet služby umělé inteligence.

I ti nejpropojenější technologičtí podnikatelé na světě mají problémy se zajištěním kapacity. Během kongresového slyšení o umělé inteligenci 16. května generální ředitel OpenAI Sam Altman řekl, že by bylo lepší, kdyby ChatGPT používalo méně lidí kvůli úzkému hrdlu v procesorech.

„GPU je v tuto chvíli podstatně těžší získat než drogy,“ řekl Elon Musk 23. května na summitu Rady generálních ředitelů deníku The Wall Street Journal.

Být Muskem má však své výhody. Začátkem tohoto roku bylo začínajícím firmám, které se dožadovaly výpočetní kapacity společnosti Oracle, náhle oznámeno, že kupec získal velkou část volných serverů společnosti Oracle, uvedli lidé obeznámení s touto záležitostí. Startupům bylo řečeno, že kupcem je Musk, který buduje svého vlastního konkurenta OpenAI s názvem X.AI, uvedli tito lidé.

Přístup k desítkám tisíc pokročilých grafických čipů je klíčový pro společnosti, které trénují velké modely umělé inteligence, jež mohou generovat originální texty a analýzy. Bez nich probíhá práce na velkých jazykových modelech, které stojí za umělou inteligencí, mnohem pomaleji, říkají zakladatelé. Pokročilé grafické čipy Nvidia vynikají tím, že zvládnou provádět mnoho výpočtů současně, což je pro práci s AI klíčové.

Analytici UBS odhadují, že dřívější verze ChatGPT vyžadovala přibližně 10 000 grafických čipů. Musk odhaduje, že aktualizovaná verze vyžaduje třikrát až pětkrát více pokročilých procesorů Nvidia.

Někteří investoři hledají ve svých sítích volný výpočetní výkon, zatímco jiní organizují hromadné objednávky procesorů a serverové kapacity, kterou mohou sdílet se svými startupy v oblasti umělé inteligence. Podle investorů a startupů zabývajících se umělou inteligencí startupy zmenšují své modely AI, aby byly efektivnější, nakupují vlastní fyzické servery s příslušnými grafickými čipy nebo přecházejí k méně populárním poskytovatelům cloudových služeb, jako je Oracle, dokud se nedostatek nevyřeší.

Jiní zakladatelé prostě prosí prodejce Amazonu a Microsoftu o větší výkon.

Zhou uvedla, že společnost Lamini, kterou založila společně s bývalým inženýrem společnosti Nvidia, má potřebné čipy. Ona i řada dalších zakladatelů, s nimiž deník hovořil, odmítli uvést, jak přesně si je zajistili.

„Odvětví zaznamenává silnou poptávku po grafických procesorech,“ uvedl mluvčí OpenAI a dodal, že společnost se snaží zajistit svým zákazníkům potřebnou kapacitu.

Společnost Oracle ani Musk na žádosti o komentář nereagovali. Společnosti Microsoft a Amazon se odmítly vyjádřit.

Společnost Nvidia nedávno uvedla, že rozšiřuje své dodávky, aby uspokojila rostoucí poptávku, ale mnozí zakladatelé AI očekávají, že nedostatek bude přetrvávat nejméně do příštího roku. Poptávka po produktech Nvidie vyhnala akcie společnosti nahoru zhruba o 167 %. Náklady na čipy se liší, ale pokročilé čipy Nvidia pro umělou inteligenci prodávají někteří prodejci za přibližně 33 000 USD, i když na sekundárních trzích mohou mít vzhledem k vysoké poptávce vyšší ceny.

Některé společnosti blokují cloudové kapacity z obavy, že k nim později nebudou mít přístup. „Lidé za ně nyní prostě dál platí, i když je nepotřebují,“ řekl Adam Wenchel, generální ředitel společnosti Arthur, která vytváří nástroje na ochranu firem před riziky AI, jako je únik dat.

Společnosti, které si dokážou zajistit výpočetní výkon, mohou podle zakladatelů a investorů čekat na jeho využití i několik týdnů. „I když už jste zaplatili předem, neznamená to, že vám GPU přijdou do druhého dne nebo týdne,“ řekl Aravind Srinivas, generální ředitel společnosti Perplexity AI, která vytváří nástroj pro konverzační vyhledávání založený na umělé inteligenci. „Musíte si prostě počkat.“

Výrobci serverů a jejich přímí zákazníci tvrdí, že na nejnovější grafické čipy Nvidia čekají více než šest měsíců. Generální ředitel společnosti Supermicro, jednoho z největších výrobců serverů, uvedl, že počet objednávek systémů s grafickými čipy je nejvyšší v historii společnosti a že společnost spěchá s navýšením výrobních kapacit.

To vše vytvořilo sekundární trh s těmito pokročilými čipy, na němž se částečně podílejí velké krypto společnosti, které si během boomu koupily čipy na těžbu a nyní je kvůli poklesu trhu s digitálními měnami nepotřebují.

Kanjun Qiu, generální ředitel společnosti Generally Intelligent, která se zabývá výzkumem umělé inteligence, nakupuje od loňského roku pokročilé grafické čipy pro své vlastní servery, což jí umožňuje překonat současný nedostatek. Nedávno jí napsal jeden investor rizikového kapitálu s dotazem, zda má volnou kapacitu, kterou by mohla pronajmout dalším startupům. Qiu se ještě nerozhodla, zda se se svými čipy rozloučí.

Altman a další zaměstnanci OpenAI mezitím řeší stížnosti firem, které na jejich platformě vytvářejí služby umělé inteligence.

Alex Lebrun, generální ředitel a zakladatel společnosti Nabla, která vyvinula asistenta umělé inteligence pro lékaře, uvedl, že softwaru OpenAI může trvat až dvě minuty, než odpoví na dotaz. Nabla využívá AI k automatickému generování poznámek, doporučených dopisů a klinických doporučení a její zákazníci očekávají, že tyto poznámky budou vytvořeny okamžitě.

Lebrun uvedl, že jako řešení vytvořila společnost Nabla několik jednodušších modelů, aby mohla rychleji vygenerovat první návrh materiálu, a při konečných úpravách se pak spoléhá na nejnovější verzi programu ChatGPT. „Dobré startupy jsou ty, které se naučí, jak všechna tato omezení obejít,“ řekl Lebrun a dodal, že na problémy upozornil přímo Altmana.

Altman a další zástupci OpenAI zakladatelům sdělili, že společnost pracuje na řešení tohoto problému ve spolupráci se společností Microsoft, která je jejím největším investorem a poskytovatelem datových center.