OpenAI zapowiada własny układ AI Jalapeño do obsługi inferencji LLM
OpenAI ogłosiło opracowanie pierwszego własnego układu AI, nazwanego Jalapeño. Chip powstał z myślą o obciążeniach związanych z inferencją dużych modeli językowych i ma stanowić początek szerszej, wielogeneracyjnej platformy obliczeniowej firmy.
Jalapeño jako pierwszy autorski akcelerator OpenAI
Nowy układ został zaprojektowany przez OpenAI, a jego produkcją zajmuje się Broadcom. Firma wskazuje, że Jalapeño powstał od podstaw z myślą o współczesnych zastosowaniach LLM, a nie jako uniwersalny akcelerator dostosowany do wcześniejszych typów obciążeń AI.
Pierwszy wafer układu zaprezentowali Sam Altman, dyrektor generalny OpenAI, oraz Hock Tan, dyrektor generalny Broadcomu. Projekt wpisuje się w szerszy trend, w którym firmy rozwijające sztuczną inteligencję inwestują we własne układy scalone dla rosnących potrzeb obliczeniowych.
Zastosowanie w ChatGPT, Codex i API
OpenAI informuje, że Jalapeño jest przeznaczony do zadań związanych z produktami takimi jak ChatGPT, Codex, API oraz przyszłe rozwiązania agentowe. Celem platformy jest obsługa interaktywnych produktów LLM na dużą skalę, przy zachowaniu wysokiej przepustowości i niskich opóźnień.
Według firmy chip ma być elastyczny i współpracować z różnymi dużymi modelami językowymi. Pierwsze próbki inżynieryjne działają już z obciążeniami ML, w tym z GPT-5.3-Codex-Spark, przy docelowej częstotliwości i poborze mocy określonych dla produkcji.
Najważniejsze informacje o projekcie
- Nazwa układu: Jalapeño.
- Projekt: opracowany przez OpenAI od podstaw pod obciążenia AI.
- Produkcja: realizowana we współpracy z Broadcomem.
- Partnerzy ekosystemu: Broadcom i Celestica mają wspierać wdrożenie platformy, integrację płyt, systemów rack, sieci oraz skalowalną produkcję.
- Przeznaczenie: inferencja dużych modeli językowych, w tym zastosowania dla ChatGPT, Codex, API i przyszłych produktów agentowych.
Pierwsze platformy pod koniec 2026 roku
OpenAI zapowiada, że pierwsze platformy oparte na Jalapeño mają zostać wdrożone do końca 2026 roku, a następnie rozwijane w kolejnych latach. Firma przedstawia projekt jako początek wielogeneracyjnego podejścia do własnej infrastruktury obliczeniowej.
Decyzja o wejściu w obszar niestandardowych układów AI pokazuje rosnące znaczenie wyspecjalizowanych akceleratorów i ASIC w sektorze sztucznej inteligencji. OpenAI już wcześniej zawarło partnerstwo dotyczące wdrożenia 10 GW systemów NVIDIA, jednak rozwój własnego chipu może zwiększyć różnorodność wykorzystywanych rozwiązań obliczeniowych.