Dla dzieci

OpenAI zapowiada własny układ AI Jalapeño do obsługi inferencji LLM

OpenAI ogłosiło opracowanie pierwszego własnego układu AI, nazwanego Jalapeño. Chip powstał z myślą o obciążeniach związanych z inferencją dużych modeli językowych i ma stanowić początek szerszej, wielogeneracyjnej platformy obliczeniowej firmy.

Jalapeño jako pierwszy autorski akcelerator OpenAI

Nowy układ został zaprojektowany przez OpenAI, a jego produkcją zajmuje się Broadcom. Firma wskazuje, że Jalapeño powstał od podstaw z myślą o współczesnych zastosowaniach LLM, a nie jako uniwersalny akcelerator dostosowany do wcześniejszych typów obciążeń AI.

Pierwszy wafer układu zaprezentowali Sam Altman, dyrektor generalny OpenAI, oraz Hock Tan, dyrektor generalny Broadcomu. Projekt wpisuje się w szerszy trend, w którym firmy rozwijające sztuczną inteligencję inwestują we własne układy scalone dla rosnących potrzeb obliczeniowych.

Zastosowanie w ChatGPT, Codex i API

OpenAI informuje, że Jalapeño jest przeznaczony do zadań związanych z produktami takimi jak ChatGPT, Codex, API oraz przyszłe rozwiązania agentowe. Celem platformy jest obsługa interaktywnych produktów LLM na dużą skalę, przy zachowaniu wysokiej przepustowości i niskich opóźnień.

Według firmy chip ma być elastyczny i współpracować z różnymi dużymi modelami językowymi. Pierwsze próbki inżynieryjne działają już z obciążeniami ML, w tym z GPT-5.3-Codex-Spark, przy docelowej częstotliwości i poborze mocy określonych dla produkcji.

Najważniejsze informacje o projekcie

  • Nazwa układu: Jalapeño.
  • Projekt: opracowany przez OpenAI od podstaw pod obciążenia AI.
  • Produkcja: realizowana we współpracy z Broadcomem.
  • Partnerzy ekosystemu: Broadcom i Celestica mają wspierać wdrożenie platformy, integrację płyt, systemów rack, sieci oraz skalowalną produkcję.
  • Przeznaczenie: inferencja dużych modeli językowych, w tym zastosowania dla ChatGPT, Codex, API i przyszłych produktów agentowych.

Pierwsze platformy pod koniec 2026 roku

OpenAI zapowiada, że pierwsze platformy oparte na Jalapeño mają zostać wdrożone do końca 2026 roku, a następnie rozwijane w kolejnych latach. Firma przedstawia projekt jako początek wielogeneracyjnego podejścia do własnej infrastruktury obliczeniowej.

Decyzja o wejściu w obszar niestandardowych układów AI pokazuje rosnące znaczenie wyspecjalizowanych akceleratorów i ASIC w sektorze sztucznej inteligencji. OpenAI już wcześniej zawarło partnerstwo dotyczące wdrożenia 10 GW systemów NVIDIA, jednak rozwój własnego chipu może zwiększyć różnorodność wykorzystywanych rozwiązań obliczeniowych.

Dodaj komentarz