Google расширяет цепочку поставщиков ИИ-чипов: в переговорах с Marvell Technology о новом TPU для инференса
Компания обсуждает кастом ИИ-чипов на фоне смещения рынка в сторону инференса и роста ASIC-сегмента до $118 млрд к 2033 году
Google ведёт переговоры с Marvell Technology о разработке двух новых чипов для задач искусственного интеллекта, как сообщает The Information. Речь идёт об MPU (memory processing unit), который будет работать в связке с существующими TPU (Tensor Processing Units), и новом TPU, оптимизированном под инференс — этап, на котором ИИ-модели обслуживают запросы пользователей, а не обучаются.
По данным источников, Marvell Technology будет выступать в роли дизайн-партнёра, аналогично модели сотрудничества Google с MediaTek в рамках более поздних версий TPU. При этом соглашение пока не подписано и находится на стадии обсуждения.
Переговоры проходят вскоре после того, как Broadcom, ключевой партнёр Google по кастомным чипам, закрепил долгосрочный контракт на поставку TPU и сетевых компонентов до 2031 года. Это указывает не на замену партнёров, а на расширение цепочки поставок: Broadcom отвечает за высокопроизводительные решения, MediaTek — за более дешёвые оптимизированные версии, а TSMC занимается производством.
Новая инициатива Google отражает более широкую смену приоритетов в индустрии ИИ-чипов. Компания делает ставку на инференс как на основной источник вычислительных затрат. В отличие от обучения моделей, которое происходит эпизодически и требует кратковременных пиковых ресурсов, инференс работает непрерывно и масштабируется вместе с пользовательским спросом.
Google уже представила TPU нового поколения Ironwood, который компания называет «первым TPU для эпохи инференса». Он обеспечивает десятикратный рост пиковой производительности по сравнению с TPU v5p и масштабируется до 9 216 чипов в одной системе с энергопотреблением около 10 мегаватт.
Marvell Technology в этой архитектуре может занять нишу дополнительных решений — как по стоимости, так и по профилю нагрузок. Речь идёт о сегментации вычислений внутри одной экосистемы, где разные типы чипов оптимизируются под разные сценарии использования.
Параллельно рынок кастомных чипов демонстрирует ускоренный рост. По прогнозам, он увеличится на 45% в 2026 году и достигнет $118 млрд к 2033 году, опережая темпы роста GPU-сегмента. Основным драйвером становится именно инференс, а не обучение моделей.
Окончательного соглашения с Marvell Technology пока нет, и даже в случае подписания новые чипы появятся лишь через несколько лет. Однако направление определено: Google выстраивает диверсифицированную инфраструктуру для вычислений следующего поколения, где инференс становится центральной нагрузкой, а цепочка поставщиков — критическим элементом стратегии.