На конференції Cloud Next 25, компанія Google представила свій найпотужніший AI-чип — Ironwood, розроблений спеціально для завдань інференції (використання вже навчених моделей).

Це сьоме покоління власних прискорювачів компанії та перший чип, повністю орієнтований для виконання AI-задач у часі.
У конфігурації з 9216 чипів Ironwood досягає неймовірної продуктивності — 42,5 EFLOPS, що у 24 рази вище, ніж в одного з найпотужніших суперкомп'ютерів світу — El Capitan. При цьому Ironwood вдвічі енергоефективніший за попередні TPU покоління Trillium.
Ключові особливості Ironwood:
- 192 ГБ HBM-пам'яті на чип, що у 6 разів більше, ніж у Trillium;
- Пропускна здатність пам'яті — 7,2 ТБ/с, це в 4,5 раза вище за попереднє покоління;
- Інтерчиповий канал зв'язку — 1,2 Тбіт/с в обидві сторони, +50% до минулого TPU.
Google запропонує Ironwood у хмарному сервісі Google Cloud у двох конфігураціях: на 256 чипів та на 9216 чипів — під завдання різного масштабу. Компанія впевнена, що саме інференція стане ключовим напрямком у розвитку AI, а Ironwood має задати новий стандарт у цій галузі.
Джерело: wccftech