InferenceScaling 추론확장 추론전용가속기 ASIC NPU
2026년 현재, AI 시장의 무게중심이 '학습'에서 '대규모 추론'으로 이동했습니다.
비용 효율을 중시하는 사용자에게 엔비디아의 범용 GPU는 과한 지불일 수 있습니다.
현재 추론 전용 가속기 분야의 선두 기업들은 대부분 스타트업이며,
일부는 상장을 준비 중이거나 빅테크에 인수되었습니다.
| 비상장사 | 핵심 기술 및 강점 | 상장 상태 (2026년 초 기준) |
|---|---|---|
| Cerebras | 웨이퍼 스케일 엔진(WSE). 거대 칩 하나로 추론 속도 극대화. | 2026년 2분기 IPO 예정 (티커: CBRS 예상). 가장 기대주. |
| Groq | LPU(Language Processing Unit). SRAM 기반으로 추론 레이턴시 사실상 제로. | 비상장. 엔비디아의 자산 인수 추진설 확인 요망. |
| Etched | 'Sohu' 칩. 트랜스포머 전용 하드코딩 ASIC. 엔비디아 대비 20배 효율. | 비상장. 피터 틸 투자, 50억 달러 가치 펀딩 성공. |
| Tenstorrent | 짐 켈러가 이끄는 RISC-V 기반 칩. 유연하고 저렴한 추론 지향. | 비상장. 삼성, 현대 등 투자 및 협업 중. |
상장사인 기존 강자들은 다음과 같습니다.
| 상장사 | 투자 포인트 |
|---|---|
| Broadcom (AVGO) | 구글 TPU, 메타 MTIA 등 커스텀 추론 칩(ASIC) 설계의 실질적 지배자. |
| Arm Holdings (ARM) | 추론 전용 칩의 전력 효율 기반 아키텍처. 저전력 저소음 중시 시 1순위. |
| Marvell (MRVL) | 데이터센터용 가속기 및 고속 인터커넥트 칩 강자. |
| Ambarella (AMBA) | 엣지(Edge) 저전력 추론 가속기(NPU) 특화. 미니 PC/로컬 기기 시장의 잠룡. |