InferenceScaling 추론확장 추론전용가속기 ASIC NPU

2026년 현재, AI 시장의 무게중심이 '학습'에서 '대규모 추론'으로 이동했습니다.

비용 효율을 중시하는 사용자에게 엔비디아의 범용 GPU는 과한 지불일 수 있습니다.

현재 추론 전용 가속기 분야의 선두 기업들은 대부분 스타트업이며,

일부는 상장을 준비 중이거나 빅테크에 인수되었습니다.

비상장사 핵심 기술 및 강점 상장 상태 (2026년 초 기준)
Cerebras 웨이퍼 스케일 엔진(WSE). 거대 칩 하나로 추론 속도 극대화. 2026년 2분기 IPO 예정 (티커: CBRS 예상). 가장 기대주.
Groq LPU(Language Processing Unit). SRAM 기반으로 추론 레이턴시 사실상 제로. 비상장. 엔비디아의 자산 인수 추진설 확인 요망.
Etched 'Sohu' 칩. 트랜스포머 전용 하드코딩 ASIC. 엔비디아 대비 20배 효율. 비상장. 피터 틸 투자, 50억 달러 가치 펀딩 성공.
Tenstorrent 짐 켈러가 이끄는 RISC-V 기반 칩. 유연하고 저렴한 추론 지향. 비상장. 삼성, 현대 등 투자 및 협업 중.

상장사인 기존 강자들은 다음과 같습니다.

상장사 투자 포인트
Broadcom (AVGO) 구글 TPU, 메타 MTIA 등 커스텀 추론 칩(ASIC) 설계의 실질적 지배자.
Arm Holdings (ARM) 추론 전용 칩의 전력 효율 기반 아키텍처. 저전력 저소음 중시 시 1순위.
Marvell (MRVL) 데이터센터용 가속기 및 고속 인터커넥트 칩 강자.
Ambarella (AMBA) 엣지(Edge) 저전력 추론 가속기(NPU) 특화. 미니 PC/로컬 기기 시장의 잠룡.