[뉴스콤 장태민 기자]
딥시크 모멘트: R1 모델 공개와 충격
1월 20일 중국의 스타트업 딥시크의 AI 모델 R1 출시. 테스트 타임 컴퓨팅, 강화 학습이라는 핵심 기술을 기반으로 미국의 수출 규제에 상대적으로 열악한 AI 인프라 환경에서도 OpenAI의 모델 o1에 필적한 성능을 구사함. 그럼에도 API 비용은 20분의 1 수준. R1이 공개되며 이전 모델이었던 V3의 훈련 비용이 유사한 성능을 구사한 GPT-4 대비 20분의 1이었다는 점도 재부각됨
1월 27일 AI 인프라 기업 중심의 주가 하락
1월 27일 미국 주식시장에서는 ‘막대한 AI 인프라 투자가 필요할까?’라는 의구심에서 관련 종목 주가 급락 발생. 1월 27일 당일 S&P500 수익률 하위 10종목은 모두 AI 인프라(AI 반도체, 전력 인프라) 기업이었음. 반면, AI 인프라 연관성이 낮거나, AI 훈련 비용이 낮아짐으로 AI 확산 가속의 수혜를 볼 수 있는 기업들(AI S/W, 자율주행, 온디바이스)은 오히려 주가가 상승하기도 함
1월 27일 이후 회복하는 주가 흐름의 배경과 쟁점
1월 27일 급락했던 AI 인프라 관련주는 대부분 반등에 성공. 이후 주가 반응의 쟁점은 크게 2가지. 1) 중국 모델에 대한 신빙성이 있는지, 2) 중국이 보여준 비용절감 기술의 효율성은 Scaling law(더 많은 AI 하드웨어 투입→더 나은 AI 소프트웨어 성능)는 끝을 의미하는지. V3 모델의 값싼 훈련 비용이 과장되었다는 주장, R1 모델의 미국 모델 distillation(증류) 의혹 제기되며 딥시크에 대한 첫인상의 충격이 약해지기 시작. 비용절감 기술의 효용은 인정이 되나, AI 인프라 투자는 늘어야 한다는 의견이 주류를 이루며 주가 회복 주도
딥시크 모멘트의 시사점
딥시크 R1은 OpenAI의 o1과 함께 테스트 타임 컴퓨팅(스케일링)이 거의 처음으로 적용되는 AI 모델. (Test) Time Scaling Law란 1) 추론 단계에서 2) 더 많은 계산 시간을 투입하면 더 나은 결과를 도출할 수 있다는 법칙. Time Scaling Law 하에서 AI 훈련 비용은 줄일 수 있지만, 추론에 필요한 인프라와 비용이 더 필요하게 됨. 딥시크 모델은 Test Time Scaling의 효용성이 무료 버전인 R1을 통해 확산된 계기로, 기술 진보 및 확산의 매개로 이해
투자전략: 단기 저가 매수 전략, 중기 추론용 반도체 니즈 가속화 가능성 고려
AI 모델 훈련 최적화를 인정해도 추론용 AI 인프라 확장은 필요. 따라서 딥시크 충격에 따른 AI 인프라 기업 주가 하락은 과도, 단기 저가 매수 전략 유효하다는 판단. 중기적으로는 AI 추론용 인프라에 대한 니즈 앞당길 요인, 관련 종목에 대한 눈높이 상향 가능성 고려
(황수욱 메리츠증권 연구원)
장태민 기자 chang@newskom.co.kr