[서핏]DeepSeek - 진실, 오해, 시사점
최근 DeepSeek, R1 출시 이후 Nvidia, Marvell, SK하이닉스 등 반도체 회사들의 주가가 크게 하락했다.. 모든 언론사들은 DeepSeek의 $6M 학습 비용을 거론하며 스케일링 법칙이 깨졌고, 더 이상 거대한 컴퓨팅 클러스터의 니즈가 없어졌기 때문이라고 한다. $6M은 final training run에만 사용된 비용이고, 같은 방식으로 OpenAI의 o1 모델 학습비용을 apples-to-apples 비교한다면 $15M, 즉 별다를 게 없는 수준이라고 한다. 스케일링 법칙이란?미국 이론물리학자인 제프리 웨스트 샌타페이연구소 특훈교수가 말하길, 동물의 몸집이 2배로 늘어날 때 대사율은 100%가 아니라 75%(4분의 3) 증가한다고 한다. 크기가 두 배 커질 때마다 에너지는 25..