진짜 딥시크 때문에 엔비디아·SK하이닉스가 위험할까? [강해령의 하이엔드 테크]
이전
다음
딥시크 로고와 오성홍기. 사진=연합뉴스
AI 업계 대표 스타 오픈AI의 LLM과 ‘온 파(on par)'가 되는 딥시크 R1의 퍼포먼스. 자료출처=딥시크
엔비디아의 H800. 사진제공=엔비디아
엔비디아는 H100은 데이터 전송속도가 초당 900GB인 칩이지만, 미국 당국의 AI 칩 규제로 속도를 절반 이상 낮춘 H800으로 개조해서 중국에 공급합니다. GPU의 FP8 데이터 연산 속도는 비슷합니다. 자료출처=엔비디아
FP32, FP16, FP8(그림에서는 INT8). 숫자가 압축되고 경량화해서 연산 속도는 개선되지만 데이터의 정밀도는 떨어집니다.
자료출처=딥시크 V3 기술 리포트.
자료출처=딥시크 V3 기술 리포트.
최태원(오른쪽) SK그룹 회장과 젠슨 황 엔비디아 CEO. 사진출처=최태원 회장 SNS
34비트의 누적정밀도를 구현하는 고도화한 GPU, HBM 안에서 연산이 가능한 ‘커스텀 HBM’이 필요하다는 딥시크의 의견. 자료출처=딥시크 V3 리포트.
구글의 데이터 센터 전경. 사진제공=구글