이번 주에 중국의 한 소규모 인공지능 연구소가 최첨단 모델의 AI를 공개하며 중국의 첨단 기술 선두를 막으려는 미국의 시도를 허탈하게 하며 전 세계를 놀라게 했다.
헤지펀드 매니저인 량웬펑이 설립한 딥시크는 월요일에 인간의 감독 없이도 자동으로 학습하고 개선할 수 있는 부트스트랩 예산으로 대규모 언어 모델을 구축하는 방법을 자세히 설명하는 R1 모델을 출시했다.
OpenAI와 구글 딥마인드를 비롯한 미국 기업들은 인간의 인지 능력에 맞는 모델을 만들기 위해 비교적 새로운 AI 연구 분야인 추론 모델의 개발을 개척했다. 12월, 샌프란시스코에 본사를 둔 이 OpenAI는 O1 모델의 전체 버전을 출시했지만 방법은 비밀로 유지했다.
딥시크의 R1 출시로 실리콘밸리에서는 메타, 아너틱 등 더 나은 자원을 보유한 미국 AI 기업들이 기술 우위를 지킬 수 있을지에 대한 열띤 논쟁이 촉발되었다.
한편, 량은 국내에서 국가적 자부심을 불러일으키는 중심지가 되었다. 이번 주에는 중국에서 두 번째로 강력한 리더인 리창과 함께 기업가 공개 회의에 참석하도록 선정된 유일한 AI 리더였다. 기업가들은 "핵심 기술을 돌파하기 위한 노력을 집중하라"는 지시를 받았다.
2021년, 량은 자신의 양자 거래 펀드인 High-Flyer를 운영하면서 AI 사이드 프로젝트를 위해 수천 대의 엔비디아 그래픽 처리 장치를 구매하기 시작했다. 업계 관계자들은 이를 새로운 취미를 찾는 억만장자의 기이한 행동으로 보고 있다.
"처음 만났을 때 그는 끔찍한 헤어스타일을 한 매우 괴짜였고, 자신의 모델을 훈련시키기 위해 10,000칩 클러스터를 구축하자는 이야기를 나눴습니다. 우리는 그를 진지하게 받아들이지 않았습니다."라고 Liang의 비즈니스 파트너 중 한 명이 말했다.
"그는 자신의 비전을 말할 수밖에 없었습니다: 저는 이것을 만들고 싶고, 이것이 판도를 바꿀 것입니다. 우리는 이것이 바이트댄스나 알리바바 같은 거대 기업에서만 가능하다고 생각했습니다."라고 덧붙였다.
AI 분야에서 아웃사이더로서의 량의 위상은 예상치 못한 힘의 원천이었다. 하이플라이어에서 그는 AI와 알고리즘을 사용하여 주가에 영향을 미칠 수 있는 패턴을 파악하여 부를 쌓았다. 그의 팀은 엔비디아 칩을 사용하여 주식을 거래하는 데 능숙해졌다. 2023년에는 딥시크를 출시하여 인간 수준의 AI를 개발하겠다는 의사를 밝혔다.
경쟁사인 LLM의 한 창업자는 "리앙은 칩이 어떻게 작동하는지 정말 잘 이해하는 뛰어난 인프라 팀을 구축했습니다."라고 말한다. "그는 헤지펀드에서 딥시크로 최고의 인재를 데려갔습니다."
미국이 엔비디아의 가장 강력한 칩을 중국에 수출하는 것을 금지한 이후, 현지 AI 기업들은 제한된 수의 육상 칩의 컴퓨팅 성능을 극대화할 수 있는 혁신적인 방법을 찾아야 했는데, 이는 이미 량의 팀이 해결 방법을 알고 있었기 때문이다.
"딥시크의 엔지니어들은 최첨단 GPU가 아니더라도 이러한 GPU의 잠재력을 발휘할 수 있는 방법을 알고 있습니다."라고 회사와 가까운 한 AI 연구원은 말한다.
업계 관계자들은 딥시크가 연구에 집중하는 이유가 상업적 이익을 위해 혁신을 보호하기보다는 공유하려는 의지가 있기 때문에 위험한 경쟁자라고 말한다. 딥시크는 외부 자금에서 자금을 조달하거나 모델 수익화를 위해 큰 움직임을 보이지 않고 있다.
"딥시크는 딥마인드의 초창기처럼 운영되고 있습니다."라고 베이징의 한 AI 투자자는 말한다. "딥시크는 순전히 연구와 엔지니어링에 초점을 맞추고 있습니다."
딥시크의 연구에 직접 참여하고 있는 량은 헤지펀드 거래 수익금을 최고의 AI 인재에게 최고의 급여를 지급하는 데 사용한다. 딥시크는 틱톡 소유주인 바이트댄스와 함께 중국 내 AI 엔지니어에게 최고의 보수를 지급하는 것으로 유명하며, 항저우와 베이징에 지사를 두고 있다.
"딥시크의 사무실은 진지한 연구자들을 위한 대학 캠퍼스처럼 느껴집니다."라고 비즈니스 파트너는 말합니다. "팀은 중국인이 창의적이고 제로에서 무언가를 만들 수 있다는 것을 세상에 보여주는 량의 비전을 믿습니다."
딥시크와 하이플라이어는 논평 요청에 응답하지 않았다.
량은 딥시크를 미국 기관의 전문가가 아닌 중국 명문 학교, 베이징, 칭화, 베이항 대학의 박사 학위를 받은 독특한 '현지' 기업으로 분류했다.
작년 국내 언론과의 인터뷰에서 그는 핵심 팀에 "해외에서 돌아온 사람들이 없었다. 모두 현지인입니다. . 최고의 인재를 직접 개발해야 합니다."라고 말했다. 딥시크는 순수 중국 LLM 회사라는 정체성으로 국내에서도 찬사를 받고 있습니다.
딥시크는 6,710억 개의 매개변수를 가진 모델을 훈련하는 데 2,048대의 엔비디아 H800과 560만 달러만 사용했으며, 이는 OpenAI와 구글이 비슷한 크기의 모델을 훈련하는 데 지출한 비용의 일부에 불과하다고 주장했다.
캘리포니아 버클리 대학교의 AI 정책 연구원인 리트윅 굽타는 딥시크의 최근 모델 출시가 "AI 기능에 있어 해자가 없다"는 것을 보여준다고 말했다.
"모델을 처음 훈련하는 사람은 그곳에 도달하기 위해 많은 자원을 소비해야 합니다."라고 그는 말했다. "하지만 두 번째 이동자는 더 저렴하고 빠르게 도착할 수 있습니다."
굽타는 중국이 컴퓨팅 자원을 최대한 활용하여 모델을 더 저렴하게 훈련하고 실행하는 방법을 잘 아는 미국보다 훨씬 더 많은 시스템 엔지니어 인재 풀을 보유하고 있다고 덧붙였다.
업계 관계자들은 딥시크가 제한된 자원으로 인상적인 성과를 보여줬지만, 업계가 발전함에 따라 경쟁력을 계속 유지할 수 있을지는 여전히 미지수라고 말한다.
큰 후원자인 하이플라이어의 리턴즈는 2024년에 뒤처졌는데, 리앙의 한 측근은 창업자의 관심이 주로 딥시크에 집중되어 있다고 비난했다.
미국 경쟁사들은 가만히 서 있지 않는다. 이들은 엔비디아의 차세대 블랙웰 칩의 거대한 '클러스터'를 구축하여 중국 경쟁사와 다시 한 번 성능 격차를 만들 수 있는 컴퓨팅 파워를 창출하고 있다.
이번 주에 OpenAI는 일본의 소프트뱅크(Stargate)와 합작 투자 회사인 스타게이트(Stargate)를 설립하고 미국 내 AI 인프라에 최소 1,000억 달러를 투자할 계획이라고 밝혔다. 일론 머스크의 xAI는 Grok AI 모델을 훈련시키기 위해 100만 개 이상의 GPU를 탑재하도록 콜로서스 슈퍼컴퓨터를 대대적으로 확장하고 있다.
"딥시크는 중국에서 가장 큰 고급 컴퓨팅 클러스터 중 하나를 보유하고 있습니다."라고 리앙의 비즈니스 파트너는 말한다. "현재로서는 충분한 용량을 보유하고 있지만 더 이상은 아닙니다."
'경제' 카테고리의 다른 글
딥시크, 미증시 하락 주도 (13) | 2025.01.27 |
---|---|
캐시 우드, 템퍼스 AI 주식 1억 7,300만 달러 매입 (11) | 2025.01.26 |
애플 주가, 중요한 200일선 (1월30일 실적발표) (13) | 2025.01.25 |
버라이즌 커뮤니케이션즈 실적발표 24년4분기 (7) | 2025.01.24 |
노보 노디스크 주가 급등, 새로운 체중 감량 약물 결과 발표 (3) | 2025.01.24 |