소식 DeepSeek AI Development Picts 공개 : 16 억 달러, Debunking Affordability Myth

DeepSeek AI Development Picts 공개 : 16 억 달러, Debunking Affordability Myth

작가 : Lily Apr 18,2025

DeepSeek의 새로운 챗봇은 AI 업계에서 파도를 만들어 강력한 경쟁자로 자리 매김했습니다. 이 회사는 흥미로운 태그 라인으로 AI를 소개했습니다. "안녕하세요, 나는 당신이 무엇이든 물어보고 당신을 놀라게 할 수있는 답을 얻을 수 있도록 만들어졌습니다." 이 대담한 진술은 사용자들과 공명했으며 오늘날 DeepSeek의 발전은 Nvidia의 가장 큰 주가 하락 중 하나에 기여하여 기술의 영향을 강조했습니다.

Deepseek 테스트 이미지 : ensigame.com

DeepSeek의 모델을 차별화하는 것은 혁신적인 아키텍처 및 교육 방법입니다. 다음은 AI에 전원을 공급하는 주요 기술입니다.

MTP (Multi-Token Prediction) : 한 번에 한 단어를 예측하는 전통적인 모델과 달리 DeepSeek의 MTP 접근 방식은 문장의 다른 부분을 분석하여 여러 단어를 동시에 예측합니다. 이 방법은 모델의 정확도와 효율성을 모두 향상시킵니다.

전문가 (MOE)의 혼합 : 이 아키텍처는 입력 데이터를 처리하기 위해 다양한 신경망을 사용합니다. AI 교육을 가속화하고 성능을 향상시킵니다. DeepSeek V3에서는 256 개의 신경망이 사용되며 각 토큰 처리 작업마다 8 개가 활성화됩니다.

다중 헤드 잠재주의 (MLA) : 이 메커니즘은 문장의 가장 중요한 부분에 중점을 둡니다. MLA는 텍스트 조각에서 주요 세부 사항을 반복적으로 추출하여 중요한 정보가 누락 될 가능성을 줄입니다. 이를 통해 AI는 입력 데이터에서 중요한 뉘앙스를 캡처합니다.

Deepseek V3 이미지 : ensigame.com

저명한 중국 스타트 업인 Deepseek은 최소한의 비용으로 경쟁력있는 AI 모델을 개발했다고 주장하며, 강력한 신경망 DeepSeek V3를 훈련시키는 데 6 백만 달러를 소비했으며 2048 개의 그래픽 프로세서를 사용했다고 말합니다. 그러나 Semianalysis의 분석가들은 DeepSeek이 10,000 H800 단위, 10,000 개의 고급 H100 및 추가 H20 GPU를 포함하여 약 50,000 NVIDIA HOPPER GPU를 포함하는 광범위한 계산 인프라를 운영하고 있음을 밝혀 냈습니다. 이러한 리소스는 여러 데이터 센터에 배포되며 AI 교육, 연구 및 재무 모델링에 사용됩니다.

이 회사의 서버에 대한 총 투자는 약 16 억 달러에 달하며 운영비는 9 억 9,400 만 달러로 추정됩니다. DeepSeek은 중국 헤지 펀드 하이 플라이어의 자회사로, 2023 년 AI 기술에 중점을 둔 별도의 부문으로 스타트 업을 시작했습니다. 클라우드 제공 업체의 컴퓨팅 전력을 임대하는 대부분의 스타트 업과 달리 자체 데이터 센터를 소유하고있어 AI 모델 최적화를 완전히 제어하고 더 빠른 혁신 구현을 가능하게합니다. 회사는 자체 자금을 유지하고 있으며 유연성과 의사 결정 속도에 긍정적 인 영향을 미칩니다.

Deepseek이미지 : ensigame.com

또한 Deepseek의 일부 연구원들은 매년 130 만 달러 이상을 벌어 중국 대학에서 최고의 인재를 유치합니다 (회사는 외국 전문가를 고용하지 않습니다). 이를 고려해도 DeepSeek의 최근 최신 모델을 6 백만 달러에 훈련 한 주장은 비현실적으로 보입니다. 이 수치는 사전 훈련 중 GPU 사용 비용만을 의미하며 연구 비용, 모델 개선, 데이터 처리 또는 전체 인프라 비용을 설명하지 않습니다.

DeepSeek은 처음부터 AI 개발에 5 억 달러 이상을 투자했습니다. 그러나 관료주의에 의해 부담이되는 대기업과 달리 DeepSeek의 소형 구조는 AI 혁신을 적극적으로 효과적으로 구현할 수있게합니다.

Deepseek이미지 : ensigame.com

DeepSeek의 예는 잘 자금을 지원하는 독립 AI 회사가 업계 리더와 경쟁 할 수 있음을 보여줍니다. 그럼에도 불구하고 전문가들은 회사의 성공이 수십억의 투자, 기술 혁신 및 강력한 팀으로 인한 반면, AI 모델 개발을위한 "혁명 예산"에 대한 주장은 다소 과장되어 있다고 강조합니다. 그럼에도 불구하고 경쟁 업체의 비용은 상당히 높아집니다. 예를 들어, 모델 교육 비용 비교 : DeepSeek은 R1에 5 백만 달러를 소비 한 반면 ChatGpt4o는 1 억 달러가 들었습니다.

최신 기사
  • Morta의 Children은 새로운 업데이트에 온라인 협동 조합을 추가합니다

    독특한 가족 중심의 이야기와 로관과 같은 요소로 유명한 사랑스러운 하향식 해킹 'N 슬래시 rpg 인 Morta의 아이들은 온라인 협동 조합의 추가에 더욱 관여 해 왔습니다. 이 최신 업데이트는 게임에 새로운 차원을 제공하여 플레이어가 친구들과 팀을 이루고

    Jun 26,2025
  • DK 랩 작곡가 슈퍼 마리오 브라더스 영화에서 신용 부족을 공개

    Donkey Kong 64와 같은 상징적 인 비디오 게임 사운드 트랙 뒤에있는 유명한 작곡가 인 Grant Kirkhope는 최근 유로 가머와의 공개 인터뷰에서 현재 유능한 DK 랩에 대한 그의 작품에 대한 슈퍼 마리오 브라더스 영화에서 인정받지 않은 이유에 대한 통찰력을 공유했습니다.

    Jun 26,2025
  • DC Dark Legion ™ : 최고의 캐릭터가 공개되었습니다

    DC : Dark Legion은 DC 우주의 전설적인 영웅과 악당들로 구성된 광대 한 명단을 제공하여 팀 구성과 캐릭터 시너지가 승리를 결정하는 데 중요한 역할을하는 깊은 전략적 경험을 제공합니다. 강력한 슈퍼 히어로 팀을 조립하든 불길한

    Jun 26,2025
  • Pandoland와 Hatsune Miku는 제한된 시간 Blocky Adventure에 힘을 합쳐

    Pandoland 인 Pandoland의 가상 팝 문화와 모바일 게임의 유쾌한 융합에서 Wonder Planet이 개발 한 3D 오픈 월드 RPG는 Game Freak과 공동으로 개발되었으며 가장 상징적 인 디지털 스타 (Hatsune Miku, Kagamine Rin 및 Kagamine Len)를 환영합니다. 이 사랑하는 보컬 로이드 아티스트는 단계입니다

    Jun 26,2025
  • Danmachi Battle Chronicle EOS : 오프라인 버전이 남아 있습니다

    인기있는 3D 액션 RPG *Danmachi Battle Chronicle *, 공식적으로 *Dungeon에서 소녀를 데리러 가려고하는 것은 잘못입니까? Battle Chronicle*은 서비스 종료 (EOS)를 발표했습니다. 게임의 개발자이자 게시자 인 AIMBEN은 타이틀이 영구적으로 종료 될 것이라고 확인했습니다.

    Jun 26,2025
  • Eevee는 Pokémon Go 7 월 커뮤니티 데이 클래식으로 돌아옵니다

    21 일 Pokémon Go의 June Community Day에서 Jangmo-O가 빛을 발한 후, 흥분은 7 월까지 계속됩니다. 스포트라이트는 다음 커뮤니티 데이 클래식을 위해 사랑하는 팬이 좋아하는 팬으로 바뀌고 있습니다. Evolution Pokémon 인 Eevee는 7 월 5 일과 6 일 주말에 2 시부 터 중심에 있습니다.

    Jun 25,2025