Thuis Nieuws Deepseek AI -ontwikkelingskosten onthulden: $ 1,6 miljard, Debunking Betaalbaarheid Mythe

Deepseek AI -ontwikkelingskosten onthulden: $ 1,6 miljard, Debunking Betaalbaarheid Mythe

Auteur : Lily Apr 18,2025

De nieuwe chatbot van Deepseek heeft golven gemaakt in de AI -industrie en positioneert zichzelf als een formidabele concurrent. Het bedrijf introduceerde zijn AI met de intrigerende slogan: "Hallo, ik ben gemaakt zodat je alles kunt vragen en een antwoord kunt krijgen dat je misschien zou kunnen verrassen." Deze gedurfde verklaring is resoneerd met gebruikers, en vandaag hebben Deepseek's vooruitgang bijgedragen aan een van de grootste aandelenkoersdaling voor NVIDIA, wat de impact van zijn technologie benadrukt.

Deepseek -test Afbeelding: ensigame.com

Wat het model van DeepSeek onderscheidt, zijn de innovatieve architectuur- en trainingsmethoden. Hier zijn de belangrijkste technologieën die zijn ai van stroom voorzien:

Multi-Token Prediction (MTP): in tegenstelling tot traditionele modellen die één woord tegelijk voorspellen, voorspelt Deepseek's MTP-benadering meerdere woorden tegelijkertijd door verschillende delen van een zin te analyseren. Deze methode verbetert zowel de nauwkeurigheid als de efficiëntie van het model.

Mix van experts (MOE): deze architectuur maakt gebruik van verschillende neurale netwerken om invoergegevens te verwerken. Het versnelt AI -training en verbetert de prestaties. In Deepseek V3 worden 256 neurale netwerken gebruikt, waarbij er acht worden geactiveerd voor elke tokenverwerkingstaak.

Multi-head latente aandacht (MLA): dit mechanisme richt zich op de belangrijkste delen van een zin. MLA haalt herhaaldelijk sleuteldetails uit tekstfragmenten uit, waardoor de kans op het missen van belangrijke informatie wordt verminderd. Dit zorgt ervoor dat de AI cruciale nuances vastlegt in de invoergegevens.

Deepseek V3 Afbeelding: ensigame.com

Deepseek, een prominente Chinese startup, beweert een competitief AI -model te hebben ontwikkeld met minimale kosten, waarin staat dat ze slechts $ 6 miljoen hebben uitgegeven aan het trainen van het krachtige neurale netwerk Deepseek V3 en slechts 2048 grafische processors gebruikten. Uit analisten uit de semianalysis heeft echter aangetoond dat Deepseek een enorme computationele infrastructuur heeft die ongeveer 50.000 NVIDIA -hopper GPU's omvat, waaronder 10.000 H800 -eenheden, 10.000 meer geavanceerde H100's en extra H20 GPU's. Deze middelen worden verdeeld over verschillende datacenters en worden gebruikt voor AI -training, onderzoek en financiële modellering.

De totale investering van het bedrijf in servers bedraagt ​​ongeveer $ 1,6 miljard, met operationele kosten geschat op $ 944 miljoen. Deepseek is een dochteronderneming van het Chinese hedgefonds High-Flyer, dat de startup afspelde als een afzonderlijke divisie gericht op AI-technologieën in 2023. In tegenstelling tot de meeste startups die rekenkracht huren van cloudproviders, bezit Deepseek zijn eigen datacenters, waardoor het volledige controle over AI-modeloptimalisatie heeft en faster implementatie van innovaties. Het bedrijf blijft zelf gefinancierd, wat een positieve invloed heeft op zijn flexibiliteit en besluitvormingssnelheid.

Diepeek Afbeelding: ensigame.com

Bovendien verdienen sommige onderzoekers van Deepseek per jaar meer dan $ 1,3 miljoen en trekken ze toptalent aan van toonaangevende Chinese universiteiten (het bedrijf huurt geen buitenlandse specialisten in). Zelfs gezien dit, lijkt de recente claim van Deepseek om zijn nieuwste model te trainen voor slechts $ 6 miljoen onrealistisch. Dit figuur verwijst alleen naar de kosten van GPU-gebruik tijdens pre-training en houdt geen rekening met onderzoekskosten, modelverfijning, gegevensverwerking of algemene infrastructuurkosten.

Sinds de oprichting heeft Deepseek meer dan $ 500 miljoen geïnvesteerd in AI -ontwikkeling. In tegenstelling tot grotere bedrijven die worden belast door bureaucratie, stelt de compacte structuur van Deepseek echter in staat AI -innovaties actief en effectief te implementeren.

Diepeek Afbeelding: ensigame.com

Het voorbeeld van Deepseek toont aan dat een goed gefinancierd onafhankelijk AI-bedrijf kan concurreren met marktleiders. Desalniettemin benadrukken experts dat het succes van het bedrijf grotendeels te wijten is aan miljarden in investeringen, technische doorbraken en een sterk team, terwijl claims over een "revolutionair budget" voor het ontwikkelen van AI -modellen enigszins overdreven zijn. Toch blijven de kosten van concurrenten aanzienlijk hoger. Vergelijk bijvoorbeeld de kosten van modelopleiding: Deepseek heeft $ 5 miljoen uitgegeven aan R1, terwijl Chatgpt4o $ 100 miljoen kostte.

Laatste artikelen Meer
  • Children of Morta voegt online coöperatie toe aan een nieuwe update

    Kinderen van Morta, de geliefde top-down hack 'n Slash RPG bekend om zijn unieke gezinsgerichte verhalende en roguelike elementen, is net nog meer betrokken geworden met de toevoeging van online coöperatie. Deze nieuwste update brengt een nieuwe dimensie in het spel, waardoor spelers kunnen samenwerken met vrienden en

    Jun 26,2025
  • DK Rap Composer onthult gebrek aan krediet in Super Mario Bros. Film

    Grant Kirkhope, de veelgeprezen componist achter iconische soundtracks van videogames zoals Donkey Kong 64, heeft onlangs inzichten gedeeld in waarom hij niet werd gecrediteerd in de Super Mario Bros.-film voor zijn werk over de nu beroemde DK Rap.in een onthullend interview met Eurogamer, Kirkhope, Kirkhope, Kirkhope, Kirkhope, Kirkhope, Kirkhope, Kirkhope, Kirkhope, Kirkhope, Kirkhope, Kirkhope, Kirkhope, Kirkhope, Kirkhope, Kirkhoop

    Jun 26,2025
  • DC Dark Legion ™: toppersonages onthuld

    DC: Dark Legion biedt een uitgebreide selectie van legendarische helden en schurken uit het DC -universum, waardoor een diepe strategische ervaring levert waarbij teamsamenstelling en karaktersynergie cruciale rol spelen bij het bepalen van de overwinning. Of je nu een krachtige superheld ploeg verzamelt of een sinister maakt

    Jun 26,2025
  • Pandoland en Hatsune Miku bundelen hun krachten voor een beperkte tijd blocky avontuur

    In een heerlijke fusie van virtuele popcultuur en mobiel gaming, is Pandoland, de 3D Open-World RPG ontwikkeld door Wonder Planet in samenwerking met Game Freak, gepland om enkele van de meest iconische digitale sterren te verwelkomen-Hatsune Miku, Kagamine Rin en Kagamine Len. Deze geliefde vocaloid artiesten zijn stap

    Jun 26,2025
  • Danmachi Battle Chronicle EOS: Offline -versie om te blijven

    De populaire 3D -actie RPG *Danmachi Battle Chronicle *, officieel bekend als *Is het verkeerd om meisjes in een kerker op te halen? Battle Chronicle*, heeft zijn End of Service (EOS) aangekondigd. Aiming, de ontwikkelaar en uitgever van de game, heeft bevestigd dat de titel permanent zal worden afgesloten.

    Jun 26,2025
  • Eevee keert terug voor Pokémon Go juli Community Day Classic

    Nadat Jangmo-O schijnt tijdens Pokémon Go's June Community Day op de 21e, gaat de opwinding door in juli. De schijnwerpers verschuiven naar een geliefde fanfavoriet voor de volgende Community Day Classic. Eevee, de Evolution Pokémon, staat vanaf 14.00 en 6 juli centraal in het weekend van 2:00

    Jun 25,2025