Thuis > Nieuws > De betaalbaarheid van Deepseek is een mythe: de revolutionaire AI kostte eigenlijk $ 1,6 miljard om te ontwikkelen

De betaalbaarheid van Deepseek is een mythe: de revolutionaire AI kostte eigenlijk $ 1,6 miljard om te ontwikkelen

By OliviaApr 04,2025

De innovatieve chatbot van Deepseek heeft een aanzienlijke impact op de AI -markt gehad, wat zelfs een opmerkelijke daling van de aandelenkoers van Nvidia veroorzaakt. Het AI -model van het bedrijf, bekend om zijn geavanceerde architectuur- en trainingsmethoden, biedt gebruikers een unieke ervaring met het vermogen om verrassende en inzichtelijke antwoorden te bieden.

Het model van Deepseek valt op vanwege het gebruik van verschillende geavanceerde technologieën:

Multi-token voorspelling (MTP) : deze methode stelt het model in staat om meerdere woorden tegelijk te voorspellen, waardoor zowel nauwkeurigheid als efficiëntie wordt verbeterd door verschillende delen van een zin tegelijkertijd te analyseren.

Mix van experts (MOE) : Deepseek V3 maakt gebruik van 256 neurale netwerken, met acht geactiveerd voor elke tokenverwerkingstaak, het versnellen van AI -training en het stimuleren van prestaties.

Multi-head latente aandacht (MLA) : dit mechanisme richt zich op de meest kritieke delen van een zin, die herhaaldelijk belangrijke details extraheert om ervoor te zorgen dat er geen belangrijke informatie wordt gemist, waardoor het vermogen van de AI om nuances in de gegevens vast te leggen, wordt verbeterd.

Ondanks de claim van Deepseek om hun krachtige neurale netwerk te trainen, Deepseek V3, voor slechts $ 6 miljoen met behulp van 2048 grafische processors, onthult verdere analyse een meer substantiële investering in hun infrastructuur. Deepseek heeft een belangrijke computationele opstelling met ongeveer 50.000 NVIDIA -hopper GPU's, waaronder verschillende modellen zoals H800 en H100, verspreid over meerdere datacenters. Deze infrastructuur ondersteunt AI -training, onderzoek en financiële modellering, met een totale serverinvestering van ongeveer $ 1,6 miljard en operationele kosten van ongeveer $ 944 miljoen.

Deepseek, een dochteronderneming van het Chinese hedgefonds High Flyer, werd in 2023 afgesplitst om zich te concentreren op AI-technologieën. In tegenstelling tot veel startups die afhankelijk zijn van cloudproviders, bezit Deepseek zijn datacenters, waardoor volledige controle over AI -modeloptimalisatie en snellere innovatie -implementatie mogelijk is. De zelf gefinancierde status van het bedrijf verbetert zijn flexibiliteit en besluitvormingssnelheid.

Deepseek trekt toptalent van toonaangevende Chinese universiteiten, waarbij sommige onderzoekers jaarlijks meer dan $ 1,3 miljoen verdienen. De claim van het bedrijf over het trainen van Deepseek V3 voor slechts $ 6 miljoen is echter misleidend, omdat dit cijfer alleen GPU-gebruik tijdens pre-training verklaart en geen andere belangrijke kosten omvat, zoals onderzoek, modelverfijning, gegevensverwerking en infrastructuurkosten.

Sinds de start heeft Deepseek meer dan $ 500 miljoen geïnvesteerd in AI -ontwikkeling. De compacte structuur stelt het in staat om AI -innovaties actiever en effectiever te implementeren dan grotere, meer bureaucratische bedrijven. Hoewel het succes van Deepseek wordt gedreven door substantiële investeringen, technische doorbraken en een sterk team, is het idee van een "revolutionair budget" voor AI -modelontwikkeling enigszins overdreven.

Desalniettemin zijn de kosten van Deepseek nog steeds lager dan die van zijn concurrenten. Deepseek heeft bijvoorbeeld $ 5 miljoen uitgegeven aan het R1 -model, terwijl de training van Chatgpt4o $ 100 miljoen kostte.

Deepseek -test Afbeelding: ensigame.com

Deepseek V3 Afbeelding: ensigame.com

Diepeek Afbeelding: ensigame.com

Diepeek Afbeelding: ensigame.com

Vorig artikel:Bouwsimulator 4: Beheers bouwen met Expert tips Volgend artikel:"Installeer en speel planten versus zombies 2 op pc/Mac met Bluestacks"