Deepseeks innovativer Chatbot hat einen erheblichen Einfluss auf den KI -Markt erzielt und selbst einen bemerkenswerten Rückgang des Aktienkurs von NVIDIA verursacht. Das KI -Modell des Unternehmens, bekannt für seine fortschrittlichen Architektur- und Trainingsmethoden, bietet Benutzern ein einzigartiges Erlebnis mit seiner Fähigkeit, überraschende und aufschlussreiche Antworten zu geben.
Das Modell von Deepseek stammt aufgrund der Verwendung mehrerer modernster Technologien:
Multi-Token-Vorhersage (MTP) : Mit dieser Methode kann das Modell mehrere Wörter gleichzeitig vorhergesagt, wodurch sowohl die Genauigkeit als auch die Effizienz durch Analyse verschiedener Teile eines Satzes gleichzeitig analysiert werden.
Mischung von Experten (MOE) : Deepseek V3 verwendet 256 neuronale Netzwerke, wobei acht für jede Token -Verarbeitungsaufgabe aktiviert werden und die KI -Schulung beschleunigt und die Leistung erhöht.
Multi-Head Latent Achtung (MLA) : Dieser Mechanismus konzentriert sich auf die kritischsten Teile eines Satzes und extrahiert wiederholt wichtige Details, um sicherzustellen, dass keine wichtigen Informationen übersehen werden, wodurch die Fähigkeit der KI verbessert wird, Nuancen in den Daten zu erfassen.
Trotz Deepseeks Behauptung, ihr leistungsstarkes neuronales Netzwerk Deepseek V3 für nur 6 Millionen US -Dollar mit 2048 Grafikprozessoren auszubilden, zeigt eine weitere Analyse eine bessere Investition in ihre Infrastruktur. Deepseek betreibt ein bedeutendes Rechenaufbau mit rund 50.000 NVIDIA Hopper -GPUs, einschließlich verschiedener Modelle wie H800 und H100, die sich über mehrere Rechenzentren verteilt haben. Diese Infrastruktur unterstützt KI -Schulungen, Forschung und Finanzmodellierung mit einer Gesamtinvestition von rund 1,6 Milliarden US -Dollar und Betriebskosten von ca. 944 Mio. USD.
Deepseek, eine Tochtergesellschaft des chinesischen Hedgefonds-High-Flyer, wurde 2023 ausgeschaltet, um sich auf KI-Technologien zu konzentrieren. Im Gegensatz zu vielen Startups, die sich auf Cloud -Anbieter verlassen, besitzt Deepseek seine Rechenzentren und ermöglicht die volle Kontrolle über die Optimierung des AI -Modells und eine schnellere Implementierung von Innovationen. Der selbstfinanzierte Status des Unternehmens verbessert seine Flexibilität und Entscheidungsgeschwindigkeit.
Deepseek zieht Top -Talente von führenden chinesischen Universitäten an, wobei einige Forscher jährlich über 1,3 Millionen US -Dollar verdienen. Die Behauptung des Unternehmens, Deepseek V3 für nur 6 Millionen US-Dollar auszubilden, ist jedoch irreführend, da diese Zahl nur die GPU-Nutzung während der Vorinstallation ausmacht und keine weiteren wesentlichen Ausgaben wie Forschung, Modellverfeinerung, Datenverarbeitung und Infrastrukturkosten enthält.
Seit seinem Start hat Deepseek über 500 Millionen US -Dollar in die KI -Entwicklung investiert. Seine kompakte Struktur ermöglicht es ihm, KI -Innovationen aktiver und effektiv umzusetzen als größere, bürokratischere Unternehmen. Während Deepseeks Erfolg von erheblichen Investitionen, technischen Durchbrüchen und einem starken Team angetrieben wird, ist der Begriff eines "revolutionären Budgets" für die Entwicklung der KI -Modellentwicklung etwas überbewertet.
Trotzdem sind die Kosten von Deepseek immer noch niedriger als die seiner Konkurrenten. Zum Beispiel gab Deepseek 5 Millionen US -Dollar für das R1 -Modell aus, während Chatgpt4O Training 100 Millionen US -Dollar kostete.
Bild: Ensigame.com
Bild: Ensigame.com
Bild: Ensigame.com
Bild: Ensigame.com