Доступность DeepSeek - это миф: революционный ИИ на самом деле стоит 1,6 миллиарда долларов на разработку

Инновационный чат -бот Deepseek оказал значительное влияние на рынок искусственного интеллекта, даже вызывая заметное снижение цены акций Nvidia. Модель ИИ компании, известная своей передовой архитектурой и методами обучения, предлагает пользователям уникальный опыт с его способностью предоставлять удивительные и проницательные ответы.

Модель DeepSeek выделяется из-за его использования нескольких передовых технологий:

Multi-Token Production (MTP) : этот метод позволяет модели прогнозировать несколько слов одновременно, повышая как точность, так и эффективность, анализируя различные части предложения одновременно.

Смесь экспертов (MOE) : DeepSeek V3 использует 256 нейронных сетей, причем восемь активированы для каждой задачи обработки токенов, ускорение обучения ИИ и повышения производительности.

Многоугольное скрытое внимание (MLA) : этот механизм фокусируется на наиболее важных частях предложения, неоднократно извлекая ключевые детали, чтобы обеспечить отсутствие важной информации, тем самым улучшая способность ИИ собирать нюансы в данных.

Несмотря на утверждение Deepseek о обучении их мощной нейронной сети Deepseek V3, всего за 6 миллионов долларов США с использованием графических процессоров 2048, дальнейший анализ показывает более существенные инвестиции в их инфраструктуру. DeepSeek управляет значительной вычислительной установкой с около 50 000 графических процессоров Nvidia Hopper, включая различные модели, такие как H800 и H100, распространяющиеся по нескольким центрам обработки данных. Эта инфраструктура поддерживает обучение, исследования и финансовое моделирование искусственного интеллекта, общая сумма инвестиций на сервер составляет около 1,6 млрд. Долл. США, а эксплуатационные расходы составляют приблизительно 944 миллиона долларов.

Deepseek, дочерняя компания китайского хедж-фонда, была отруждена в 2023 году, чтобы сосредоточиться на технологиях искусственного интеллекта. В отличие от многих стартапов, которые полагаются на облачных провайдеров, Deepseek владеет своими центрами обработки данных, что позволяет полностью контролировать оптимизацию модели искусственного интеллекта и более быструю реализацию инноваций. Самофинансируемый статус компании повышает его гибкость и скорость принятия решений.

DeepSeek привлекает лучшие таланты ведущих китайских университетов, а некоторые исследователи зарабатывают более 1,3 миллиона долларов в год. Тем не менее, требование компании о обучении DeepSeek V3 всего за 6 миллионов долларов вводит в заблуждение, поскольку на этой цифре учитывается только использование графических процессоров во время предварительного обучения и не включает другие важные расходы, такие как исследования, уточнение модели, обработка данных и затраты на инфраструктуру.

С момента своего начала DeepSeek инвестировал более 500 миллионов долларов в разработку ИИ. Его компактная структура позволяет ему внедрять инновации искусственного интеллекта более активно и эффективно, чем более крупные, более бюрократические компании. В то время как успех Deepseek обусловлено существенными инвестициями, техническими прорывами и сильной командой, понятие «революционного бюджета» для разработки модели искусственного интеллекта несколько переоценивается.

Тем не менее, затраты DeepSeek по -прежнему ниже, чем у его конкурентов. Например, DeepSeek потратил 5 миллионов долларов на модель R1, а обучение CHATGPT4O стоило 100 миллионов долларов.

Тест DeepSeek Изображение: Ensigame.com

DeepSeek v3 Изображение: Ensigame.com

DeepSeek Изображение: Ensigame.com