ডিপসেকের উদ্ভাবনী চ্যাটবট এআই বাজারে উল্লেখযোগ্য প্রভাব ফেলেছে, এমনকি এনভিডিয়ার শেয়ারের দামের উল্লেখযোগ্য হ্রাস পেয়েছে। সংস্থার এআই মডেল, এর উন্নত আর্কিটেকচার এবং প্রশিক্ষণ পদ্ধতির জন্য পরিচিত, ব্যবহারকারীদের আশ্চর্যজনক এবং অন্তর্দৃষ্টিপূর্ণ উত্তরগুলি সরবরাহ করার ক্ষমতা সহ একটি অনন্য অভিজ্ঞতা সরবরাহ করে।
বেশ কয়েকটি কাটিয়া-এজ প্রযুক্তি ব্যবহারের কারণে ডিপসিকের মডেলটি দাঁড়িয়ে আছে:
মাল্টি-টোকেন পূর্বাভাস (এমটিপি) : এই পদ্ধতিটি একই সাথে একটি বাক্যটির বিভিন্ন অংশ বিশ্লেষণ করে যথার্থতা এবং দক্ষতা উভয়ই বাড়িয়ে তোলে, মডেলটিকে একবারে একাধিক শব্দের পূর্বাভাস দিতে দেয়।
বিশেষজ্ঞদের মিশ্রণ (এমওই) : ডিপসেক ভি 3 প্রতিটি টোকেন প্রসেসিং টাস্কের জন্য আটটি সক্রিয়, এআই প্রশিক্ষণকে ত্বরান্বিত করে এবং উত্সাহের কর্মক্ষমতা বাড়িয়ে 256 নিউরাল নেটওয়ার্ক ব্যবহার করে।
মাল্টি-হেডের সুপ্ত মনোযোগ (এমএলএ) : এই প্রক্রিয়াটি কোনও বাক্যটির সর্বাধিক সমালোচনামূলক অংশগুলিতে মনোনিবেশ করে, কোনও গুরুত্বপূর্ণ তথ্য মিস না করে তা নিশ্চিত করার জন্য বারবার মূল বিবরণগুলি বের করে, এইভাবে ডেটাগুলিতে সূক্ষ্মতাগুলি ক্যাপচার করার এআইয়ের ক্ষমতা উন্নত করে।
ডিপসিকের তাদের শক্তিশালী নিউরাল নেটওয়ার্ক, ডিপসেক ভি 3 প্রশিক্ষণের দাবি সত্ত্বেও, 2048 গ্রাফিক্স প্রসেসর ব্যবহার করে মাত্র million মিলিয়ন ডলারে, আরও বিশ্লেষণ তাদের অবকাঠামোতে আরও উল্লেখযোগ্য বিনিয়োগ প্রকাশ করে। ডিপসেক একাধিক ডেটা সেন্টারে ছড়িয়ে থাকা এইচ 800 এবং এইচ 100 এর মতো বিভিন্ন মডেল সহ প্রায় 50,000 এনভিডিয়া হপার জিপিইউগুলির সাথে একটি উল্লেখযোগ্য গণনামূলক সেটআপ পরিচালনা করে। এই অবকাঠামো এআই প্রশিক্ষণ, গবেষণা এবং আর্থিক মডেলিংকে সমর্থন করে, মোট সার্ভার বিনিয়োগ প্রায় $ 1.6 বিলিয়ন এবং প্রায় 944 মিলিয়ন ডলার অপারেশনাল ব্যয়।
চীনা হেজ ফান্ডের হাই-ফ্লায়ারের সহায়ক সংস্থা ডিপসেক এআই প্রযুক্তিগুলিতে মনোনিবেশ করার জন্য ২০২৩ সালে ছিটকে গিয়েছিল। ক্লাউড সরবরাহকারীদের উপর নির্ভর করে এমন অনেক স্টার্টআপগুলির বিপরীতে, ডিপসেক তার ডেটা সেন্টারগুলির মালিক, এআই মডেল অপ্টিমাইজেশন এবং দ্রুত উদ্ভাবন বাস্তবায়নের উপর সম্পূর্ণ নিয়ন্ত্রণের অনুমতি দেয়। সংস্থার স্ব-অর্থায়িত স্থিতি তার নমনীয়তা এবং সিদ্ধান্ত গ্রহণের গতি বাড়ায়।
ডিপসেক শীর্ষস্থানীয় চীনা বিশ্ববিদ্যালয়গুলি থেকে শীর্ষ প্রতিভা আকর্ষণ করে, কিছু গবেষক বার্ষিক ১.৩ মিলিয়ন ডলারের বেশি আয় করেন। তবে, কেবলমাত্র million মিলিয়ন ডলারের জন্য ডিপসেক ভি 3 প্রশিক্ষণ দেওয়ার সংস্থার দাবিটি বিভ্রান্তিকর, কারণ এই চিত্রটি কেবল প্রাক-প্রশিক্ষণের সময় জিপিইউ ব্যবহারের জন্য অ্যাকাউন্ট করে এবং গবেষণা, মডেল পরিশোধন, ডেটা প্রসেসিং এবং অবকাঠামোগত ব্যয়ের মতো অন্যান্য উল্লেখযোগ্য ব্যয়কে অন্তর্ভুক্ত করে না।
শুরু হওয়ার পর থেকে ডিপসেক এআই বিকাশে 500 মিলিয়ন ডলারেরও বেশি বিনিয়োগ করেছে। এর কমপ্যাক্ট কাঠামো এটিকে বৃহত্তর, আরও আমলাতান্ত্রিক সংস্থার চেয়ে আরও সক্রিয় এবং কার্যকরভাবে এআই উদ্ভাবনগুলি বাস্তবায়নে সক্ষম করে। যদিও ডিপসিকের সাফল্য যথেষ্ট বিনিয়োগ, প্রযুক্তিগত অগ্রগতি এবং একটি শক্তিশালী দল দ্বারা পরিচালিত হয়, তবে এআই মডেল বিকাশের জন্য একটি "বিপ্লবী বাজেট" ধারণাটি কিছুটা বাড়াবাড়ি করা হয়েছে।
তা সত্ত্বেও, ডিপসিকের ব্যয়গুলি এর প্রতিযোগীদের তুলনায় এখনও কম। উদাহরণস্বরূপ, ডিপসেক আর 1 মডেলটিতে 5 মিলিয়ন ডলার ব্যয় করেছে, যখন চ্যাটজিপিটি 4 ও -র প্রশিক্ষণের জন্য $ 100 মিলিয়ন ডলার ব্যয় হয়েছে।
চিত্র: ensigame.com
চিত্র: ensigame.com
চিত্র: ensigame.com
চিত্র: ensigame.com