DeepSeek V۴ معرفی شد

دیپ‌سیک V4 مهم‌ترین به‌روزرسانی این شرکت پس از مدل جنجالی R1 محسوب می‌شود.

DeepSeek V4 معرفی شد

به گزارش چابک آنلاین، استارتاپ چینی دیپ‌سیک (DeepSeek) سرانجام پیش‌نمایش مدل زبانی مورد انتظار V4 خود را منتشر کرد. کاربران هم‌اکنون می‌توانند نسخه آزمایشی این مدل را برای بررسی قابلیت‌ها و ویژگی‌های جدید آن آزمایش کنند. دیپ‌سیک V4 مهم‌ترین به‌روزرسانی این شرکت پس از مدل جنجالی R1 محسوب می‌شود.

 

مطابق رویکرد قبلی این شرکت، V4 نیز به‌صورت متن‌باز (Open Source) منتشر شده و توسعه‌دهندگان می‌توانند کد آن را دانلود، به‌صورت محلی اجرا و برای سناریوهای مختلفی شخصی‌سازی کنند. این ویژگی همچنان یکی از نقاط تمایز اصلی دیپ‌سیک نسبت به برخی رقبای بزرگ محسوب می‌شود.

نسخه Pro و Flash دیپ‌سیک V4

دیپ‌سیک این مدل را در دو نسخه Pro و Flash ارائه کرده که اندازه آنها متفاوت است. درحالی‌که هر دو مدل دارای پنجره محتوایی برابر با ۱ میلیون توکن هستند، تفاوت اصلی آنها در تعداد کل پارامترها و پارامترهای فعال (تعداد پارامترهایی که برای پردازش یک ورودی (مثلاً یک پاسخ) استفاده می‌شوند) است. نسخه پرو دارای ۱.۶ تریلیون پارامتر کل و ۴۹ میلیارد پارامتر فعال است، درحالی‌که نسخه Flash کوچک‌تر بوده و شامل ۲۸۴ میلیارد پارامتر کل و ۱۳ میلیارد پارامتر فعال می‌شود.

 

به‌گفته این شرکت، V4 در حوزه‌هایی مانند وظایف مبتنی‌بر ایجنت، پردازش دانش و استنتاج عملکرد قدرتمندی در برابر رقبا، به‌ویژه مدل‌های چینی، داشته است. همچنین هزینه استنتاج (منابع پردازشی و هزینه مالی اجرای مدل برای تولید خروجی) در این مدل بسیار پایین‌تر از نسل‌های قبلی است.

یکی از محورهای مهم V4، تمرکز آن بر ایجنت‌های هوش مصنوعی (AI Agents) است. دیپ‌سیک اعلام کرده این مدل برای کار با ابزارهای محبوبی مانند Claude Code و OpenClaw بهینه شده است. به گفته تحلیلگران، همین موضوع می‌تواند V4 را به گزینه‌ای جدی برای توسعه‌دهندگان ایجنت‌ها تبدیل کند.

عملکرد DeepSeek V4 در بنچمارک‌ها

نتایج بنچمارک‌های ارائه شده توسط DeepSeek نشان می‌دهد که مدل DS-V4-Pro Max در چند شاخص مهم عملکرد رقابتی و در بعضی موارد غافلگیرکننده‌ای داشته، هرچند در برخی حوزه‌ها هنوز از رقبای خود عقب‌تر است.

 

در بنچمارک MMLU-Pro که یکی از مهم‌ترین معیارها در زمینه دانش و استدلال محسوب می‌شود، DeepSeek V4 Pro امتیاز 87.5 را دریافت کرده که با GPT-5.4 xHigh برابر است. البته گوگل با مدل Gemini 3.1 Pro High و امتیاز 91.0 عملکرد بهتری داشته و آنتروپیک با Opus-4.6 امتیاز 89.1 را کسب کرده است.

یکی از نقاط قوت مهم مد جدید دیپ‌سیک در بنچمارک LiveCodeBench برای بررسی توانایی مدل در برنامه‌نویسی دیده می‌شود. در این معیار، DeepSeek V4 Pro امتیاز 93.5 را ثبت کرده و از Opus-4.6 با امتیاز 88.8، مدل K2.6 Thinking امتیاز با 89.6 و حتی Gemini 3.1 Pro با امتیاز 91.7 عملکرد بهتری داشته است. در بنچمارک ریاضی IMOAnswerBench نیز V4 با کسب امتیاز 89.8 عملکرد خوبی داشته و فقط GPT-5.4 با 91.4 جلوتر از آن قرار دارد.

یکی از پرسش‌های کلیدی پیرامون V4، تراشه‌های مورد استفاده برای آموزش و اجرای آن است. درحالی‌که هواوی اخیراً تأیید کرده بود خوشه پردازشی جدید مبتنی‌بر پردازنده‌های Ascend AI این شرکت می‌تواند از V4 پشتیبانی کند اما هنوز دقیقاً مشخص نیست در آموزش مدل چه میزان از تراشه‌های هواوی در مقایسه با انویدیا استفاده شده است.

بااین‌حال، برخی تحلیلگران استفاده از تراشه‌های هواوی را گامی مهم برای خودکفایی چین در حوزه هوش مصنوعی می‌دانند؛ به‌ویژه در شرایطی که محدودیت‌های صادراتی آمریکا دسترسی چین به پیشرفته‌ترین تراشه‌های هوش مصنوعی را محدود کرده است. اخیراً مدیرعامل انویدیا گفته بود که ترکیب دیپ‌سیک با تراشه‌های هواوی سلطه آمریکا را به خطر می‌اندازد.

بازار نیز به انتشار مدل جدید DeepSeek واکنش نشان داده و سهام تولیدکنندگان قراردادی تراشه در هنگ‌کنگ، ازجمله SMIC و Hua Hong Semiconductor به‌ترتیب ۹ و ۱۵ درصد رشد کرده است. OpenAI نیز شب گذشته از مدل GPT-5.5 رونمایی کرده بود.

نسخه‌های مدل جدید DeepSeek هم‌اکنون در پلتفرم HuggingFace در دسترس قرار دارند و مدل‌های قدیمی deepseek-chat و deepseek-reasoner در تاریخ 24 ژوئیه بازنشسته می‌شوند.

منبع: دیجیاتو
copied
نظر بگذارید