پایگاه خبری تحلیلی توانا

✔️مدل جدید DeepSeek با بهبودهای چشمگیر به‌روز شد؛ چالشی تازه برای OpenAI o3 و جمینای ٢.۵ پرو

🔅شرکت چینی #DeepSeek که با عرضه نسخه اولیه مدل استدلالی R1 توانسته بود سروصدای زیادی بکند، از مدل‌ متن‌باز جدیدی با عنوان DeepSeek-R1-0528 رونمایی کرده که قابلیت‌های آن در استدلال به اندازه زیادی ارتقا یافته است. از نظر عملکرد، این مدل به o3 از OpenAI و گوگل جمینای ٢.۵ پرو نزدیک‌تر شده است.

🔅عملکرد DeepSeek-R1-0528 در حوزه‌هایی مانند ریاضیات، علوم و برنامه‌نویسی به‌شکل محسوسی بهبود یافته است.

🔅براساس اطلاعات مدل منتشرشده در پلتفرم هاگینگ‌فیس، DeepSeek-R1-0528 با استفاده از منابع محاسباتی بیشتر و بهینه‌سازی‌های الگوریتمی پس از آموزش، بهبودهای چشمگیری در عملکرد نشان داده است. به‌عنوان نمونه، دقت مدل در آزمون AIME 2025 از ٧٠ به ٨٧.۵ درصد رسیده و در حوزه برنامه‌نویسی عملکرد مدل در بنچ‌مارک LiveCodeBench از ۶٣.۵ به ٧٣.٣ درصد افزایش یافته است. در آزمون دشوار Humanity’s Last Exam نیز دقت آن از ٨.۵ به ١٧.٧ درصد رسیده است.

🔰پایگاه خبری تحلیلی توانا👇👇👇
Https://tavananews.ir
@tavananews_ir

46 viewsZahra Pourahmad, 10:50

About

Blog

Apps

Platform