✔️مدل جدید DeepSeek با بهبودهای چشمگیر بهروز شد؛ چالشی تازه برای OpenAI o3 و جمینای ٢.۵ پرو
🔅شرکت چینی #DeepSeek که با عرضه نسخه اولیه مدل استدلالی R1 توانسته بود سروصدای زیادی بکند، از مدل متنباز جدیدی با عنوان DeepSeek-R1-0528 رونمایی کرده که قابلیتهای آن در استدلال به اندازه زیادی ارتقا یافته است. از نظر عملکرد، این مدل به o3 از OpenAI و گوگل جمینای ٢.۵ پرو نزدیکتر شده است.
🔅عملکرد DeepSeek-R1-0528 در حوزههایی مانند ریاضیات، علوم و برنامهنویسی بهشکل محسوسی بهبود یافته است.
🔅براساس اطلاعات مدل منتشرشده در پلتفرم هاگینگفیس، DeepSeek-R1-0528 با استفاده از منابع محاسباتی بیشتر و بهینهسازیهای الگوریتمی پس از آموزش، بهبودهای چشمگیری در عملکرد نشان داده است. بهعنوان نمونه، دقت مدل در آزمون AIME 2025 از ٧٠ به ٨٧.۵ درصد رسیده و در حوزه برنامهنویسی عملکرد مدل در بنچمارک LiveCodeBench از ۶٣.۵ به ٧٣.٣ درصد افزایش یافته است. در آزمون دشوار Humanity’s Last Exam نیز دقت آن از ٨.۵ به ١٧.٧ درصد رسیده است.
🔰پایگاه خبری تحلیلی توانا👇👇👇
Https://tavananews.ir
@tavananews_ir
🔅شرکت چینی #DeepSeek که با عرضه نسخه اولیه مدل استدلالی R1 توانسته بود سروصدای زیادی بکند، از مدل متنباز جدیدی با عنوان DeepSeek-R1-0528 رونمایی کرده که قابلیتهای آن در استدلال به اندازه زیادی ارتقا یافته است. از نظر عملکرد، این مدل به o3 از OpenAI و گوگل جمینای ٢.۵ پرو نزدیکتر شده است.
🔅عملکرد DeepSeek-R1-0528 در حوزههایی مانند ریاضیات، علوم و برنامهنویسی بهشکل محسوسی بهبود یافته است.
🔅براساس اطلاعات مدل منتشرشده در پلتفرم هاگینگفیس، DeepSeek-R1-0528 با استفاده از منابع محاسباتی بیشتر و بهینهسازیهای الگوریتمی پس از آموزش، بهبودهای چشمگیری در عملکرد نشان داده است. بهعنوان نمونه، دقت مدل در آزمون AIME 2025 از ٧٠ به ٨٧.۵ درصد رسیده و در حوزه برنامهنویسی عملکرد مدل در بنچمارک LiveCodeBench از ۶٣.۵ به ٧٣.٣ درصد افزایش یافته است. در آزمون دشوار Humanity’s Last Exam نیز دقت آن از ٨.۵ به ١٧.٧ درصد رسیده است.
🔰پایگاه خبری تحلیلی توانا👇👇👇
Https://tavananews.ir
@tavananews_ir