هوش مصنوعی چینی با توانایی پردازش یک کتاب کامل: DeepSeek V3.1 رونمایی شد
▪️ استارتاپ چینی دیپسیک در اقدامی غیرمنتظره، از نسخه جدید مدل زبانی بزرگ خود با نام
▪️ این مدل که بر پایهی معماری Mixture-of-Experts ساخته شده، در تستهای کدنویسی Aider توانست با کسب نمره ۷۱٫۶ درصد، عملکردی بهتر از مدل قدرتمند Claude Opus 4 ثبت کند و به یکی از قویترین مدلهای کدنویسی متنباز تبدیل شود.
▪️ با اینحال، برخی کاربران معتقدند که پیشرفت چشمگیری در توانایی استدلال این مدل دیده نمیشود. مدل
#ai #DeepSeek
💡 آشنایی بیشتر با هوش مصنوعی جدید دیپسیک
🆔 @thezoomit
▪️ استارتاپ چینی دیپسیک در اقدامی غیرمنتظره، از نسخه جدید مدل زبانی بزرگ خود با نام
DeepSeek V3.1 رونمایی کرد. این مدل اکنون ظرفیت پردازش داده را به ۱۲۸ هزار توکن (معادل یک کتاب ۴۰۰ صفحهای) و تعداد پارامترها را به ۶۸۵ میلیارد افزایش داده است.▪️ این مدل که بر پایهی معماری Mixture-of-Experts ساخته شده، در تستهای کدنویسی Aider توانست با کسب نمره ۷۱٫۶ درصد، عملکردی بهتر از مدل قدرتمند Claude Opus 4 ثبت کند و به یکی از قویترین مدلهای کدنویسی متنباز تبدیل شود.
▪️ با اینحال، برخی کاربران معتقدند که پیشرفت چشمگیری در توانایی استدلال این مدل دیده نمیشود. مدل
V3.1 بهصورت متنباز و از طریق API در دسترس توسعهدهندگان قرار دارد.#ai #DeepSeek
💡 آشنایی بیشتر با هوش مصنوعی جدید دیپسیک
🆔 @thezoomit
❤76🔥24👎17👍13🤬1