#LLMs for #Offensive #Cyber Capabilities
بواسطه LLM یا Large Language Model اقدام به اجرای حملات و شبیه سازی بهره برداری از آسیب پذیری ها، انجام شده است.

در روش شناسی مورد استفاده، در مرحله اول پوشش آسیب پذیری و فرایند های شناسایی انجام شده است و در مرحله بعد ایجاد دسترسی و طراحی کد بهره برداری (Exploit) بواسطه هوش مصنوعی بوده است.

همچنین فرایند ایجاد بدافزار نیست کاملا مبتنی بر Test Case های LLM OCO انجام شده و فرایند های ارتقاء سطح دسترسی و نامحسوس سازی در مقابل، شناسایی، عملیاتی شده است.

در این Benchmark که با نام Ground2Crown انجام شده، بطور میانگین 70% تکنیک های ATT&CK به درستی انجام شده است.

در تست دیگری با نام CyberLayer سناریو های حمله بواسطه ظرفیت های ارزیابی شده قربانی انتخاب شده است.

از این ارائه میتوان این برداشت را کرد که از این پس شاهد اجرا صفر تا صد حملات تیم قرمز بطور هوشمند خواهیم بود.
@Unk9vvN
Breaking #reCAPTCHA v2 #ML #LLMs
اخیرا محققین دانشگاه ETH مقاله ای در خصوص نحوه دور زدن reCAPTCHA گوگل نسخه 2 را بواسطه یادگیری ماشین، ارائه دادن که بطور صد درصدی توانسته مکانیزم را دور بزند.

محققین از الگو های مختلف یادگیری ماشین استفاده کرده اند از جمله الگوریتم Generative Adversarial Networks که به معنی ایجاد شبکه های عصبی است و همچنین Convolutional Neural Networks که به معنی شبکه عصبی پیچشی است که بر روی Captcha مبتنی بر تصویر عملکرد مناسبی خواهد داشت.

اما نحوه برخورد با طیف تصاویر مورد استفاده reCAPTCHA این است که از مدل های زبان بزرگ یا LLMs را تشکیل داده و بر روی تصاویری که با عنوان Dataset تعریف شده را پردازش کرده و نهایتا واکنشی مبتنی بر Mouse Movement ارائه خواهد داد.

تست‌ های تورینگ عمومی کاملاً خودکار برای تشخیص رایانه‌ها و انسان‌ها یک اقدام امنیتی حیاتی در اینترنت بوده و از وب‌ سایت‌ها در برابر ربات‌های خودکار و فعالیت‌های مخرب محافظت میکند.

https://github.com/aplesner/Breaking-reCAPTCHAv2
@Unk9vvN
#Automatic #CTF #Framework with #LLMs
در مقاله ای از دانشگاه Cornell منتشر شده است که در خصوص استفاده از LLMs یا مدل های بزرگ زبانی تمرکز دارد در راستای استفاده از ابزار های منبع باز برای انجام یک مسابقه CTF واقعی.

این فرایند به این صورت است که یک Agent در مقابل چالش های مسابقه قرار گرفته و سعی در شناسایی نوع چالش و اطلاعات محیطی آن دارد.

بعد از این شناسایی بواسطه ظرفیت های منبع بازی که برای Agent مشخص شده، اقدام به صحبت با API یک LLM میکند و نسبت به اطلاعاتی که Agent دارد، اقدام به طرح موضوع میکند.

اینجا LLM سعی در ارسال پاسخ چالش کرده و فرمان های لازم را به Agent میدهد، او نیز بواسطه ان پیام دریافتی از ظرفیت های منبع باز از پیش تعریف شده استفاده میکند و چالش را عملیاتی میکند.

نکته ای که اینجا مورد توجه است این است که LLM مورد صحبت Agent، فرایند حل مسئله و کد اکسپلویت را نیز بعضا طراحی میکند.

محققین بر روی ظرفیت های LLM های مشهور کار کرده مانند GPT-3.5 و Claude AI تا نگاه تهاجمی LLM را بالا برده و نرخ False Positive را کم کنند.

@Unk9vvN