باشگاه فناوران اطلاعات مکانی
1.64K subscribers
1.01K photos
239 videos
317 files
745 links
Geospatial Information Technologists Association(GITA)
💠 نوآوری و خلق ارزش با فناوری اطلاعات مکانی
💠حامی استارت آپ های ژئوماتیک
🔷️WebGIS,2D/3D/4D GIS,SDI
🔷️Python, Machine /Deep Learning
🔷️AI, Smart Home&City,BIM
09124320328
@Fazel_Shahcheragh
Download Telegram
دمیس هاسابیس از ترند‌های این‌روزها کیه؟
احتمالا اسم هاسابیس رو این روز‌ها زیاد بشنوید، یا شایدم از قبل میشناسیدش.
سال ۱۹۷۶ توی لندن به دنیا میاد، تو کمبریج درس میخونه، با استدیوهای بازی‌سازی کار میکنه پول خوبی به دست میاره بعد وارد بخش تحقیقات علوم اعصاب دانشگاه لندن میشه، اونجا تلاش میکنه از مغز انسان الگوریتم‌هایی بسازه که برای ساخت AI ازشون کمک بگیره.
بعد همین راه رو توی دانشگاه MIT و هاروراد دنبال میکنه، مقالات علمی مهمی در مورد هوش و حافظه انسان منتشر میکنه تا جایی که مجلسه Science همون سال به عنوان ۱۰ دستاورد برتر علمی سال مقالشو انتخاب میکنن.
مشاور هوش‌مصنوعی دولت بریتانیا میشه، سال ۲۰۱۷ به بعوان ۱۰۰ شخص تاثیرگذار سال مجله تایم انتخاب میشه و کمپانی دیپ‌مایند رو تاسیس میکنه.
کمپانی که میشه گفت از اولین‌های دنیای AI بود، تقریبا ۵ سال قبل از OpenAI تاسیس میشه.
نهایتا سال ۲۰۱۴ گوگل این شرکت رو به مبلغ ۴۰۰ میلیون پوند خریداری میکنه.
الان هم مدیرعامل Google DeepMind هست و میشه گفت بخش AI گوگل رو رهبری میکنه.
https://rahdigital.ir/demis-hassabis/


🆔 @GITAnet|باشگاه فناوران اطلاعات مکانی
با گسترش استفاده از LLM ها در اپلیکیشن‌های تحت وب، و باتوجه به ماهیت غیرقطعی عمل‌کرد آن‌ها، آسیب‌پذیری‌های امنیتی جدیدی پدید آمده‌اند؛ مانند:
- Prompt Injection
- Data Leakage
- Inadequate Sandboxing
- Unauthorized Code Execution
- Model DoS
- Information Disclosure
و …
بنابراین، نیاز به یک دیواره‌ی آتش مناسب برای قرار گرفتن در جلوی مدل‌ها و بررسی درخواست‌ها برای تشخیص سواستفاده بیشتر از پیش حس می‌شود.


۱۰ آسیب‌پذیری در اپلیکیشن‌های مبتنی بر LLM ها به‌گفته‌ی OWASP
https://owasp.org/www-project-top-10-for-large-language-model-applications/

شرکت Cloudflare که جزو بزرگ‌ترین شرکت‌های ارائه‌دهنده‌ی خدمات ابری، CDN و امنیت سایبری و … است، از محصول جدید خود که یک دیواره‌ی آتش (Firewall) برای قرار گرفتن در جلوی LLM هاست، رونمایی کرد. محصول Firewall for AI در واقع یک WAF است که علاوه بر قابلیت‌های مرسوم مانند کنترل rate limit و جلوگیری از injection، قابلیت تحلیل پرامپت‌ها برای تشخیص سوءنیت را نیز دارد.

https://blog.cloudflare.com/firewall-for-ai/


🆔 @GITAnet|باشگاه فناوران اطلاعات مکانی
🔴 مدل claude 3 معرفی شد

الان میتونید رایگان با مدل جدید claude 3 یعنی Sonnet چت کنید، البته ظاهرا شاهکارش روی نسخه Opus هست که توی خیلی از گزینه‌ها از GPT-4 بهتره و اشتراک ۱۸ دلاری ماهیانه لازم داره.
https://claude.ai/chats
پ.ن. یه پیشرفتش که در موردش حرف میزنن جواب‌های مطمئن‌تر هست
پ.ن.۲. کسایی که دوست دارن با یه AI کار کنن که بشه بهش پی‌دی‌اف داد و یا فایل داد بعد بر اساس اون فایل سواال کنیم یا بگیم همونو خلاصه کنید الان claude یکی از بهتریناست.
https://www.anthropic.com/news/claude-3-family


🆔 @GITAnet|باشگاه فناوران اطلاعات مکانی
This media is not supported in your browser
VIEW IN TELEGRAM
روش‌های مختلف فاین‌تیون کردن مدل‌های زبانی بزرگ (LLM ها)

همون‌طور که می‌دونید، مدل‌های زبانی بزرگ معمولا از میلیاردها پارامتر قابل آموزش تشکیل شده‌اند که بهینه‌سازی و آموزش کامل همه‌ی آن‌ها نیازمند استفاده از حجم وسیعی داده‌ی متنی و توان پردازشی‌ست که حداقل فعلا از توان عامه‌ی پژوهش‌گرها خارج است و معمولا آزمایشگاه‌های تحقیقاتی بزرگ مانند OpenAI و Google با صرف زمان و هزینه زیاد مدل‌هایی را آموزش می‌دهند که ممکن است برای کاربردهای عمومی مناسب باشند. با این حال برای سفارشی‌سازی این مدل‌ها برای تسک‌های خاص، لازم است که این مدل‌ها روی مجموعه‌داده‌ی مربوط به آن تسک که عموما بسیار کوچک‌تر‌ست، با صرف توان پردازشی به مراتب کمتر، فاین‌تیون (Finetune) شوند.

🆔 @GITAnet|باشگاه فناوران اطلاعات مکانی
باشگاه فناوران اطلاعات مکانی
روش‌های مختلف فاین‌تیون کردن مدل‌های زبانی بزرگ (LLM ها) همون‌طور که می‌دونید، مدل‌های زبانی بزرگ معمولا از میلیاردها پارامتر قابل آموزش تشکیل شده‌اند که بهینه‌سازی و آموزش کامل همه‌ی آن‌ها نیازمند استفاده از حجم وسیعی داده‌ی متنی و توان پردازشی‌ست که حداقل…
برای فاین‌تیون کردن شبکه‌های عصبی عمیق معمولی، پارامترهای مربوط به لایه‌های ابتدایی شبکه که ویژگی‌های پایه را یادگرفته‌اند، freeze شده و پارامترهای لایه‌های آخر که بیشتر با تسک مرتبط‌اند، اصلاح می‌شوند. اما فاین‌تیون کردن مدل‌های زبانی، به این سادگی نیست و حتی با یک اشتباه ممکن است مدل، الگوهای زبانی عمومی را نیز فراموش کند (Catastrophic Forgetting).

روش اول) فاین‌تیون کردن کل مدل
یک مدل Pretrained انتخاب شده و همه‌ی پارامترهای آن بر روی دیتاست مربوط به تسک مورد نظر اصلاح می‌شوند. واضح‌ست که این روش از نظر زمان اجرا و حافظه‌‌ی مصرفی، در عمل، کارا نیست.

روش دوم) روش LoRA
این روش (Low-Rank Adaptation) توسط تیم مایکروسافت معرفی شده که در آن به جای اصلاح پارامترهای مدل زبانی، تعداد کمی پارامتر جدید موسوم به LoRA adapter به مدل اضافه می‌شوند و فقط این پارامترهای جدید بر روی دیتاست مربوط به تسک آموزش می‌بینند و پارامترهای خود مدل زبانی بدون تغییر باقی می‌مانند. واضح‌ست که این روش علاوه بر کارایی و مصرف کم‌تر حافظه، جلوی catastrophic forgetting را هم می‌گیرد.
روش‌های بهینه‌تری مانند QLoRA و +LoRA هم معرفی شده‌اند که می‌توانید در موردشان تحقیق کنید.

روش سوم)‌ روش Prompt Engineering
‌در این روش، پارامترهای LLM اصلاح نمی‌شوند. در واقع از LLM فقط برای فهم زبان استفاده می‌شود و داده‌های مربوط به تسک جدید، در قالب یک پرامپت مهندسی شده، قبل از کوئری، به LLM داده می‌شوند. واضح‌ست که تعداد توکن‌های ورودی LLM ها محدود است و این روش فقط برای زمانی کارایی دارد که تعداد نمونه‌های آموزشی، بسیار اندک‌اند (few-shot learning). همچنین، این روش در معرض خطر توهم (hallucinations) قرار دارد و ممکن‌ست با وجود دریافت چند شات دیتای آموزشی باز هم اطلاعات نادرست خروجی دهد.

روش چهارم) روش RAG
روش Retrieval-Augmented Generation تا حدی شبیه به روش Prompt Engineering است، با این تفاوت که در آن، تولید متن (Text Generation) توسط LLM، به کمک اطلاعاتِ مرتبطِ بازیابی‌شده‌ از یک پایگاه دانش (Knowledge base) انجام می‌گیرد.
به عبارت دیگر، در مرحله‌ی اول، یک مدل Embedding موسوم به مدل Retriever (برای انکودکردن مستندات و کوئری‌ها در یک فضای امبدینگ)، آموزش می‌بیند.
سپس در مرحله‌ي دوم، همه‌ی مستندات متنی مربوط به تسک مورد نظر، یک بار برای همیشه از این مدل امبدینگ عبور کرده و به بردار امبدینگ تبدیل می‌شوند.




🆔 @GITAnet|باشگاه فناوران اطلاعات مکانی
#زکات_علم
سه ربات تلگرامی برای دانلود مقاله های انگلیسی:
@science_nexus2_bot
@mx_nexus_bot
@IN_Imen_Bot

#ربات_تلگرامی
#ابزار_پژوهش
#مقاله_نویسی
#مقاله

🆔 @GITAnet|باشگاه فناوران اطلاعات مکانی
باشگاه فناوران اطلاعات مکانی
دفترچه_استخدام_ثبت_اسناد،_املاک_و_نقشه_برداری_کشور_سال_1403.pdf
استخدام ثبت اسناد، املاک و نقشه برداری کشور سال 1403



🆔 @GITAnet|باشگاه فناوران اطلاعات مکانی
Forwarded from Science Magazine
This media is not supported in your browser
VIEW IN TELEGRAM
دانلود رایگان مقالات پولی

#معرفی_سایت

☑️ Science Magazine
Please open Telegram to view this post
VIEW IN TELEGRAM
🔴 دهمین جشنواره ملی ارتباطات و فناوری اطلاعات

🔹 وب سایت:
https://festfava.ict.gov.ir


🆔 @GITAnet|باشگاه فناوران اطلاعات مکانی
This media is not supported in your browser
VIEW IN TELEGRAM
در این ویدئو که اخیرا وایرال شده، همکاری شرکت Figure (تولید‌کننده‌ی ربات‌های انسان‌نما) با شرکت OpenAI در زمینه‌ی استفاده از LLM ها در
روبات‌ها را می‌بینید.

شرکت Figure AI اخیرا از مایکروسافت، NVIDIA، جف بزوس، OpenAI و … جذب سرمایه کرده‌ست.

https://www.figure.ai/



🆔 @GITAnet|باشگاه فناوران اطلاعات مکانی
اگر می‌خواهید به‌سادگی مدل‌های یادگیری ماشین رو به صورت realtime روی موبایل (اندروید یا آی‌او‌اس) و یا رزبری‌پای اجرا کنید، از Google MediaPipe استفاده کنید:

https://developers.google.com/mediapipe


مثال: آموزش اعمال فیلتر‌هایی شبیه به SnapChat و Instagram روی دوربین موبایل:
https://www.youtube.com/watch?v=QERl1-ckFr8


🆔 @GITAnet|باشگاه فناوران اطلاعات مکانی
نسخه‌ی جدید TensorFlow (نسخه‌ی ۲.۱۶) منتشر شد.
این نسخه از Keras3 به‌جای Keras2 استفاده می‌کند. بنابراین اگر کد قدیمی‌ای دارید که با Keras جدید سازگار نیست، باید در آن به جای keras از tf-keras (کراس قدیمی ورژن ۲) استفاده کنید.


نصب:
‍‍‍‍
pip install tf-keras~=2.16


فعال‌سازی:

import os
os.environ["TF_USE_LEGACY_KERAS"]=”1”





🆔 @GITAnet|باشگاه فناوران اطلاعات مکانی
اولین هوش‌مصنوعی مهندس نرم‌افزار: دوین
تیم CognitionLabs اومده اولین هوش‌مصنوعی software engineer به اسم Devin رو ساخته و تونسته آزمون‌های استخدامی همین ردیف شغلی رو توی شرکت‌های معتبر قبول بشه.
روی تست SWE-Bench با نرخ ۱۳.۸۶ درصد بدون نیاز به کمک تونسته مسائل رو حل کنه، عددی که بری GPT-4 حدود ۱.۷ درصد هست.
پ.ن. البته میگن ما نمیخوایم جای برنامه‌نویس‌هارو بگیریم، هدفمون اینه که دستیارشون بشیم ولی خب به نظر من وقتی یه دستیار انقدر قوی باشه یه خورده این حرف با سیاست گفته شده.
https://twitter.com/cognition_labs/status/1767548763134964000

شاید براتون جالب باشه اگه بدونید که این تیم از ۱۰ نفر تشکیل شده که هر ۱۰نفر مدال طلای جهانی المپیاد کامپیوتر(IOI) و همچنین از بهترین برنامه‌نویس‌های سایت‌ codeforces.com هستند. نفر اول تیم که Scott Wu نام داره، سه مدال طلا و همچنین آخرین‌ باری که شرکت کرده، نفر اول جهان در این المپیاد شده!

https://www.cognition-labs.com/blog
https://stats.ioinformatics.org/people/2686



🆔 @GITAnet|باشگاه فناوران اطلاعات مکانی
This media is not supported in your browser
VIEW IN TELEGRAM
مدل SIMA توسط Google Deepmind معرفی شد
اولین عامل هوش مصنوعی که دستورات زبانی طبیعی(NLP) رو توی طیف گسترده‌ای از محیط‌های مجازی سه‌بعدی و بازی‌های ویدیویی
اجرا می کنه.
این هوش مصنوعی توی کاربردهایی که نیاز به درک محیط توسط ربات ها دارند، انقلابی به پا خواهد کرد.

https://deepmind.google/discover/blog/sima-generalist-ai-agent-for-3d-virtual-environments


🆔 @GITAnet|باشگاه فناوران اطلاعات مکانی
روز جهانی عدد پی(π)

۱۴م مارس( دیروز) هرسال که به صورت عددی ۳/۱۴ می‌شه، روز عدد پی نام‌گذاری شده. البته مدتی هست این روز رو به عنوان روز جهانی ریاضیات نیز می‌شناسن. عدد پی یک ثابت ریاضیاتی و یک عدد گنگه که طبق آخرین محاسبات،‌ به ۱۰۰تریلیون رقم اعشار رسید. این محاسبات توسط سرویس‌های ابری گوگل، روی یک ماشین مجازی با ۱۲۸ هسته، ۸۶۴ گیگابایت رم و ۶۶۳ ترابایت فضای ذخیره‌سازی انجام شد. هرساله ریاضی‌دان‌ها و موسسات مختلفی این روز رو با خوردن کیک pi جشن می‌گیرن!

https://en.wikipedia.org/wiki/Pi_Day

🆔 @GITAnet|باشگاه فناوران اطلاعات مکانی