چگونه هوش مصنوعی با یادگیری تقویتی به خود آموزش می‌دهد؟

یادگیری ماشینی (ML) زیرمجموعه اصلی هوش مصنوعی (AI) و یادگیری تقویتی (reinforcement learning) زیرمجموعه اصلی ML است.

به گزارش کالاسودا و به نقل از venturebeat، یادگیری تقویتی فرآیندی است که توسط آن یک الگوریتم یادگیری ماشین، ربات و … قادر است برنامه ریزی شود تا به محیط‌های پیچیده، زمان و دنیای واقعی پاسخ دهد تا در نهایت به یک هدف یا نتیجه مورد نظر برسد.

الگوریتم‌های یادگیری ماشینی با داده‌های آموزشی شروع می‌شوند و مدل‌هایی را به وجود می‌آورد که برخی از الگوها و درس‌های تعبیه‌شده در داده‌ها را به تصویر می‌کشند.

یادگیری تقویتی بخشی از فرآیند آموزشی است که پس از استقرار مدل اتفاق می‌افتد. داده‌های جدید گرفته شده از محیط برای بهینه سازی و تنظیم مدل برای دنیای فعلی استفاده می‌شود.

این نوع یادگیری ماشینی با یک حلقه بازخورد “پاداش” و “جریمه” انجام می‌شود.

کاربر فهرستی از نتایج موفق و ناموفق ایجاد می‌کند و سپس هوش مصنوعی از این نتایچ برای تنظیم مدل استفاده خواهد کرد.

برای مثال، یک خودروی خودران ممکن است مجموعه‌ای از پاداش‌ها و جریمه‌های از پیش تعیین شده داشته باشد.

اگر الگوریتم به درستی کار کند و تغییرات ناگهانی مانند ترمز یا شتاب گیری سریع ایجاد نشود، پاداشی دریافت می‌کند. اگر خودرو به حاشیه جاده برخورد کند، در ترافیک قرار بگیرد یا به طور غیرمنتظره ای ترمز کند، الگوریتم جریمه می‌شود.

در بسیاری از موارد، یادگیری تقویتی تنها بسط الگوریتم اصلی یادگیری است و پس از استفاده از مدل، دوباره همان فرآیند تکرار می‌شود. مراحل شبیه به هم هستند و پاداش‌ها و مجازات‌ها بخشی از داده‌های آموزشی می‌شوند.

استفادهٔ استارت آپ‌های هوش مصنوعی از یادگیری تقویتی

بسیاری از استارت‌آپ‌های هوش مصنوعی، الگوریتم‌هایی برای پشتیبانی از یادگیری تقویتی مهندسی کرده‌اند. این رویکرد در بسیاری از روش‌هایی که از ربات‌ها و وسایل نقلیه خودران پشتیبانی می‌کنند بسیار رایج است.

به عنوان مثال، Wayve در حال ایجاد سیستم‌های هدایت خودمختار است.

استارت‌آپ‌هایی مانند Waymo، Pony AI، Aeye، Cruise Automation و Argo در حال ساختن نرم‌افزارها و سیستم‌های حسگر هستند که برای هدایت وسایل خودران به مدل‌های دنیای طبیعی وابسته هستند.

این برندها شکل‌های مختلفی از reinforcement learning را برای بهبود این مدل‌ها به کار می‌گیرند.

یادگیری تقویتی نیازمند کاوش و آزمایش‌های گسترده است. دانشمندان با معماری‌های متعدد برای یک مدل، با لایه‌ها و پیکربندی‌های زیاد در نورون‌های مصنوعی کار می‌کنند.

در نهایت، یادگیری تقویتی دارای همان محدودیت‌های یادگیری ماشینی است.

 

عضویت
مطلع شدن از
guest
0 Comments
Inline Feedbacks
نمایش همه دیدگاه ها