[ad_1]
یادگیری ماشینی (ML) زیرمجموعه اصلی هوش مصنوعی (AI) و یادگیری تقویتی (reinforcement learning) زیرمجموعه اصلی ML است.
به گزارش مجله خبری آی تی و دیجیتال و به نقل از venturebeat، یادگیری تقویتی فرآیندی است که توسط آن یک الگوریتم یادگیری ماشین، ربات و … قادر است برنامه ریزی شود تا به محیطهای پیچیده، زمان و دنیای واقعی پاسخ دهد تا در نهایت به یک هدف یا نتیجه مورد نظر برسد.
الگوریتمهای یادگیری ماشینی با دادههای آموزشی شروع میشوند و مدلهایی را به وجود میآورد که برخی از الگوها و درسهای تعبیهشده در دادهها را به تصویر میکشند.
یادگیری تقویتی بخشی از فرآیند آموزشی است که پس از استقرار مدل اتفاق میافتد. دادههای جدید گرفته شده از محیط برای بهینه سازی و تنظیم مدل برای دنیای فعلی استفاده میشود.
این نوع یادگیری ماشینی با یک حلقه بازخورد “پاداش” و “جریمه” انجام میشود.
کاربر فهرستی از نتایج موفق و ناموفق ایجاد میکند و سپس هوش مصنوعی از این نتایچ برای تنظیم مدل استفاده خواهد کرد.
برای مثال، یک خودروی خودران ممکن است مجموعهای از پاداشها و جریمههای از پیش تعیین شده داشته باشد.
اگر الگوریتم به درستی کار کند و تغییرات ناگهانی مانند ترمز یا شتاب گیری سریع ایجاد نشود، پاداشی دریافت میکند. اگر خودرو به حاشیه جاده برخورد کند، در ترافیک قرار بگیرد یا به طور غیرمنتظره ای ترمز کند، الگوریتم جریمه میشود.
در بسیاری از موارد، یادگیری تقویتی تنها بسط الگوریتم اصلی یادگیری است و پس از استفاده از مدل، دوباره همان فرآیند تکرار میشود. مراحل شبیه به هم هستند و پاداشها و مجازاتها بخشی از دادههای آموزشی میشوند.
استفادهٔ استارت آپهای هوش مصنوعی از یادگیری تقویتی
بسیاری از استارتآپهای هوش مصنوعی، الگوریتمهایی برای پشتیبانی از یادگیری تقویتی مهندسی کردهاند. این رویکرد در بسیاری از روشهایی که از رباتها و وسایل نقلیه خودران پشتیبانی میکنند بسیار رایج است.
به عنوان مثال، Wayve در حال ایجاد سیستمهای هدایت خودمختار است.
استارتآپهایی مانند Waymo، Pony AI، Aeye، Cruise Automation و Argo در حال ساختن نرمافزارها و سیستمهای حسگر هستند که برای هدایت وسایل خودران به مدلهای دنیای طبیعی وابسته هستند.
این برندها شکلهای مختلفی از reinforcement learning را برای بهبود این مدلها به کار میگیرند.
یادگیری تقویتی نیازمند کاوش و آزمایشهای گسترده است. دانشمندان با معماریهای متعدد برای یک مدل، با لایهها و پیکربندیهای زیاد در نورونهای مصنوعی کار میکنند.
در نهایت، یادگیری تقویتی دارای همان محدودیتهای یادگیری ماشینی است.
[ad_2]
نظرات کاربران