گوگل از این ابزار برای ارائه میلیونها نتیجه جستجو در ساعت استفاده میکند. فیس بوک با استفاده از آن علاقهمندیهای بالقوه شما را حدس میزند. حتی شرکت تسلا، متعلق به ایلان ماسک نیز از آن برای ساخت خودرهای بدون راننده استفاده میکند. با این حال، اگر در ابتدای راه هستید، یادگیری ماشین میتواند دلهره آور به نظر برسد.
ما در این مقاله، در عرض 5 دقیقه به شما توضیح خواهیم داد که یادگیری ماشین یا Machine Learning در واقع چه چیزی است.
چگونه یک مدل یادگیری ماشین بسازیم؟
یادگیری ماشینی (ML) روشی برای تجزیه و تحلیل داده ها است که به عنوان شاخهای از هوش مصنوعی (AI) در نظر گرفته میشود.
در طول فرآیند یادگیری ماشین، مدلهای پیشبینیگری بر اساس الگوریتمهای کامپیوتری حاوی دیتای قبلی، ساخته میشوند. ساختن یک مدل یادگیری ماشین خوب، میتواند مانند بزرگ کردن یک فرزند باشد.
در این قیاس، مدل ML فرزند است و والدین دانشمندان دادهای هستند که مشغول بزرگ کردن آن فرزند هستند. هدف اصلی آنها تربیت فرزندی است که بتواند مشکلات را حل کند. برای تبدیل شدن این فرزند به یک حلال مشکلات، کودک باید نحوه برخورد با محیط اطرافش را بیاموزد. در ابتدا ناشناختههای زیادی وجود دارند؛ اما با گذشت زمان، قدرت منطق او افزایش یافته و با توجه به تجربیات کافی در زندگی و درسهای مفید، کودک به یک حل کننده مشکلات تبدیل میشود.
این دقیقاً همان چیزی است که ما از یک مدل ML میخواهیم: مهارتهای لازم برای حل مشکل.
فرآیند یادگیری ماشین
فرآیند این یادگیری، یک فرآیند تجربی است. یادگیری ماشین بر یک معادله از پیش نوشتهشده متکی نیست. در عوض، الگوریتم آن از تجربهای که در قالب دادههای آموزشی آموخته است استفاده میکند. هر چه دادهها بزرگتر و کیفیت بیشتری داشته باشند، نتایج قویتری از آن مدل به دست میآورید.
یک کودک (یا بزرگسال) ممکن است با استعداد باشد، اما شاید تجربه کافی نداشته باشد؛ به خصوص اگر به اندازه کافی تمرین نکرده باشد. در چنین مواردی، این احتمال وجود دارد که فردی با استعداد متوسط، که سخت مشغول یادگیری و کار کردن است، بهتر از یک فرد مستعد عمل کند.
همین امر در مورد مدلهای یادگیری ماشینی نیز صدق میکند. هر چه دادههای آموزشی بیشتری داشته باشید، خروجی بهتری دریافت خواهید کرد. در بیشتر موقعیتها، یک الگوریتم پیچیده یادگیری ماشین، که با مقدار کمتری داده آموزش داده شده است، از یک الگوریتم نسبتاً ساده با مقدار زیادی داده آموزشی ضعیفتر عمل میکند.
یادگیری ماشین به چند دسته اصلی تقسیم میشود؟
Machine Learning به سه دسته اصلی تقسیم میشود:
- تحت نظارت
- بدون نظارت
- تقویتی
بیایید هر یک را به طور خلاصه توضیح دهیم:
یادگیری تحت نظارت
یادگیری تحت نظارت بر داده های برچسب گذاری شده متکی است. پیروقیاس قبلی ما، والدین در این مورد بسیار فعال هستند و به کودک میآموزند که چه رفتاری «خوب» یا «بد» است. در واقع، والدین نمونههای از پیش برچسبگذاری شده زیادی را به فرزنشان ارائه میکنند. بر اساس دانش موجود، کودک سعی میکند که یک الگوی رفتاری متناسب با دستورالعملهای اولیه والدین، تولیدکند.
یادگیری بدون نظارت
از سوی دیگر، یادگیری بدون نظارت، زمانی استفاده می شود که دادههای برچسب دار نداریم. در این حالت تجربیات ما بدون برچسب هستند و به عنوان «خوب» یا «بد» طبقهبندی نمیشوند. والدین به کودک اجازه می دهند تا خودش دنیا را کشف کند. بدون راهنمایی اولیه، کودک نمی تواند تجربیات را «خوب» یا «بد» تشخیص داده و دستهبندی کند. با این حال؛ هدف این نیست. هدف والدین از انجام این تکنیک این است که در نهایت کودک انواع مختلف رفتار را بر اساس شباهت ها و تفاوت هایشان تشخیص داده و آنها را بشناسد.
یادگیری تقویتی (Reinforcement Learning)
سومین دسته از انواع یادگیری ماشین، یادگیری تقویتی نام دارد. این نوع یادگیری بر اساس بازخوردها شکل میگیرد. هر بار که والدین رفتار مثبتی از کودک می بینند، به او پاداش می دهند. به همین ترتیب، اگر کودک درست رفتارنکند، تنبیه میشود.
همانند سبکهای مختلف فرزندپروری، مدلهای یادگیری ماشین را میتوان در طول زمانهای مختلف تغییر داد؛ مثلاً زمانی که دانشمند دیتا اعتقاد دارد که با تغییر برخی از پارامترهای مدل یادگیری ماشین، میتوان به نتایج دقیقتری دست پیدا کرد. بنابراین، اغلب اوج هنر دانشمندان دیتا و مهندسان یادگیری ماشین در تنظیم دقیق مدلی با عملکرد خوب بروز میکند. در برخی موارد، بهبود 0.1 درصدی در دقت عملکرد، میتواند از اهمیت ویژهای برخوردار باشد؛ بهویژه زمانی که از مدل یادگیری ماشین برای کار در زمینههایی مانند مراقبتهای بهداشتی، پیشگیری از کلاهبرداری و وسایل نقلیه بدون سرنشین استفاده میشود.
از نظر پیچیدگی مدلی که یک مدیر ارشد داده می تواند ایجاد کند، می توانیم بین روش های سنتی یادگیری ماشین و یادگیری عمیق تمایز قائل شویم.

محبوب ترین تکنیکهای سنتی یادگیری ماشین چیست؟
برخی از محبوبترین تکنیکهای سنتی و تحت نظارت یادگیری ماشین عبارتند از:
- این روشها با ما این امکان را میدهند که ارزش بالقوه یک داده را پیشبینی یا دادههای خود را بر اساس کلاسهای از پیش تعریف شده طبقه بندی کنیم.
- از سوی دیگر، تکنیکهای سنتی یادگیری ماشین (بدون نظارت)، مانند خوشه بندی میانگین k، عمدتاً برای گروه بندی افلام در دادههای ورودی به خوشهها و تجزیه و تحلیل الگوها در این خوشهها استفاده میشوند.
- در برخی موارد، دانشمندان داده از تجزیه و تحلیل مؤلفه اصلی (PCA) به منظور کاهش ابعاد بررسی یک داده استفاده میکنند؛ به منظور درک اینکه کدام متغیرهای کلیدی هستند که بیشترین سهم را در یک مجموعه داده دارند.
یادگیری عمیق (deep learning) چیست؟
اگر یادگیری ماشین شاخهای از هوش مصنوعی در نظر گرفته شود، میتوان گفت که یادگیری عمیق شاخهای از آن است.
یادگیری عمیق (DL) از نحوه عملکرد مغز انسان الهام میپذیرد. مغز انسان بر ساختاری به نام شبکه عصبی متکی است که متشکل از چندین لایه است. در حقیقت، هر کدام از این لایهها را میتوان یک مدل کوچک کلاسیک از یادگیری ماشین درنظر گرفت، که همگی آنها در کنار هم میآموزند و پرورش پیدا میکنند.
میتوان گفت که یک شبکه عصبی زمانی به درجه یادگیری عمیق میرسد که بیش از 3 لایه داشته باشد. هر چه یک شبکه عصبی دارای لایههای پرتعدادتر و ظرفیت یادگیری آن بیشتر باشد، پیچیده تر است. در یک شبکه عصبی، خروجی هر لایه، ورودی لایه بعدی است.
یادگیری عمیق بهترین راه حل برای تسهیل فعالیت های زیر است:
یادگیری ماشین در مقابل یادگیری عمیق: چگونه انتخاب کنیم؟
پاسخ این سوال کوتاه است: بر اساس پیچیدگی دادههای آنها.
وقتی دادههای ساده تری داشته باشیم، رویکرد کلاسیک کفایت میکند، در حالی که دادههای پیچیده احتمالاً به شبیهسازی شبکههای عصبی احتیاج دارند. یادگیری عمیق، تقریباً در همه موارد از روشهای سنتی یادگیری ماشین بهتر و دقیقتر عمل میکند. با این حال، پیچیده تر است، تفسیر آن دشوار تر است و از نظر زمان لازم برای آماده سازی مدل، به اندازه روشهای سنتی کارآمد نیست.
نکته مهمی که باید به خاطر بسپاریم این است که یادگیری ماشین ابزاری است که اگر اخلاقمدارانه استفاده شود، به طور بالقوه میتواند بازدهی کار افراد را افزایش دهد. این ابزار به ما این امکان را میدهد که بتوانیم حجم کار خود را در مقیاس زمان کاهش دهیم و در شرایطی که مجبور به سر و کله زدن با یک دیتای دریافتی حجیم هستیم، و زمانی که مجبوریم دائماً تصمیمگیریهای کوچک انجام دهیم، بسیار ارزشمند است.
Leave feedback about this