امروزه به سختی میتوان کسی را یافت که تواناییها و نوآوریهای هوش مصنوعی و یادگیری ماشین او را شگفتزده کند. گرچه این فناوری هنوز در ابتدای راه خود است، مدلها و الگوریتمهای آن همین الان قادر به انجام کارهای زیادی هستند. آنها میتوانند هر کاری انجام دهند. از خدماترسانی بسیار شخصیسازی شده برای مشتری تا خلق نقاشیهای بسیار خلاقانه. راه حلهای مبتنی بر هوش مصنوعی و یادگیری ماشین میتوانند تقریباً برای تمام صنایع، سودآور باشند. بازار سهام، املاک و مستغلات، قطعاً یکی از این صنایع است.
کارهای زیادی در حوزه املاک و مستغلات وجود دارد که الگوریتمهای یادگیری ماشین میتوانند در آنها مفید باشند. به عنوان مثال میتوانید از آن برای پیش بینی قیمت املاک و چگونگی تغییر قیمت یک ملک خاص در آینده استفاده کنید. این به کارگزاران (brokers) کمک میکند تا بازار را بشناسند و استراتژی خود را بر اساس دادههای واقعی برنامهریزی کنند. و ما خوش شانس هستیم که روی چنین راه حلی کار میکنیم. در این مطلب ما تجربه خود از ساخت یک مدل یادگیری ماشین برای پیش بینی قیمت املاک و مستغلات را عنوان کردهایم.
اعدادی که برای پیش بینی قیمت املاک باید به آنها توجه کرد
اجازه دهید آمار جالبی را به اشتراک بگذاریم که نشان میدهد صنعت املاک در ایالات متحده چگونه به نظر میرسد. سپس میتوانیم این آمار را به کشور خودمان تعمیم بدهیم:
- نیویورک، سان فرانسیسکو و شیکاگو دارای کمرقابتترین بازار املاک در ایالات متحده هستند. (Zillow)
- قیمت خانههای تازه آگهیشده در ایالات متحده نسبت به مارس سال گذشته 13.5 درصد و نسبت به مارس سال 2020، 26.5 درصد افزایش یافته است. (Realtor)
- تعداد روزهایی که خانهها در بازار باقی میمانند رو به کاهش است. در مارس 2022 این آمار 38 روز و در مارس 2021، 49 روز بود. (National Association of Realtors)
- و جالبترین مورد این است: متولدین دهه 1980 تا 2000 بزرگترین خریدار خانه در بازار نیستند. متولدین دهههای 1960 تا 1980 با 24 درصد از کل آمار، بزرگترین خریداران بازار هستند. (National Association of Realtors)

همه این آمارها و روندها نقش مهمی در پیش بینی قیمت املاک دارند. اکنون میخواهیم به سراغ گزینهای به نام یادگیری ماشین برویم که اخیراً از آن استفاده کردیم. گزینهای که تمام آمارهای آن مفید بودند.
مدل پیش بینی قیمت املاک : چرا آن را ایجاد کردیم؟
پیش بینی قیمت املاک برای هر خانه متفاوت بوده و پیش بینی رفتار آن در آینده دشوار است. حتی اگر این پیش بینی فقط یک دوره زمانی کوتاه را پوشش دهد، عوامل بسیار زیادی میتوانند بر اعداد نهایی تأثیر بگذارند. دو مورد از مؤثرترین آنها عبارتند از:
- قیمت خانههایی با ویژگیهای مشابه که اخیراً فروخته شدهاند.
- تسلط بر روندهای بازار
با توجه به قسمت قبل، میتوانیم ببینیم که هر دوی اینها میتوانند با گذشت زمان به شدت تغییر کنند و برخی از معیارها میتوانند فصلی باشند. علاوه بر این، در پیش بینی قیمت املاک، ویژگیهای بسیاری نیز مربوط به خود خانه است: تعداد اتاق خوابها، قدمت ساختمان، وضعیت کلی، کیفیت محله، نزدیکی به مغازهها، مدارس، اماکن تفریحی و بسیاری از موارد دیگر.
همچنین شایان ذکر است که نظر حرفهای در مورد قیمت یک ملک میتواند به چندین شکل باشد:
تحلیل مقایسه ای بازار
مشاوران املاک به دنبال خانههای مشابه در منطقه هستند و ارزش یک ملک را بر اساس نحوه قیمتدهی آن خانهها در بازار تعریف میکنند. خانههای مشابه بر اساس متراژ، تعداد اتاقها، استایل معماری و قیمت فروش انتخاب میشوند.
نظر کارگزار برای قیمت
نظر کارگزار برای قیمت (BPO) گزینه دیگری برای افراد است که میتوانند به وسیله آن قیمت کارشناسی یک ملک را بدانند. این قیمتگذاری معمولاً توسط یک کارگزار حرفهای که از بازار محلی آگاه است، انجام میشود. این روش برای فروش کوتاه مدت، سلب مالکیت و ارائه قیمت فهرستشده به خریداران و فروشندگان رایج است. و برای پیش بینی قیمت املاک در بلند مدت کمتر کاربرد دارد.
چنین مقدار دادهای که یک کارگزار باید هنگام پیش بینی قیمت املاک داشته باشد، میتواند بسیار حجیم شود. این کار حتی برای مجربترین متخصصان حوزه ملک نیز میتواند خستهکننده باشد. علاوه بر این، هنوز هم احتمال بروز خطای انسانی وجود دارد.
دلیل این که ما شروع به کار بر روی این پروژه کردیم، این بود که یک مشتری از ما چنین درخواستی داشت: برای خودکارسازی پیش بینی قیمت املاک و به حداقل رساندن تأثیر خطای انسانی. هدف اصلی ما ساخت یک مدل یادگیری ماشین بسیار دقیق بود که قیمت خانه را در عرض یک ماه با دقتی در حدود 85 تا 90 درصد پیشبینی کند.
چگونه مدلی برای پیش بینی قیمت املاک ساختیم؟
پرسشهای اصلی که در این زمینه مطرح میشوند، اینها هستند: اینکه ما چه اقداماتی برای ایجاد یک مدل یادگیری ماشین برای پیش بینی قیمت املاک انجام دادیم، از چه پشته فناوری (tech stack) استفاده کردیم، و در طول فرآیند کاریمان با چه چالشهایی مواجه شدیم. بیایید با استراتژی کلی شروع کنیم. مسیر ما به روش زیر پیش رفت:

1- جمعآوری داده
اولین منبع داده ما، خود مشتری ما بود. آنها چندین مجموعه داده در اختیار ما قرار دادند، با این حال این دادهها برای آموزش مدل پیش بینی قیمت املاک کافی نبودند. برای حل این مشکل، ما تحقیقات خود را بر روی منابع دیگری آغاز کردیم که میتوانستند دادههای املاک را در اختیار ما قرار دهند. ما از چندین منبع اطلاعاتی مرتبط با بازار املاک در ایالات متحده و همچنین دادههای مربوط به شرایط اقتصادی کشور استفاده کردیم تا به مجموعه دادههایی دست پیدا کنیم که بیانگر وضعیت حقیقی این بازار باشند.
2- مهندسی ویژگی
برای پیش بینی قیمت املاک، ویژگیهای زیر را انتخاب کردیم:
- تغییر قیمت هر ملک در طول زمان
- موقعیت ملک
- نوع خانه
- همسایهها
- استخردار بودن یا نبودن
- سایر متغیرهای غیرسنتی
3- تنظیم فراپارامترها
فراپارامترها در طول فرآیند یادگیری به منزله یک کمک اضافی عمل میکنند. آنها خارج از مدل هستند؛ به این معنی که به آن تحمیل میشوند و به هیچ وجه قدرت تغییر آن را ندارند. آنها همچنین فقط در طول آموزش استفاده میشوند و خود مدل را تکمیل نمیکنند. پس از عبور از این مرحله، ما چیزهایی برای اعتبارسنجی نتایج مدل، کنترل رفتار آن و به حداکثر رساندن عملکردش خواهیم داشت.
4- مطالعه متغیرها
در طول کل فرآیند آموزش مدل، ما دائماً در حال ارزیابی و بازارزیابی تأثیر و ارتباط هر متغیر بودیم. این فرآیندها به منظور افزایش دقت مدل پیش بینی قیمت املاک به عنوان راه حل نهایی، انجام میشدند.
5- تکرار
وقتی اولین نسخه از مدل را به پایان رساندیم، فرآیند را از نو شروع کردیم تا مدل را صیقل دهیم و مطمئن شویم که نتایج آن تا حد امکان دقیق است.
پشته فناوری (Technology Stack)
ابزار اصلی ما XGBoost بود. یک کتابخانه decision tree (درخت تصمیم) با گرادیان تقویت شده منبع باز برای یادگیری ماشین. ما از آن برای مدل رگرسیون استفاده کردیم. سایر مواردی که در لیست ما بودند عبارتند از:
- پایتون 3.7 – زبان برنامه نویسی
- Pandas – پاکسازی و تجزیه و تحلیل داده
- Scikit-learn – classification و پیشبینی تجزیه و تحلیل
این مجموعه ابزار به ما کمک کرد تا به دقت مطلوبی برسیم.
چالش اصلی در ساخت مدل پیش بینی قیمت املاک
هیچ چیز در این دنیا کامل نیست و روند توسعه یادگیری ماشین ما نیز از این قاعده مستثنی نیست. در بیشتر موارد، این روند کاملاً قابل پیشبینی و روان بود. اما در یک لحظه، با چالش عدم تناسب مواجه شدیم. از آنجایی که مجموعه داده اولیه از کیفیت حداکثری نداشت و بسیار کوچک بود، یافتن روندهای پنهان و محاسبه نتایج دقیق برای الگوریتم دشوار بود.
همانطور که قبلاً اشاره کردیم، راه حل ما برای ساخت مدل پیش بینی قیمت املاک در منابع داده شخص ثالث پیدا شد. اطلاعاتی که توانستیم در منابع عمومی پیدا کنیم، به ما کمک کرد به مسیر درست برگردیم و مدل را به درستی آموزش دهیم.
نتایج مدل پیش بینی قیمت املاک
نتایج حتی بهتر از چیزی بود که انتظارش را داشتیم. مشتری انتظار داشت به دقتی در حدود 85 تا 90 درصد قیمتهای واقعی دست پیدا کند، اما ما به دقت 91 درصدی رسیدیم. بله 1 درصد چندان زیاد نیست، اما با در نظر گرفتن شرایط، نمیتوانستیم انتظار نتیجه بهتری داشته باشیم.
آیا این کار موفقیت آمیز بود؟
به طور خلاصه بله. همینطور بود. این مدل قطعاً بینقص نبود، دادههای اولیه بهترین نبودند و مشکل عدم تناسب در آنها وجود داشت؛ اما به هر حال شروع خوبی بود. ما توانستیم ببینیم که یادگیری ماشین یک فناوری دائمی در املاک و مستغلات خواهد بود و ما به راحتی میتوانیم روی مراحل بیشتری از آن کار کنیم. علاوه بر این، پیش بینی قیمت املاک تنها زمینهای نیست که میتوان روی آن کار کرد. کاربردهای این فناوری میتواند شامل فایلیابی و ارزیابی املاک نیز باشد.
منبع: hackernoon
Leave feedback about this