10 مهر 1402
تهران، خیابان آزادی، تقاطع قریب
یادگیری ماشین

پیش بینی قیمت املاک با یادگیری ماشین

پیش بینی قیمت املاک با یادگیری ماشین

امروزه به سختی می‌توان کسی را یافت که توانایی‌ها و نوآوری‌های هوش مصنوعی و یادگیری ماشین او را شگفت‌زده کند. گرچه این فناوری هنوز در ابتدای راه خود است، مدل‌ها و الگوریتم‌های آن همین الان قادر به انجام کارهای زیادی هستند. آن‌ها می‌توانند هر کاری انجام دهند. از خدمات‌رسانی بسیار شخصی‌سازی شده برای مشتری تا خلق نقاشی‌های بسیار خلاقانه. راه حل‌های مبتنی بر هوش مصنوعی و یادگیری ماشین می‌توانند تقریباً برای تمام صنایع، سودآور باشند. بازار سهام، املاک و مستغلات، قطعاً یکی از این صنایع است.

کارهای زیادی در حوزه املاک و مستغلات وجود دارد که الگوریتم‌های یادگیری ماشین می‌توانند در آن‌ها مفید باشند. به عنوان مثال می‌توانید از آن برای پیش بینی قیمت املاک و چگونگی تغییر قیمت یک ملک خاص در آینده استفاده کنید. این به کارگزاران (brokers) کمک می‌کند تا بازار را بشناسند و استراتژی خود را بر اساس داده‌های واقعی برنامه‌ریزی کنند. و ما خوش شانس هستیم که روی چنین راه حلی کار می‌کنیم. در این مطلب ما تجربه خود از ساخت یک مدل یادگیری ماشین برای پیش بینی قیمت املاک و مستغلات را عنوان کرده‌ایم.

اعدادی که برای پیش بینی قیمت املاک باید به آن‌‌ها توجه کرد

اجازه دهید آمار جالبی را به اشتراک بگذاریم که نشان می‌دهد صنعت املاک در ایالات متحده چگونه به نظر می‌رسد. سپس می‌توانیم این آمار را به کشور خودمان تعمیم بدهیم:

  • نیویورک، سان فرانسیسکو و شیکاگو دارای کم‌رقابت‌ترین بازار املاک در ایالات متحده هستند. (Zillow)
  • قیمت خانه‌های تازه آگهی‌شده در ایالات متحده نسبت به مارس سال گذشته 13.5 درصد و نسبت به مارس سال 2020، 26.5 درصد افزایش یافته است. (Realtor)
  • تعداد روزهایی که خانه‌ها در بازار باقی‌ می‌مانند رو به کاهش است. در مارس 2022 این آمار 38 روز و در مارس 2021، 49 روز بود. (National Association of Realtors)
  • و جالب‌ترین مورد این است: متولدین دهه 1980 تا 2000 بزرگترین خریدار خانه در بازار نیستند. متولدین دهه‌های 1960 تا 1980 با 24 درصد از کل آمار، بزرگترین خریداران بازار هستند. (National Association of Realtors)
املاک و مستغلات در آمریکا
یک اینفوگرافی از بازار ملک در ایالات متحده

همه این آمارها و روندها نقش مهمی در پیش بینی قیمت املاک دارند. اکنون می‌خواهیم به سراغ گزینه‌ای به نام یادگیری ماشین برویم که اخیراً از آن استفاده کردیم. گزینه‌ای که تمام آمارهای آن مفید بودند.

مدل پیش بینی قیمت املاک : چرا آن را ایجاد کردیم؟

پیش بینی قیمت املاک برای هر خانه متفاوت بوده و پیش بینی رفتار آن در آینده دشوار است. حتی اگر این پیش بینی فقط یک دوره زمانی کوتاه را پوشش دهد، عوامل بسیار زیادی می‌توانند بر اعداد نهایی تأثیر بگذارند. دو مورد از مؤثرترین آن‌ها عبارتند از:

  • قیمت خانه‌هایی با ویژگی‌های مشابه که اخیراً فروخته شده‌اند.
  • تسلط بر روندهای بازار

با توجه به قسمت قبل، می‌توانیم ببینیم که هر دوی این‌ها می‌توانند با گذشت زمان به شدت تغییر کنند و برخی از معیارها می‌توانند فصلی باشند. علاوه بر این، در پیش بینی قیمت املاک، ویژگی‌های بسیاری نیز مربوط به خود خانه است: تعداد اتاق خواب‌ها، قدمت ساختمان، وضعیت کلی، کیفیت محله، نزدیکی به مغازه‌ها، مدارس، اماکن تفریحی و بسیاری از موارد دیگر.

همچنین شایان ذکر است که نظر حرفه‌ای در مورد قیمت یک ملک می‌تواند به چندین شکل باشد:

تحلیل مقایسه ای بازار

مشاوران املاک به دنبال خانه‌های مشابه در منطقه هستند و ارزش یک ملک را بر اساس نحوه قیمت‌دهی آن خانه‌ها در بازار تعریف می‌کنند. خانه‌های مشابه بر اساس متراژ، تعداد اتاق‌ها، استایل معماری و قیمت فروش انتخاب می‌شوند.

نظر کارگزار برای قیمت

نظر کارگزار برای قیمت (BPO) گزینه‌ دیگری برای افراد است که می‌توانند به وسیله آن قیمت کارشناسی یک ملک را بدانند. این قیمت‌گذاری معمولاً توسط یک کارگزار حرفه‌ای که از بازار محلی آگاه است، انجام می‌شود. این روش برای فروش کوتاه مدت، سلب مالکیت و ارائه قیمت فهرست‌شده به خریداران و فروشندگان رایج است. و برای پیش بینی قیمت املاک در بلند مدت کمتر کاربرد دارد.

چنین مقدار داده‌ای که یک کارگزار باید هنگام پیش بینی قیمت املاک داشته باشد، می‌تواند بسیار حجیم شود. این کار حتی برای مجرب‌ترین متخصصان حوزه ملک نیز می‌تواند خسته‌کننده باشد. علاوه بر این، هنوز هم احتمال بروز خطای انسانی وجود دارد.

دلیل این که ما شروع به کار بر روی این پروژه کردیم، این بود که یک مشتری از ما چنین درخواستی داشت: برای خودکارسازی پیش بینی قیمت املاک و به حداقل رساندن تأثیر خطای انسانی. هدف اصلی ما ساخت یک مدل یادگیری ماشین بسیار دقیق بود که قیمت خانه را در عرض یک ماه با دقتی در حدود 85 تا 90 درصد پیش‌بینی کند.

چگونه مدلی برای پیش بینی قیمت املاک ساختیم؟

پرسش‌های اصلی که در این زمینه مطرح می‌شوند، این‌ها هستند: این‌که ما چه اقداماتی برای ایجاد یک مدل یادگیری ماشین برای پیش بینی قیمت املاک انجام دادیم، از چه پشته فناوری (tech stack) استفاده کردیم، و در طول فرآیند کاریمان با چه چالش‌هایی مواجه شدیم. بیایید با استراتژی کلی شروع کنیم. مسیر ما به روش زیر پیش رفت:

مدل یادگیری ماشین برای املاک

1- جمع‌آوری داده‌

اولین منبع داده ما، خود مشتری ما بود. آن‌ها چندین مجموعه داده در اختیار ما قرار دادند، با این حال این داده‌ها برای آموزش مدل پیش بینی قیمت املاک کافی نبودند. برای حل این مشکل، ما تحقیقات خود را بر روی منابع دیگری آغاز کردیم که می‌توانستند داده‌های املاک را در اختیار ما قرار دهند. ما از چندین منبع اطلاعاتی مرتبط با بازار املاک در ایالات متحده و همچنین داده‌های مربوط به شرایط اقتصادی کشور استفاده کردیم تا به مجموعه داده‌هایی دست پیدا کنیم که بیانگر وضعیت حقیقی این بازار باشند.

2- مهندسی ویژگی

برای پیش بینی قیمت املاک، ویژگی‌های زیر را انتخاب کردیم:

  • تغییر قیمت هر ملک در طول زمان
  • موقعیت ملک
  • نوع خانه
  • همسایه‌ها
  • استخردار بودن یا نبودن
  • سایر متغیرهای غیرسنتی

3- تنظیم فراپارامترها

فراپارامترها در طول فرآیند یادگیری به منزله یک کمک اضافی عمل می‌کنند. آن‌ها خارج از مدل هستند؛ به این معنی که به آن تحمیل می‌شوند و به هیچ وجه قدرت تغییر آن را ندارند. آن‌ها همچنین فقط در طول آموزش استفاده می‌شوند و خود مدل را تکمیل نمی‌کنند. پس از عبور از این مرحله، ما چیزهایی برای اعتبارسنجی نتایج مدل، کنترل رفتار آن و به حداکثر رساندن عملکردش خواهیم داشت.

4- مطالعه متغیرها

در طول کل فرآیند آموزش مدل، ما دائماً در حال ارزیابی و بازارزیابی تأثیر و ارتباط هر متغیر بودیم. این فرآیندها به منظور افزایش دقت مدل پیش بینی قیمت املاک به عنوان راه حل نهایی، انجام می‌شدند.

5- تکرار

وقتی اولین نسخه از مدل را به پایان رساندیم، فرآیند را از نو شروع کردیم تا مدل را صیقل دهیم و مطمئن شویم که نتایج آن تا حد امکان دقیق است.

پشته فناوری (Technology Stack)

ابزار اصلی ما XGBoost بود. یک کتابخانه decision tree (درخت تصمیم) با گرادیان تقویت شده منبع باز برای یادگیری ماشین. ما از آن برای مدل رگرسیون استفاده کردیم. سایر مواردی که در لیست ما بودند عبارتند از:

  • پایتون 3.7 – زبان برنامه نویسی
  • Pandas – پاکسازی و تجزیه و تحلیل داده
  • Scikit-learn – classification و پیش‌بینی تجزیه و تحلیل

این مجموعه ابزار به ما کمک کرد تا به دقت مطلوبی برسیم.

چالش اصلی در ساخت مدل پیش بینی قیمت املاک

هیچ چیز در این دنیا کامل نیست و روند توسعه یادگیری ماشین ما نیز از این قاعده مستثنی نیست. در بیشتر موارد، این روند کاملاً قابل پیش‌بینی و روان بود. اما در یک لحظه، با چالش عدم تناسب مواجه شدیم. از آن‌جایی که مجموعه داده اولیه از کیفیت حداکثری نداشت و بسیار کوچک بود، یافتن روندهای پنهان و محاسبه نتایج دقیق برای الگوریتم دشوار بود.

همانطور که قبلاً اشاره کردیم، راه حل ما برای ساخت مدل پیش بینی قیمت املاک در منابع داده شخص ثالث پیدا شد. اطلاعاتی که توانستیم در منابع عمومی پیدا کنیم، به ما کمک کرد به مسیر درست برگردیم و مدل را به درستی آموزش دهیم.

نتایج مدل پیش بینی قیمت املاک

نتایج حتی بهتر از چیزی بود که انتظارش را داشتیم. مشتری انتظار داشت به دقتی در حدود 85 تا 90 درصد قیمت‌های واقعی دست پیدا کند، اما ما به دقت 91 درصدی رسیدیم. بله 1 درصد چندان زیاد نیست، اما با در نظر گرفتن شرایط، نمی‌توانستیم انتظار نتیجه بهتری داشته باشیم.

آیا این کار موفقیت آمیز بود؟

به طور خلاصه بله. همینطور بود. این مدل قطعاً بی‌نقص نبود، داده‌های اولیه بهترین نبودند و مشکل عدم تناسب در آن‌ها وجود داشت؛ اما به هر حال شروع خوبی بود. ما توانستیم ببینیم که یادگیری ماشین یک فناوری دائمی در املاک و مستغلات خواهد بود و ما به راحتی می‌توانیم روی مراحل بیشتری از آن کار کنیم. علاوه بر این، پیش بینی قیمت املاک تنها زمینه‌ای نیست که می‌توان روی آن کار کرد. کاربردهای این فناوری می‌تواند شامل فایل‌یابی و ارزیابی املاک نیز باشد.

منبع: hackernoon

Leave feedback about this

  • کیفیت
  • قیمت
  • خدمات

PROS

+
Add Field

CONS

+
Add Field
Choose Image
Choose Video
X