3 . فراگیری ماشین
در این بخش ابتدا مدلسازی بر اساس مصرف انرژی در شرایط آب و هوایی مختلف با چیدمان ها و ضخامت های مختلف عایق انجام می شود. شرایط آب و هوایی بر اساس شرایط آب و هوایی گرم، سرد و معتدل در یک منطقه متفاوت در نظر گرفته می شود. بهترین مدلها بر اساس بهترین عملکرد رگرسیون فرآیند گاوسی (GPR)، رگرسیون بردار پشتیبان (SVR) و الگوریتم درخت تصمیم ( ژو و همکاران، 2019 ، احمد و همکاران، 2018 ، فتحی و همکاران، 2018)، 2020 ).
3.1 . درخت تصمیم
درخت تصمیم نشان دهنده راهی برای نمایش یک سری قوانین است که به یک دسته یا مقدار منتهی می شود. درخت های تصمیم گیری با جداسازی متوالی داده ها به گروه های مجزا ساخته می شوند و هدف این فرآیند افزایش فاصله بین گروه ها در هر جداسازی است. ساختار یک سیستم درختی شامل ریشه، گره داخلی و برگ است. ساختار برگ در طبقه بندی داده های ناشناخته استفاده می شود. روش نسبت افزایش ناخالصی برای ارزیابی صفت با کمک درخت استفاده می شود. برگ های درخت برچسب های کلاسی را می سازند که اقلام داده در آنها گروه بندی می شوند. تکنیک طبقه بندی درخت تصمیم در دو مرحله اجرا می شود: ساخت درخت و هرس درخت. درخت از بالا به پایین ساخته می شود و درخت به صورت بازگشتی تمام موارد داده متعلق به برچسب کلاس یکسان را در طول این مرحله منتشر می کند. اما، هرس درخت با روش پایین به بالا، دقت پیشبینی و طبقهبندی را بهبود میبخشد. برای این منظور سعی می شود میزان برازش بیش از حد در مرحله تمرین به حداقل برسد. آموزش بیش از حد به این معنی است که در مرحله آموزش، صداها و جزئیات موجود در داده ها در یادگیری گنجانده می شود. مدلهای مختلفی از درختهای تصمیم در دادهکاوی وجود دارد که الگوریتم طبقهبندی CART و درخت رگرسیون نمونهای از آنها است که توسط محققان معرفی و توسعه داده شد ( چاربوتی و عبدالعزیز، 2021 ). این الگوریتم یک ابزار درخت تصمیم قدرتمند ایجاد می کند که می تواند به راحتی الگوها را پیدا کند و روابط را جستجو کند. الگوریتم طبقهبندی و درخت رگرسیون (CART) یک فرآیند انشعاب بازگشتی باینری است که گرههای والد را دقیقاً به دو گره فرزند تقسیم میکند و به صورت بازگشتی به انشعاب ادامه میدهد تا زمانی که دیگر امکان توسعه وجود نداشته باشد. برنامه های افزودنی با پرسیدن یک سوال با پاسخ بله یا خیر ساخته می شوند. داده ها به دو زیر مجموعه تقسیم می شوند تا رکوردهای هر زیر مجموعه نسبت به زیر مجموعه قبلی همگن تر باشند. این الگوریتم قادر به پردازش ویژگی های خاص با مقادیر پیوسته و گسسته و با ضریب جینی 1 است که مشابه معیار بهره برای طبقه بندی است ( رامیا و همکاران، 2019 ).
3.2 . رگرسیون فرآیند گاوسی (GPR)
در نظریه احتمالات و آمار، یک فرآیند گاوسی یک مدل آماری است که در آن مشاهدات در یک حوزه پیوسته رخ میدهند. در یک فرآیند گاوسی، هر نقطه از فضای ورودی یک متغیر تصادفی با توزیع نرمال است ( زنگ و همکاران، 2020 ). علاوه بر این، هر مجموعه محدودی از این متغیرهای تصادفی دارای یک توزیع گاوسی چند متغیره است. توزیع فرآیند گاوسی توزیع مشترک همه این متغیرهای تصادفی نامحدود است. فرآیندهای گاوسی در مدل سازی آماری بسیار مهم هستند زیرا دارای ویژگی های نرمال هستند. بر اساس نظریه گاوسی،𝑛مشاهدات در مجموعه داده مورد نظر را می توان به عنوان یک نقطه از یک توزیع گاوسی چند متغیره تنظیم کرد. بنابراین، مجموعه داده را می توان با یک فرآیند گاوسی تطبیق داد. اغلب فرض می شود که میانگین فرآیند گاوسی مربوطه در همه جا صفر است و تابع کوواریانس یک مشاهده را به مشاهده دیگر متصل می کند. هر مشاهده𝑦را می توان از طریق یک مدل نویز گاوسی به یک تابع اصلی مرتبط کرد . طراحی روش های رگرسیون مبتنی بر فرآیند گاوسی شامل استفاده از مفهوم تابع هسته است. در واقع با یک تبدیل غیر خطی می توان مسائل را به صورت خطی جدا کرد. در میان مهمترین توابع هسته، در اینجا، تابع هسته پیرسون برای مدلسازی رفتار داده ها به کار گرفته شده است. لازم به توضیح است که به دلیل جعبه سیاه بودن مدل های هوش مصنوعی، رابطه بین ورودی و خروجی در این مدل ها مشخص نیست. این امر مستلزم استفاده دقیق از مدل های هوشمند است و آنها باید برای استفاده از طیف وسیعی از داده ها آموزش ببینند ( مانژوس و همکاران، 2022 ).
3.3 . روش ماشین بردار الگوریتم SVR (SVR)
الگوریتم SVR به عنوان یک الگوریتم یادگیری ماشینی مبتنی بر تئوری آموزش آماری است. روش آموزش تحت نظارت است و داده های ورودی و مقدار پارامتر وابسته می توانند با استفاده از رویکرد به حداقل رساندن ریسک ساختاری ارتباط برقرار کنند. کمینه سازی ریسک ساختاری نسبت به روش کمینه سازی ریسک تجربی رایج برتری دارد و بر خلاف روش هایی مانند شبکه های عصبی، یک تکنیک تخمینی برای تقریب یک تابع بر اساس راه حل های محلی است. در مسائل رگرسیون، بردارهای ورودی به یک فضای چند بعدی نگاشت می شوند. سپس یک ابر صفحه ایجاد می شود که بردارهای ورودی را با بیشترین فاصله ممکن از یکدیگر جدا می کند. برای حل مشکل انجام عملیات در فضای بزرگ از تابع هسته استفاده می شود. در این حالت می توان عملیات را با همان سرعت فضای داده ورودی انجام داد. در واقع با استفاده از تابع هسته، مشکل چند بعدی بودن و غیرخطی بودن نگاشت حل می شود. فرآیند بهینه سازی باید با یک تابع افت اصلاح شده برای تخمین SVR از جمله اندازه گیری فاصله همراه باشد. در اینجا، الگوریتم ژنتیک برای بهینهسازی پارامترهای وزن و چولگی برای ارائه بهترین برازش دادهها استفاده میشود ( موسوی و همکاران، 2019 ، یی و همکاران، 2021 ).
3.4 . معیارهای ارزیابی روش های رگرسیون
به منظور ارزیابی صحت و اعتبار روش های درونیابی، از تکنیک اعتبار سنجی مقایسه ای استفاده شده است. در این تکنیک میانگین خطای مطلق و ریشه میانگین مربع خط 2 بر اساس مشاهده شده محاسبه می شود (𝑋(𝑖)) و تخمین زده شده (𝑌(𝑖)) ارزش های. لازم به ذکر است که 75 درصد از داده ها برای آموزش شبکه و 30 درصد مابقی برای اعتبار سنجی استفاده می شود. مقادیر دقت 99.9% با مقدار انحراف 0.09% در نظر گرفته شده است. شکل 4 ، شکل 5 ، شکل 6 نتایج الگوریتم های یادگیری ماشینی تخمین زده شده را برای آب و هوای مختلف نشان می دهد.

- دانلود: دانلود تصویر با وضوح بالا (159 کیلوبایت)
- دانلود: دانلود تصویر در اندازه واقعی
شکل 4 . نتایج پیش بینی برای هوای سرد است.
- دانلود: دانلود تصویر با وضوح بالا (154 کیلوبایت)
- دانلود: دانلود تصویر در اندازه واقعی
شکل 5 . نتایج پیش بینی برای آب و هوای معتدل.
- دانلود: دانلود تصویر با وضوح بالا (216 کیلوبایت)
- دانلود: دانلود تصویر در اندازه واقعی
شکل 6 . نتایج پیش بینی برای هوای گرم.
میز 1 . نتایج کلی مدل های یادگیری ماشینی در هوای سرد
| مدل ها | شاخص عملکرد | |||
|---|---|---|---|---|
| سلول خالی | ضریب همبستگی | ریشه میانگین مربعات خطا | کارایی نش-ساتکلیف | شاخص ویلموت |
| GPR | 0.978 | 3.47 | 0.622 | 0.718 |
| SVR | 0.982 | 3.421 | 0.664 | 0.742 |
| درخت تصمیم | 0.999 | 3.21 | 0.756 | 0.822 |
از شکل 4 ، شکل 5 ، شکل 6 و همچنین جدول 1 ، جدول 2 ، جدول 3 ، می توان استنباط کرد که میانگین درخت تصمیم با ضریب همبستگی منتج می شود.=0.999، شاخص ویلموت=0.821، کارایی نش-ساتکلیف=0.757 و ریشه میانگین مربعات خطا =3.22 بهترین تخمین را برای چیدمان و ضخامت عایق نانو در همه شرایط پیشنهاد می کند. برای SVR، بهترین شاخص های عملکرد در آب و هوای معتدل با ضریب همبستگی ارزیابی می شوند.=0.991، شاخص ویلموت=0.742، کارایی نش– ساتکلیف=0.67 و ریشه میانگین مربعات خطا=3.33. بهترین مقادیر شاخص عملکرد برای GPR که در هوای معتدل آشکار شد، ضریب همبستگی است.=0.987، شاخص ویلموت=0.819، کارایی نش– ساتکلیف=0.641 و ریشه میانگین مربعات خطا=3.34. مدل های تخمین زده شده برای چیدمان و ضخامت عایق ها بر اساس الگوریتم Decision-Tree در شکل 7 زیر نشان داده شده است .
جدول 2 . نتایج کلی مدل های یادگیری ماشینی در هوای معتدل.
| مدل ها | شاخص عملکرد | |||
|---|---|---|---|---|
| سلول خالی | ضریب همبستگی | ریشه میانگین مربعات خطا | کارایی نش-ساتکلیف | شاخص ویلموت |
| GPR | 0.987 | 3.34 | 0.641 | 0.719 |
| SVR | 0.991 | 3.33 | 0.67 | 0.742 |
| درخت تصمیم | 0.9989 | 3.23 | 0.757 | 0.820 |
جدول 3 . نتایج کلی مدل های یادگیری ماشینی در هوای گرم
| مدل ها | شاخص عملکرد | |||
|---|---|---|---|---|
| سلول خالی | ضریب همبستگی | ریشه میانگین مربعات خطا | کارایی نش-ساتکلیف | شاخص ویلموت |
| GPR | 0.957 | 3.54 | 0.621 | 0.717 |
| SVR | 0.967 | 3.48 | 0.264 | 0.742 |
| درخت تصمیم | 0.999 | 3.22 | 0.758 | 0.821 |
از شکل 7 ، عملکرد بالای رگرسیون ها برای ضخامت و چیدمان عایق ها در تمام شرایط آب و هوایی، نتایج برآوردها هستند.
- دانلود: دانلود تصویر با وضوح بالا (287 کیلوبایت)
- دانلود: دانلود تصویر در اندازه واقعی
شکل 7 . رگرسیون مدل درخت تصمیم برای سه اقلیم.
نمودار تیلور برای تجزیه و تحلیل و ارزیابی مدل های یادگیری ماشین ذکر شده استفاده می شود ( شکل 8 ، شکل 9 ، شکل 10 ). مزیت اصلی نمودار تیلور استفاده از دو شاخص آماری ضریب همبستگی و انحراف معیار است. هر چه مقدار پیش بینی شده از نظر ضریب همبستگی و انحراف معیار به مقدار مشاهده شده نزدیکتر باشد، پیش بینی بهتری انجام می شود.
نمودار عملکرد تیلور (نشان داده شده در شکل 8 ، شکل 9 ، شکل 10 ) نشان می دهد که مدل درخت تصمیم کارآمدترین و موثرترین مدل است زیرا انحراف استاندارد پیش بینی شده نزدیکترین فاصله را با انحراف استاندارد داده های مشاهده شده دارد و بالاترین ضریب همبستگی را نشان می دهد. با توجه به تمامی معیارهای ارزیابی می توان بیان کرد که مدل های مورد بررسی در ارزیابی دقیق تر عملکرد خوبی دارند.
- دانلود: دانلود تصویر با وضوح بالا (406 کیلوبایت)
- دانلود: دانلود تصویر در اندازه واقعی
شکل 8 . نمودار تیلور برای هوای سرد
- دانلود: دانلود تصویر با وضوح بالا (446 کیلوبایت)
- دانلود: دانلود تصویر در اندازه واقعی
شکل 9 . نمودار تیلور برای آب و هوای معتدل.
- دانلود: دانلود تصویر با وضوح بالا (403 کیلوبایت)
- دانلود: دانلود تصویر در اندازه واقعی
شکل 10 . نمودار تیلور برای هوای گرم

Leave A Comment