ارزیابی کارایی روش های شتاب‌دهنده یادگیری ماشین به‌منظور تخمین شاخص کیفی آب رودخانه زاینده رود

نوع مقاله : مقاله پژوهشی

نویسندگان

گروه علوم و مهندسی آب، دانشکده کشاورزی، دانشگاه صنعتی اصفهان، اصفهان، ایران

چکیده

باتوجه‌به پدیده تغییر اقلیم، گرمایش کره زمین و کاهش منابع آب، کیفیت آب‌های سطحی به‌عنوان یکی از مهم‌ترین منابع آبی در جهان مورد توجه مهندسین رودخانه قرار دارد. ازآنجاکه پرکاربردترین شاخص سنجش کیفیت آب شاخص WQI است؛ هدف و اهمیت این تحقیق مدل‌سازی شاخص کیفیت آب به کمک دو روش شتاب‌دهنده یادگیری ماشین Gradient Boosting و XGBoost در رودخانه زاینده‌رود انجام‌گرفته است. در این تحقیق ابتدا بر اساس داده‌های کیفیت آب، شاخص کیفیت آب (NSFWQI) محاسبه، و در ادامه به‌منظور مدل‌سازی، از داده‌های ورودی شامل ویژگی‌های کیفی آب ۸ ایستگاه در یک دوره ۳۱ساله و همچنین شاخص کیفیت آب محاسبه شده رودخانه استفاده شد. در این تحقیق برای مدل‌سازی در محیط برنامه‌نویسی پایتون کدنویسی شده، و در مرحله آموزش ۸۰ درصد داده‌ها و در مرحله ارزیابی ۲۰ درصد باقی‌مانده مورد استفاده قرار گرفت. بر اساس نتایج معیارهای ارزیابی ضریب تعیین (R2)، میانگین قدرمطلق خطا (MAE)، حداکثر خطا (ME)، میانگین مربعات خطا (MSE)، جذر میانگین مربعات خطا (RMSE) و جذر میانگین مربعات خطای نرمال شده (NRMSE) مدل بهینه انتخاب شد. نتایج تحقیق نشان داد که در تمام ایستگاه‌ها به جز یک ایستگاه از بین مدل‌های استفاده شده، مدل GB باتوجه‌به معیارهای ارزیابی مدل عملکرد بهتری نسبت به مدل XGBoost برخوردار بوده است. همچنین نتایج نشان داد که برای صرفه‌جویی در زمان و هزینه و همچنین مدیریت بهینه ویژگی‌های کیفیت آب، انتخاب سری شماره ۳ که در آن از سه ویژگی به‌منظور برآورد شاخص کیفیت آب (WQI) استفاده می‌شود بهترین ترکیب بوده است.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Evaluation the efficiency of machine learning boosting methods for estimating the water quality index of the Zayandeh Rood River

نویسندگان [English]

  • Elham Fazel Najafabadi
  • Mohammad Shayannejad
Department of Water Science and Engineering. College of Agriculture, Isfahan University of Technology, Isfahan, Iran
چکیده [English]

Regarding climate change, global warming, and the reduction of water resources, surface water quality is of great interest to river engineers as surface water is one of the most important water resources in the world. Since the most widely used water quality index is the WQI index, the goal and importance of this research are to model the WQI using two machine learning boosting methods in the Zayandeh Rood River, Gradient Boosting and XGBoost. First, based on water quality data, the water quality index (NSFWQI) was calculated, and then, for modeling, input data including water quality characteristics of 8 stations over 31 years and the calculated WQI were used. In this study, the model was coded in the Google Colab environment, and 80% of the data was used in the training phase and the remaining 20% in the evaluation phase. Based on the results of the evaluation criteria of coefficient of determination (R2), mean absolute error (MAE), maximum error (ME), mean square error (MSE), root mean square error (RMSE), and normalized root mean square error (NRMSE), the optimal model was selected. The results of the study showed that in all stations except one station among the models used, the GB performed better than the XGBoost according to the model evaluation criteria. The results also showed that to save time and cost, and also to optimally manage water quality characteristics, the selection of the number 3 series, in which three characteristics are used to estimate the WQI, was the best combination.

کلیدواژه‌ها [English]

  • Water quality characteristics
  • Zayandeh Rood River
  • Machine learning models
  • GB
  • XGBoost