مدل سازی پراکنش فسفر قابل جذب در خاک‌های سطحی شمال استان خوزستان با استفاده از مدل رگرسیون خطی چندگانه و الگوریتم جنگل تصادفی

نوع مقاله : مقاله پژوهشی

نویسندگان

1 گروه علوم و مهندسی خاک، دانشکده کشاورزی، دانشگاه شهید چمران اهواز، خوزستان، ایران

2 گروه محیط زیست، دانشگاه گوئلف، آنتاریو، کانادا

چکیده

اطلاعات اندکی در رابطه با پراکنش مکانی عناصر دخیل در ارزیابی وضعیت حاصلخیزی خاک‌های استان خوزستان و به‌ویژه فسفر قابل جذب خاک‌ها وجود دارد. از این رو، مطالعه حاضر با هدف تعیین مؤثرترین ویژگی‌های خاکی کنترل کننده غلظت فسفر قابل جذب در خاک‌های شمال استان خوزستان و معرفی مناسب‌ترین روش مدل‌سازی تغییرات مکانی فسفر قابل جذب با استفاده از روش‌های رگرسیون خطی چندگانه و الگوریتم جنگل تصادفی انجام شد. بدین منظور تعداد 250 نمونه مرکب به‌صورت تصادفی به روش ابرمکعب لاتین مشروط در دی‌ماه تا بهمن ماه 1399 از خاک‌های سطحی (10-0 سانتی‌متری) اراضی شمال استان خوزستان تهیه شد. پس از آماده‌سازی‌های اولیه نمونه‌ها، ویژگی‌های فیزیکی و شیمیایی آن‌ها با استفاده از روش‌های استاندارد آزمایشگاهی اندازه‌گیری شد. سپس به‌منظور مدل‌سازی تغییرات مکانی فسفر قابل جذب خاک‌ها، داده‌های آزمایشی پس از آماده‌سازی‌های اولیه با استفاده از مدل‌های رگرسیون خطی چندگانه و جنگل تصادفی در محیط نرم‌افزار RStudio بررسی شدند. نتایج نشان داد که در 4/32 درصد از نمونه‌های مورد بررسی غلظت فسفر قابل جذب کمتر از 5 میلی‌گرم بر کیلوگرم است. نتایج ارزیابی مدل‌های رگرسیون خطی چندگانه و جنگل تصادفی براساس آماره‌های ارزیابی مدل شامل میانگین خطای مطلق (MAE)، جذر میانگین مربعات خطا (RMSE) و ضریب تبیین (R2) در هر سه مرحله‌ی آموزش، آزمون و کل داده‌ها نشان داد که مدل جنگل تصادفی با توجه به ضرایب تبیین بالاتر و همچنین مقادیر خطای کمتر، تخمین‌های بهتر و دقیق‌تری را ارائه می‌دهد. بررسی اهمیت متغیرهای خاکی در مدل‌سازی پراکنش فسفر قابل جذب در هر دو روش رگرسیون خطی چندگانه‌ و جنگل تصادفی نشان داد که محتوای کربن آلی خاک‌ها بیشترین نقش را در توزیع فسفر قابل جذب در منطقه مطالعاتی داراست. در کل به نظر می‌رسد استفاده از مدل‌هایی که روابط غیرخطی بین متغیرها را نیز لحاظ می‌نمایند در پیش‌بینی خصوصیات خاک‌ها بهتر است.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Modelling distribution of available phosphorous contents in surface soils of northern Khuzestan Province using multiple linear regression model and random forest algorithm

نویسندگان [English]

  • Saeid Hojati 1
  • Mojtaba Norouzi Masir 1
  • Asim Biswas 2
1 Department of Soil Science, ّّFaculty of Agriculture, Shahid Chamran University of Ahvaz, Khuzestan, Iran
2 School of Environmental Sciences, University of Guelph, Ontario, Canada
چکیده [English]

There is little information about the spatial distribution of elements involved in assessing the fertility of soils in Khuzestan province, especially the available phosphorus contents of the soils. Therefore, this study conducted to determine the most effective soil properties controlling the concentration of available phosphorus contents of soils in the north of Khuzestan province and to introduce the most appropriate method for modeling the spatial distribution of available phosphorus contents of the soils analyzed using linear regression and random forest algorithm. For this purpose, 250 composite soil samples (0-10 cm depth) were randomly collected using the Conditional Latin Hypercube sampling approach from December to February 2016. Then, the physical and chemical properties of the samples were determined using standard laboratory methods. The experimental data were then analyzed for descriptive statistics using SPSS software. To model the spatial variability of available phosphorus contents of soils, the experimental data were modeled using linear regression and random forest models in RStudio software. The results showed that according to the measured amounts of absorbable phosphorus in the soil samples in 32.4% of the samples, the concentration of available phosphorus is less than 5 mg/kg. Evaluation of multiple linear regression and random forest models based on model evaluation metrics including mean absolute error (MAE), root mean square error (RMSE) and coefficient of determination (R2) using training, test and the whole dataset, showed that the random forest model provides better and more accurate estimates due to higher coefficients of determination as well as lower error values. The results also illustrated that the organic carbon content of the soils has the greatest contribution in the study area to predict available contents of soil phosphorus. In conclusion, models that include non-linear relationships between variables seem to be more suitable in predicting soil properties.

کلیدواژه‌ها [English]

  • Conditioned Latin Hypercube
  • Prediction
  • Validation
  • Organic Carbon Content