مقایسه الگوریتم‌های یادگیری ماشین برای شناسایی ژن‌های مقاوم به آنتی‌بیوتیک (ARGs) در میکروبیوم خاک‌های کشاورزی؛ مطالعه موردی در شرق آسیا

نوع مقاله : مقاله پژوهشی

نویسندگان

1 گروه علوم و مهندسی خاک، دانشکده کشاورزی، دانشگاه فردوسی مشهد، مشهد، ایران

2 بخش تحقیقات پایش و بهسازی منابع خاک و آب، موسسه تحقیقات خاک و آب کشور، سازمان تحقیقات، آموزش و ترویج کشاورزی، کرج ، ایران

3 گروه علوم و مهندسی خاک، دانشکده کشاورزی، دانشگاه فردوسی مشهد، مشهد ، ایران

4 گروه کامپیوتر، سازمان جهاد دانشگاهی خراسان رضوی، مشهد، ایران

10.22059/ijswr.2026.412755.670117

چکیده

با گسترش روزافزون مقاومت آنتی‌بیوتیکی، شناسایی دقیق و جامع ژن‌های مقاومت آنتی‌بیوتیکی (ARGs) در محیط‌های طبیعی به‌ویژه خاک‌های کشاورزی، به یکی از دغدغه‌های مهم در حوزه سلامت عمومی و زیست‌محیطی تبدیل شده است. در سال‌های اخیر، بهره‌گیری از الگوریتم‌های یادگیری ماشین به‌عنوان رویکردی نوین برای تحلیل داده‌های پیچیده متاژنومیکی و بهبود شناسایی ARGs مورد توجه قرار گرفته است. در پژوهش حاضر، چهار الگوریتم یادگیری ماشین شامل جنگل تصادفی، تقویت‌ گرادیانی، ماشین بردار پشتیبان و شبکه عصبی چند لایه با هدف شناسایی ژن‌های مقاوم در میکروبیوم خاک‌های کشاورزی دو کشور هند و چین مورد مقایسه قرار گرفتند. داده‌های متاژنومیکی از پایگاه داده NCBI استخراج و توسط ابزار ARGs-OAP پردازش شدند. مجموعه‌ای از ویژگی‌های زیستی شامل محتوایGC ، فراوانی آمینواسیدها و کدون‌ها استخراج گردید. تفاوت آماری میان ژن‌های مقاوم و غیرمقاوم با آزمون Mann–Whitney بررسی شد و تنها ویژگی‌های معنادار جهت آموزش مدل‌ها انتخاب شدند. نتایج نشان داد که مدل‌ها، به‌ویژه جنگل تصادفی (با دقت 98%)، قادر به شناسایی ژن‌های مقاوم با عملکرد بالا حتی در شرایط داده‌های نامتوازن و حجم آموزش محدود بودند. این یافته‌ها نشان‌دهنده کارایی بالای ویژگی‌های زیستی منتخب و الگوریتم‌های یادگیری ماشین در شناسایی ARGs در میکروبیوم خاک‌های کشاورزی شرق آسیا است، و می‌تواند به‌عنوان ابزاری کارآمد در سیاست‌گذاری‌های زیست‌محیطی و کنترل گسترش مقاومت آنتی‌بیوتیکی مورد استفاده قرار گیرد.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Comparing Machine Learning Algorithms for Identifying Antibiotic Resistance Genes (ARGs) in the Agricultural Soil Microbiome; Case Study in East Asia

نویسندگان [English]

  • Reyhaneh KeshikNevisRazavi 1
  • Elham Farahani 2
  • Hojat Emami 1
  • Narges Abedinzadeh 3
  • Mohammad Abdolahi 4
1 Department of Soil Science, Faculty of Agriculture, Ferdowsi University of Mashhad, Mashhad, Iran
2 Soil Reclamation and Sustainable Land Management Research Department,, Soil and Water Research Institute of Iran, Agricultural Research, Education and Extension Organization (AREEO), Karaj, Iran
3 Department of Soil Science, Faculty of Agriculture, Ferdowsi University of Mashhad, Mashhad, Iran
4 Department of Computer ,, Jihad Daneshgahi, of Khorasan Razavi, Mashhad, Iran
چکیده [English]

With the escalating threat of antibiotic resistance, the accurate and comprehensive identification of antibiotic resistance genes (ARGs) in natural environments, particularly agricultural soils, has become a major concern in public and environmental health. In recent years, the application of machine learning algorithms has gained attention as a novel approach for analyzing complex metagenomic data and improving ARG detection. In this study, four machine learning algorithms—Random Forest, Gradient Boosting (XGBoost), Support Vector Machine (SVM), and Multilayer Perceptron (MLP)—were compared for their ability to identify resistance genes in the agricultural soil microbiome in India and China. Metagenomic data were obtained from the NCBI database and processed using the ARGs-OAP tool. A set of biological features, including GC content, amino acid frequency, and codon usage, was extracted. Statistical differences between resistant and non-resistant genes were assessed using the Mann–Whitney U test, and only significant features were selected for model training. The results demonstrated that the models, particularly Random Forest (with 98% accuracy), were capable of identifying resistance genes with high performance, even under conditions of imbalanced data and limited training sample size. These findings highlight the effectiveness of the selected biological features and machine learning algorithms in detecting ARGs in the agricultural soil microbiome in East Asia. This approach could serve as an efficient tool for environmental monitoring and policy-making aimed at controlling the spread of antibiotic resistance.

کلیدواژه‌ها [English]

  • Antibiotic resistance
  • Machine learning
  • Metagenomics
  • Resistance genes
  • Soil microbiome