در این پروژه یک سیستم تشخیص بیماری قلبی با استفاده از تکنیکهای Feature Extraction و کاهش ابعاد با روش تحلیل مؤلفههای اصلی (PCA) پیادهسازی شده است. دادههای مورد استفاده از مجموعه داده Heart Disease استخراج شده و پس از انجام پیشپردازش و استانداردسازی ویژگیها، فرآیند کاهش ابعاد با استفاده از PCA با ۸ مؤلفه اصلی انجام شده است تا مهمترین اطلاعات موجود در دادهها حفظ و در عین حال پیچیدگی مدل کاهش یابد.
پس از مرحله استخراج ویژگی، چندین الگوریتم یادگیری ماشین از جمله Support Vector Machine (SVM)، Random Forest و Gaussian Naive Bayes برای آموزش مدل و تشخیص بیماران مبتلا به بیماری قلبی مورد استفاده قرار گرفتهاند. عملکرد مدلها با معیارهای ارزیابی مانند Accuracy، Precision، Recall و F1-Score مورد بررسی قرار گرفته است.
نتایج بهدستآمده نشان میدهد که استفاده از تکنیک PCA برای کاهش ابعاد دادهها علاوه بر کاهش نویز و پیچیدگی محاسبات، میتواند به بهبود عملکرد مدلهای یادگیری ماشین در تشخیص بیماری کمک کند. در این پروژه مدل Random Forest با دقت حدود 93.44 درصد بهترین عملکرد را در میان مدلهای بررسیشده ارائه داده است.