در این پروژه، رابطه خطی بین چگالی (Density) به عنوان متغیر مستقل و اسیدیته ثابت (Fixed Acidity) به عنوان متغیر وابسته، با استفاده از رگرسیون خطی ساده بر روی دادههای کیفیت شراب قرمز (Wine Quality Dataset) بررسی شده است.
مراحل انجام شده:
انتخاب نمونه تصادفی ۲۰۰ تایی از دادهها
محاسبه ماتریس همبستگی پیرسون (۰.۶۷ = همبستگی بین چگالی و اسیدیته)
آزمون معناداری همبستگی (p-value < 0.05)
برازش مدل رگرسیون خطی:
Fixed Acidity = -589.70 + 599.86 × Density
ارزیابی مدل با:
ضریب تعیین R² ≈ 0.45 (۴۵٪ از تغییرات اسیدیته توسط چگالی توضیح داده میشود)
MSE و خطای استاندارد باقیماندهها
آزمون t و فاصله اطمینان ۹۵٪ برای ضرایب (ضرایب معنادار – p-value < 2e-16)
تشخیص نادرستی مدل بدون عرض از مبدأ (عبور از صفر) با استدلال فیزیکی و آماری
محاسبه بازه اطمینان و بازه پیشبینی برای یک مشاهده جدید
رسم نمودار نهایی شامل: نقاط داده، خط رگرسیون، بازه اطمینان (نوار باریک آبی) و بازه پیشبینی (نوار پهن قرمز)
نتیجه کلیدی: چگالی تأثیر مثبت و معناداری بر اسیدیته دارد، اما به تنهایی تنها ۴۵٪ از تغییرات را توضیح میدهد – نیاز به متغیرهای بیشتری (مانند pH، قند، الکل) برای مدل دقیقتر وجود دارد.