یک پروژه ماشین لرنینگ هست.
یکی از مشکلات اساسی در حمل و نقل دریایی، پیش بینی میزان سوخت است
در یک سفر آینده استفاده می شود. تصور کنید به کشتی می گویید با سرعت معینی حرکت کند و شما نیاز دارید
بدانید که چه مقدار سوخت در شرایط مختلف محیطی در طول مسیر مصرف خواهد شد
سفر دریایی. برای شروع مقابله با این مشکل، ابتدا به یک مدل عملکرد کشتی نیاز داریم. مثل
مدل با توجه به مجموعه ای از ویژگی ها، میزان مصرف سوخت را پیش بینی می کند.
سرعت کشتی (بر حسب گره اندازه گیری می شود) بزرگترین پیش بینی کننده سرعت موتور اصلی است.
مصرف سوخت (برحسب تن متریک در روز اندازه گیری می شود). علاوه بر این، سایر عملیاتی و
عوامل محیطی همچنین بر مصرف سوخت موتور اصلی تأثیر میگذارند: کشتی چقدر بارگیری میکند (اندازهگیری میشود
از طریق پیش نویس [https://en.wikipedia.org/wiki/Draft_(Hull)])، بادها، زاویه سکان، وضعیت دریا (امواج)،
جاری و دیگران داده ها شامل یک فایل CSV از 16248 ردیف با 19 ستون داده از بیش از 1 سال در LPG، VLGC است.
کشتی (گاز نفت مایع، حامل گاز بسیار بزرگ
[https://en.wikipedia.org/wiki/Gas_carrier]). داده ها شامل زیرمجموعه ای از داده هایی است که ما داریم
در کشتی جمع آوری شده است. این شامل: میزان مصرف سوخت، سرعت، باد، بادکش و غیره است (جزئیات بیشتر در
ضمیمه زیر.) داده های اولیه کشتی در نمونه های 1 دقیقه ای بوده است
نمونهبرداری به نمونههای 1 ساعته در CSV ارائهشده کاهش یافت. توجه داشته باشید که نمونه ها شامل زمان می باشد
زمانی که کشتی در دریا است و همچنین زمانی که در بندر است.
سوالات
(لطفاً به انتظارات تقریبی تلاش توجه داشته باشید)
1.
یک مدل یادگیری ماشین (در پایتون) ایجاد کنید که پیشبینی نرخ Main را ارائه میدهد
مصرف سوخت موتور (MT/day) از مجموعه ای از ورودی های ویژگی. شما ممکن است تغییر دهید یا
در صورت نیاز ویژگی ها را نادیده بگیرید. با خیال راحت از هر کتابخانه منبع باز Python DS/ML استفاده کنید
که ممکن است مفید باشد لطفاً زمان زیادی را برای تنظیم هایپرپارامترهای کوچک صرف نکنید
بهبود عملکرد - مدل های خطی خوب هستند! ما خیلی بیشتر علاقه مندیم
چگونه ویژگی هایی را که برای استفاده انتخاب می کنید آماده می کنید و چگونه آن را ارزیابی می کنید
عملکرد با کیفیت. (2-3 ساعت)
2.
ما می دانیم که یک راه حل کامل برای این کار مدل سازی به زمان و تلاش بیشتری نیاز دارد. اگر
شما 2 هفته دیگر برای صرف این پروژه وقت داشتید، آیا کاری انجام می دهید؟
متفاوت، یا علاوه بر آن؟ در صورت وجود، چه اطلاعات یا داده های اضافی ممکن است مفید باشد؟
راه حل خود را به عنوان یک نوت بوک Jupyter Task 1 ارسال کنید.
فایل requires.txt که تمامی وابستگی ها را شناسایی می کند. سوال 2 را می توان به عنوان آخرین خانه پاسخ داد
دفترچه یادداشت یا در کنار آن به صورت فایل جداگانه ارسال شود.