سلام من یک کد آماده برای یک کاری تجمیع داده های count بصورت هفتگی دارم اما نیاز به یک اصلاح و بهینه سازی دارد. به این صورت که یک دیتا فریم دارم شامل سه ستون id و تاریخ و count .
کدی که دارم یک مجموعه از سری های زمانی بر هر id در فرمت دیتافریم ایجاد می کند که از اولین تاریخ موجود در دیتا فریم شروع می شود و به بیشترین تاریخ ختم می شود. به طور مثال اگر 1/1/2010 اولین (کمترین) تاریخ و 12/30/2022 آخرین تاریخ موجود در دیتافریم باشند این بازه زمانی برای همه id ها تشکیل می شود و سپس روزهایی که در آنها برای count مقدار داشتیم همون count در نظر گرفته میشه و گرنه صفر هست.
در خروجی هم من می خواهم بر اساس هفته جدا یا (bin) شود و count ها تجمیع شود. مثلا اولین روز 2/5/2010 است و اگر به تقویم بروید و هفته را با آغاز Sunday و پایان Saturday در نظر بگیرید از 2/7/2010 تا 2/13/2010 یک هفته در نظر گرفته می شود و روز آخر هفته که Saturday 2/13/2010 است ملاک ما برای تجمیع است.
۱- کدی که دارم کار می کند اما داده های تکراری به اشتباه ایجاد می کند.
۲- کد برای یک دیتا با سایز بسیار بزرگ استفاده می شود لذا سریع بودن آن خیلی برای من مهم هست.
۳- من فقط به دنبال دیتافریمی هستم که در خروجی اشاره کردم. هر روش که سریعتر به من جواب بده برای من بهتره.
ضمنا تاریخ ها همه با فرمت mm/dd/yyyy است. ممنون.