پروژه من در راستای تحلیل احساسات مشتریان (Sentiment Analysis) توسط متن کاوی از نظرات مشتریان در وب سایت فروشگاه آمازون در خصوص محصولات موبایل می پردازیم، در این پروژه به منظور شناسایی ویژگی ها و خصوصیات یک محصول موبایل و تاثیر آن بر رضایت مشتری نیاز به استخراج داده ها و تحلیل آنها به شرح ذیل داریم.
-ابتدا نظرات مشتریان در رابطه با کالای موبایل ( برندهای ایفون، سامسونگ، شیائومی ، هواوی) جمع آوری و در قالب یک فایل (db.) جمع آوری شود.
-برای حصول نتیجه شفاف تر ، نظرها در مرحله پیش پردازش داده ها با استفاده از الگوریتم پاکسازی داده ها (Data Cleaning) پالایش شوند.
-در مرحله بعد داده ها با روش طبقه بندی متون (Text Classification) نظرات به دو دسته مثبت و منفی تقسیم شوند.سپس هر دسته از نظرات مثبت و منفی به صورت جداگانه با استفاده از روش مدل سازی موضوع ها (Topic Modeling)تجزیه و تحلیل می شوند.می توان برای این مورد از روش تخصیص پنهان دریکله (Latent Dirichlent Allocation) یا (supervised machine learning ) ویا (Naive Bayes) یا ماشین بردار پشتیبان (Support vector Machine) استفاده کرد.
-برای هر گروه مثبت و یا منفی استخراج تاپیک ها به صورت نمایش ابری (word Cloud) ارائه گردد.
-جدول نتایج استخراج تاپیک های مثبت و منفی ، ده کلمه با احتمال بالاتر در هر موضوع به صورت جدول ارائه گردد.
-خود برنامه نیز با توضیحات ارائه گردد به طوری که با تغییر لینک صفحه و بررسی سایر محصولات نیز به همین روش قابل تحلیل باشد.