برونسپاری
آموزش آنلاین
کسب درآمد
×

Natural Language processing with Python

بودجه
از
۴۰۰,۰۰۰ تومان
تا
۲,۰۰۰,۰۰۰ تومان
زمان پیشنهادی
۲ روز
(۳)
تهران
وضعیت
کامل شده
ثبت پیشنهاد روی پروژه
ثبت پروژه مشابه
Take six different samples of Gutenberg digital books, which are all of six different genres and of six different authors, that are semantically similar. Separate and set aside unbiased random partitions for training and test (Do you really need test section in clustering?). The overall aim is to produce similar clusters and compare them; analyze the pros and cons of algorithms, generate and communicate the insights. Prepare the data: create random samples of 200 documents of each book, representative of the source input. Preprocess the data; prepare the records of 150 words records for each document, Label them as a, b, c etc. as per the book they belong to so can later compare with clusters. Transform to BOW and TF-IDF (also use other features LDA, Word-Embedding). Use at least K-means, EM, Hierarchical clustering algorithms to compare. Evaluation: Calculate Kappa against true authors, Coherence and Silhouette. Perform Error-Analysis: Identity what were the characteristics of the instance records that threw the machine off, using the top 10 frequent words and/or top collocations. Document your steps, explain the results effectively, using graphs. Verify and validate your programs; Make sure your programs run without syntax or logical errors.

کیفیت حرفه‌ای

مشاهده جزئیات پیشنهادهای این پروژه
گزارش تخلف
ثبت پیشنهاد روی پروژه
ثبت پروژه مشابه
پروژه را با دوستان خود به اشتراک بگذارید
کپی لینک
پروژه‌های اسپانسر
پروژه‌های مشابه
کارلنسر را در شبکه های اجتماعی دنبال کنید
شماره تماس ۲۸۴۲۶۴۴۳ ۰۲۱
آدرس ایمیل info@karlancer.com
پشتیبانی