پروژه OCR بر روی مجموعه داده ارقام دستنویس هدی (Hoda)
این پروژه شامل پیادهسازی تشخیص نوری حروف (OCR) برای شناسایی ارقام دستنویس با استفاده از مجموعه داده هدی (Hoda) است. تحلیلها در یک نوتبوک Jupyter انجام شده و مراحل پیشپردازش داده، آموزش مدل و ارزیابی مدل را نمایش میدهد.
مجموعه داده
- منبع: مجموعه داده هدی یک مجموعه داده ارقام دستنویس فارسی است. جزئیات بیشتر و لینک دانلود:
https://web.archive.org/web/20200201185337/http://farsiocr.ir
- توضیحات: این مجموعه داده شامل تصاویر ارقام دستنویس (۰-۹) است. هر تصویر یک تصویر خاکستری با ابعاد ۳۲x۳۲ پیکسل است.
الزامات
برای اجرای نوتبوک، به کتابخانههای زیر نیاز دارید:
- pandas
- numpy
- matplotlib
- scikit-learn
-glob
- jupyter
میتوانید کتابخانههای مورد نیاز را با استفاده از فرمان زیر نصب کنید:
pip install glob pandas numpy matplotlib scikit-learn