Matnni tozalash
URL, mention, hashtag, ortiqcha belgilar va noise elementlar olib tashlanadi.
Bu MVP uzbekcha post, comment va chat matnlaridagi shovqinni kamaytiradi, standart shaklga keltiradi va keyingi NLP pipeline'lar uchun tayyorlaydi.
Research question
How can automatic text cleaning and normalization improve the quality of Uzbek social media text for downstream NLP tasks?
URL, mention, hashtag, ortiqcha belgilar va noise elementlar olib tashlanadi.
Slang, qisqartma va yozilishdagi og'ishlar standart shaklga keltiriladi.
Qayta ishlangan matnlar saqlanadi, reyting va keyingi tahlil uchun tayyor bo'ladi.
MVP scope
Login, text normalize, save, rate
Stack
Next.js + Prisma + PostgreSQL + Docker
Validation
Normalization engine test bilan tekshiriladi
Evaluation
User test va natija tahlili uchun tayyor
Project plan
Dastur real muammoni hal qiladi, rejalashtiriladi, ishlab chiqiladi, testlanadi va natijasi baholanadi.
Muammoni aniqlash va research question
WBS, Gantt va risk planning
Next.js + PostgreSQL + Prisma MVP
Test, user validation va yakuniy baholash