Uzbek Text Normalizer MVP

Social media matnlarini avtomatik tozalash va normalizatsiya qilish servisi.

Bu MVP uzbekcha post, comment va chat matnlaridagi shovqinni kamaytiradi, standart shaklga keltiradi va keyingi NLP pipeline'lar uchun tayyorlaydi.

Research question

How can automatic text cleaning and normalization improve the quality of Uzbek social media text for downstream NLP tasks?

Matnni tozalash

URL, mention, hashtag, ortiqcha belgilar va noise elementlar olib tashlanadi.

Normalizatsiya

Slang, qisqartma va yozilishdagi og'ishlar standart shaklga keltiriladi.

Saqlash va tahlil

Qayta ishlangan matnlar saqlanadi, reyting va keyingi tahlil uchun tayyor bo'ladi.

MVP scope

Login, text normalize, save, rate

Stack

Next.js + Prisma + PostgreSQL + Docker

Validation

Normalization engine test bilan tekshiriladi

Evaluation

User test va natija tahlili uchun tayyor

Project plan

Loyiha talablari shu yerda yopiladi

Dastur real muammoni hal qiladi, rejalashtiriladi, ishlab chiqiladi, testlanadi va natijasi baholanadi.

MVP bosqichlari

01

Muammoni aniqlash va research question

02

WBS, Gantt va risk planning

03

Next.js + PostgreSQL + Prisma MVP

04

Test, user validation va yakuniy baholash