tesseract optical character recognition va open cv yordamida tasvirlardan matnni ajratish

DOCX 37 стр. 1,4 МБ Бесплатная загрузка

Предварительный просмотр (5 стр.)

Прокрутите вниз 👇
1 / 37
o‘zbekiston respublikasi raqamli texnologiyalari vazirligi muhammad al-xorazmiy nomidagi toshkent axborot texnologiyalari universiteti loyiha ishi 2 mavzu: tesseract optical character recognition va open cv yordamida tasvirlardan matnni ajratish bajardi: rahbar: komissiya a'zolari: __________________ __________________ __________________ __________________ toshkent 2025 “tasdiqlayman” “att” kafedra mudiri d. zaripova_________ «___»__________ 2025yil individual loyiha guruh: mavzu: tesseract optical character recognition va open cv yordamida tasvirlardan matnni ajratish 1. asosiy ma’lumotlar _____________________________________________ 2. foydalanilgan materiallar_________________________________________ 3. dastur qismi: vscode ilovasi____________________________________________________ hisobot mundarijasi:_______________________________________________ 4. topshirish muddati:_____________________________________________ kreativ yondashuv va gramatik hatolat dastur kodlarini yozish nazariy ma’lumotlarn ishakllantirish himoya qilish va taqdimot umumiy ball maksimalball 20 40 20 20 100 to‘plaganball rahbar_____________________________________________ (imzo) (f.i.o.) (sana) talaba______________________________ _________________ ________________ ( imzo ) ( f.i.o.) (sana) mundarija: kirish ………………………………………………………………………………… 3 1-bob. optik belgilarni aniqlashdagi texnologiyalar ..……. 5 1.1 optik belgilarni aniqlash optical character recognition haqida tushuncha .. 5 1.2 mavjud kutubxonalar haqida ma’lumotlar ………....……………………. 7 1.3 tasvirga oldindan ishlov berish texnikasining foydali …
2 / 37
kli modular va kutubxonalarni tahlil qilish va o’rnatish …………... 22 2.3 asosiy kod qismi ……………………………………………………….. 24 xulosa ……………………………………………………………………...……… 31 foydalanilgan adabiyotlar ro'yxati ………………………………………………… 32 foydalanilgan internet saytlar ……………………………………………………... 33 ilova ……………………………………………………………………………….. 34 kirish tasvirlardagi matnni aniqlash faol tadqiqot yo'nalishi bo'lib, u rasmlardan matnni avtomatik o'qish qobiliyatiga ega kompyuter dasturini ishlab chiqishga harakat qiladi. hozirgi vaqtda qog'oz hujjatlarda mavjud bo'lgan ma'lumotlarni keyinchalik foydalanish uchun kompyuterda o'qiladigan shaklda saqlashga talab katta. ushbu qog'oz hujjatlardagi ma'lumotlarni kompyuter tizimiga saqlashning oddiy usullaridan biri avval hujjatlarni skanerlash va keyin ularni tasvir sifatida saqlashdir. biroq, bu ma'lumotni qayta ishlatish uchun alohida tarkibni o'qish va ushbu hujjatlarni qatorma-qator va so'zma-so'z mazmunini izlash juda qiyin. muammolar quyidagilardan iborat: qog'oz hujjatlaridagi belgilarning shrift xususiyatlari va tasvirlarning sifati. ushbu qiyinchiliklar tufayli kompyuter belgilarni o'qish paytida ularni taniy olmaydi. shunday qilib, qog'oz formatdagi hujjatlarni elektron formatga o'zgartiradigan hujjat tasvirini tahlil qilish uchun belgilarni aniqlash mexanizmlariga ehtiyoj bor. ushbu maqolada biz tasvirlardan …
3 / 37
uv jarayoni orqali bu ma'lumotlarni qayta ishlatish" talabi katta. ushbu qog'oz hujjatlardagi ma'lumotlarni kompyuter tizimiga saqlashning oddiy usullaridan biri avval hujjatlarni skanerlashdir. hujjatlarni skaner orqali skanerlaganimizda, hujjatlar kompyuter tizimida tasvir sifatida saqlanadi. ushbu rasmlarda foydalanuvchi tomonidan tahrirlana olmaydigan matn mavjud. ammo bu ma'lumotni qayta ishlatish kompyuter tizimi uchun alohida tarkibni o'qish va ushbu hujjatlarning mazmunini satr va so'zma-so'z qidirish juda qiyin. ushbu qiyinchilikning sababi qog'oz hujjatlardagi belgilarning shrift xususiyatlarining kompyuter tizimidagi belgilarning shriftlaridan farq qilishidir. natijada, kompyuter belgilarni o'qish paytida ularni taniy olmaydi. qog'oz hujjatlar tarkibini kompyuter saqlash joyida saqlash, so'ngra tarkibni o'qish va qidirish tushunchasi hujjatga ishlov berish deb ataladi. ba'zan ushbu hujjatni qayta ishlashda biz dunyodagi ingliz tilidan boshqa tillarga tegishli ma'lumotlarni qayta ishlashimiz kerak. ushbu jarayon hujjat tasvirini tahlil qilish (dia) deb ham ataladi. so'nggi yillarda dia bilan shug'ullanish uchun tadqiqotchilar tomonidan ko'plab yondashuvlar taklif qilingan, har bir yondashuvning o'ziga xos afzalliklari va cheklovlari mavjud. i-bob. optik …
4 / 37
yoki maxsus elektron plata kabi - matnni nusxalaydi yoki o'qiydi; keyin, dasturiy ta'minot odatda rivojlangan ishlov berish bilan shug'ullanadi. ocr dasturiy ta'minoti sun'iy intellekt (ai) dan tillarni yoki qo'l yozuvi uslublarini aniqlash kabi aqlli belgilarni aniqlashning (icr) yanada ilg'or usullarini amalga oshirish uchun foydalanishi mumkin. ocr jarayoni ko'pincha yuridik yoki tarixiy hujjatlarni pdf hujjatlariga aylantirish uchun ishlatiladi, shunda foydalanuvchilar hujjatlarni matn protsessorida yaratilgandek tahrir qilishlari, formatlashlari va qidirishlari mumkin. optik belgilarni aniqlash tarixi 1974 yilda rey kurzveyl kurzweil computer products, inc. kompaniyasini ishga tushirdi, uning omni-shriftli optik belgilarni aniqlash (ocr) mahsuloti deyarli har qanday shriftda chop etilgan matnni taniy oladi. u ushbu texnologiyaning eng yaxshi qo‘llanilishi ko‘zi ojizlar uchun mashinada o‘qitish qurilmasi bo‘lishiga qaror qildi, shuning uchun u matnni matndan nutqqa formatida ovoz chiqarib o‘qiy oladigan o‘qish mashinasini yaratdi. 1980 yilda kurzveyl o'z kompaniyasini qog'ozdan kompyuterga matn konvertatsiyasini tijoratlashtirishdan manfaatdor bo'lgan xerox kompaniyasiga sotdi. ocr texnologiyasi 1990-yillarning boshlarida tarixiy gazetalarni …
5 / 37
ilarni aniqlash (ocr) optik belgilarni aniqlash (ocr) hujjatning jismoniy shaklini qayta ishlash uchun skanerdan foydalanadi. barcha sahifalar nusxalangandan so'ng, ocr dasturi hujjatni ikki rangli yoki oq-qora versiyaga aylantiradi. skanerlangan tasvir yoki bitmap yorug'lik va qorong'i joylar uchun tahlil qilinadi va qorong'u joylar tan olinishi kerak bo'lgan belgilar sifatida aniqlanadi, yorug'lik joylari esa fon sifatida aniqlanadi. keyin qorong'u joylar alifbo harflari yoki raqamli raqamlarni topish uchun qayta ishlanadi. ushbu bosqich odatda bir vaqtning o'zida bitta belgi, so'z yoki matn blokini nishonlashni o'z ichiga oladi. keyin belgilar ikkita algoritmdan biri yordamida aniqlanadi - naqshni aniqlash yoki xususiyatni aniqlash. shaklni aniqlash ocr dasturiga skanerlangan hujjat yoki rasm faylidagi belgilarni solishtirish va tanib olish uchun turli shriftlar va formatlardagi matn misollari berilganda foydalaniladi. xususiyatlarni aniqlash ocr skanerlangan hujjatdagi belgilarni tanib olish uchun ma'lum bir harf yoki raqamning xususiyatlariga oid qoidalarni qo'llaganida sodir bo'ladi. xususiyatlarga belgidagi burchakli chiziqlar, kesishgan chiziqlar yoki egri chiziqlar soni kiradi. …

Хотите читать дальше?

Скачайте все 37 страниц бесплатно через Telegram.

Скачать полный файл

О "tesseract optical character recognition va open cv yordamida tasvirlardan matnni ajratish"

o‘zbekiston respublikasi raqamli texnologiyalari vazirligi muhammad al-xorazmiy nomidagi toshkent axborot texnologiyalari universiteti loyiha ishi 2 mavzu: tesseract optical character recognition va open cv yordamida tasvirlardan matnni ajratish bajardi: rahbar: komissiya a'zolari: __________________ __________________ __________________ __________________ toshkent 2025 “tasdiqlayman” “att” kafedra mudiri d. zaripova_________ «___»__________ 2025yil individual loyiha guruh: mavzu: tesseract optical character recognition va open cv yordamida tasvirlardan matnni ajratish 1. asosiy ma’lumotlar _____________________________________________ 2. foydalanilgan materiallar_________________________________________ 3. dastur qismi: vscode ilovasi____________________________________________________ hi...

Этот файл содержит 37 стр. в формате DOCX (1,4 МБ). Чтобы скачать "tesseract optical character recognition va open cv yordamida tasvirlardan matnni ajratish", нажмите кнопку Telegram слева.

Теги: tesseract optical character rec… DOCX 37 стр. Бесплатная загрузка Telegram