jaro-winkler similarity algoritmi

DOCX 28 стр. 1,1 МБ Бесплатная загрузка

Предварительный просмотр (5 стр.)

Прокрутите вниз 👇
1 / 28
kurs ishi mavzu: jaro-winkler similarity algoritmi asosida noto‘g‘ri yozilgan so‘zni to‘g‘ri variantlariga o‘xshashlik asosida taklif qilish mundarija kirish 3 algoritmlarni ishlatishdagi asosiy maqsadlar 3 algoritmlarning asosiy xususiyatlari 3 jaro-winkler algoritmi va uning ishlash tamoyillari 5 algoritmning ishlash bosqichlari 6 jaro-winkler algoritmini amaliy masalalarda qo‘llash yo‘nalishlari 6 jaro-winkler algoritmining boshqa algoritmlar bilan o‘xshashliklari va farqli tomonlari 9 noto‘g‘ri yozilgan so‘zlar ustida ishlashning nazariy asoslari 11 imlo xatolarining tasnifi 12 xatolarni tuzatishda foydalaniladigan metodlar 12 noto‘g‘ri yozilgan so‘zlarni to‘g‘irlashda jaro-winkler algoritmidan foydalanilgan dasturiy ta’minot 17 dasturning psevdokodi 17 dasturning blok sxemasi 19 dasturning ishlash jarayoni 20 dasturning aniqlilik darajasi 20 natija 23 dasturning clob muhitida yozilgan kodi 25 kodning ishlash natijasi 26 xulosa 28 foydalanilgan adabiyotlar 29 kirish algoritm keng maʼnoda faqat kompyuterga oid atama boʻlmay, balki unda berilgan koʻrsatmalarni bajara oluvchi har qanday narsaga oiddir. agar algoritm ishlab chiqilgan boʻlsa, uni yechilayotgan masala bilan tanish boʻlmagan biron bir ijrochiga, shu jumladan …
2 / 28
ompyuterga berilgan vazifani aniq va izchil bajartirish. masalan, imlo xatolarini tuzatish, qidiruv natijalarini saralash, so‘zlar o‘xshashligini aniqlash, yuzlarni tanish, yo‘lni topish, ma’lumotlarni filtrlash — bularning barchasi algoritmlar yordamida amalga oshiriladi. algoritmlarning asosiy xususiyatlari 1. aniqlik (deterministiklik): har bir qadam tushunarli va aniqlangan bo‘lishi kerak. 2. tugallik (terminatsiya): algoritm cheklangan bosqichda yakunlanishi kerak. 3. natijadorlik (effektivlik): har bir qadam bajarilishi mumkin va maqsadga xizmat qilishi kerak. 4. kirish va chiqish: algoritm biror kirish (input) ma’lumotiga ega bo‘ladi va yakunda chiqish (output) hosil qiladi. algoritmlar odatda quyidagi shakllarda ifodalanadi: 1.so‘z bilan (matnli); 2.blok-sxema (grafik); 3.psevdokod (yarim dastur ko‘rinishida); 4.dasturlash tili (python, c++, java va boshqalar orqali). algoritmlar bugungi raqamli texnologiyalar davrida inson ishini avtomatlashtirishda hal qiluvchi rol o‘ynaydi. har qanday muammoni algoritmga aylantira olish — zamonaviy muhandis va dasturchilar uchun muhim ko‘nikmadir. shu jumladan, noto‘g‘ri yozilgan so‘zlarni aniqlash va ularni tuzatish ham maxsus algoritmlar yordamida hal etiladi. masalan, jaro-winkler algoritmi ana shunday …
3 / 28
iri — jaro-winkler algoritmi bo‘lib, u ikkita satr orasidagi farq va o‘xshashlikni matematik model asosida hisoblab, eng yaqin moslikdagi so‘zlarni aniqlash imkonini beradi. ushbu algoritm, ayniqsa, noto‘g‘ri yozilgan so‘zlar bilan lug‘atdagi to‘g‘ri so‘zlar orasidagi o‘zaro yaqinlikni baholashda samarali qo‘llaniladi. mazkur kurs ishida jaro-winkler algoritmiga asoslangan holda noto‘g‘ri yozilgan so‘zlarni aniqlash va ularni to‘g‘ri variantlari bilan almashtirish usullari tahlil qilinadi. ishda algoritmning matematik asoslari, amaliy dasturiy ko‘rinishi, eksperimentlar natijalari va xulosa hamda tavsiyalar keltiriladi. shuningdek, algoritmni real so‘zlar ustida qo‘llash misollar bilan yoritilib, natijalar asosida samaradorlik darajasi baholanadi. jaro-winkler algoritmi va uning ishlash tamoyillari axborotni qayta ishlash tizimlarida so‘zlar va matnlar ustida bajariladigan operatsiyalarni avtomatlashtirish dolzarb masalalardan biri hisoblanadi. ayniqsa, noto‘g‘ri yozilgan so‘zlarni avtomatik to‘g‘rilash, foydalanuvchiga eng yaqin variantni taklif qilish kabi vazifalar axborot izlash, matnni avtomatik tuzatish, so‘zlarni klassifikatsiya qilish va boshqa tabiiy tilni qayta ishlash (natural language processing – nlp) vazifalarida katta ahamiyatga ega. bu turdagi masalalarni hal qilishda …
4 / 28
. jaro algoritmi ikki so‘z orasidagi o‘xshashlikni mos keluvchi belgilar soni va ularning joylashuvidagi farq (transpozitsiya) asosida hisoblaydi. masalan, agar foydalanuvchi “mahmud” so‘zini “mahmut” deb yozsa, bu ikki so‘z juda o‘xshash, lekin oxirgi harfi farq qiladi. shu kabi hollarda jaro algoritmi so‘zlar orasidagi belgilar bo‘yicha yaqinlikni aniq baholay oladi. jaro algoritmi bazasida yaratilgan jaro-winkler algoritmi 1990-yillarda william winkler tomonidan takomillashtirildi. bu algoritm ikkita muhim o‘zgarish kiritadi: 1. so‘zlarning boshida joylashgan bir xil belgilar muhimroq deb baholanadi (ya’ni prefiks muvofiqligi). 2. so‘zlar orasidagi umumiy o‘xshashlik darajasini oshirish uchun prefiksga og‘irlik beriladi. misol: “salom” va “salim” so‘zlari bosh harflari bo‘yicha mos keladi, bu esa ularning umumiy o‘xshashligini oshiradi. bunda jaro-winkler algoritmi foydalanuvchi ehtimol yozgan to‘g‘ri so‘zni aniqlashda aniqroq natija beradi. algoritmning ishlash bosqichlari jaro-winkler algoritmi quyidagi asosiy bosqichlarda ishlaydi: 1. mos keluvchi belgilarni aniqlash. har bir belgining mos keladigan oralig‘i aniqlanadi. 2. transpozitsiyalarni aniqlash. belgilar bir xil bo‘lsa-da, joylashuvi farq qilsa, bu …
5 / 28
nlayn tarjimonlar yoki izlash tizimlarida keng qo‘llaniladi. misol: foydalanuvchi "fizka" deb yozdi. dasturda mavjud so‘zlar ro‘yxatidan quyidagilar mavjud: "fizika" – jaro-winkler qiymati: 0.94 "filka" – jaro-winkler qiymati: 0.78 "fayzika" – jaro-winkler qiymati: 0.81 algoritm eng yuqori o‘xshashlik darajasiga ega bo‘lgan "fizika" so‘zini taklif qiladi. 2. avtomatik to‘ldirish (auto-complete) tizimlari uchun:foydalanuvchi biror so‘zni to‘liq yozmay turib, dastur so‘zning to‘liq shaklini taklif etadi. jaro-winkler algoritmi boshlang‘ich harflar mos kelishini inobatga olib, prefiksga og‘irlik bergani uchun bu kabi tizimlarda ayniqsa foydalidir. misol: foydalanuvchi “mex” deb yozmoqda. dastur quyidagi variantlarni baholaydi: “mexanika” – jaro-winkler: 0.89 “mexnat” – jaro-winkler: 0.84 “matematika” – jaro-winkler: 0.42 “mexanika” va “mexnat” variantlari yuqori o‘xshashlikka ega bo‘lib, foydalanuvchiga taklif etiladi. 3. ma’lumotlar bazasidagi dublikat yozuvlarni aniqlash uchun: ma’lumotlar bazasida ba’zan bir xil shaxs yoki obyekt turli nomlar bilan takroran kiritiladi. bu dublikat yozuvlarni aniqlashda jaro-winkler algoritmi aynan ism, familiya, manzil, firma nomi kabi matnli maydonlar bo‘yicha ishlatiladi. misol: “mahmudov asqar” …

Хотите читать дальше?

Скачайте все 28 страниц бесплатно через Telegram.

Скачать полный файл

О "jaro-winkler similarity algoritmi"

kurs ishi mavzu: jaro-winkler similarity algoritmi asosida noto‘g‘ri yozilgan so‘zni to‘g‘ri variantlariga o‘xshashlik asosida taklif qilish mundarija kirish 3 algoritmlarni ishlatishdagi asosiy maqsadlar 3 algoritmlarning asosiy xususiyatlari 3 jaro-winkler algoritmi va uning ishlash tamoyillari 5 algoritmning ishlash bosqichlari 6 jaro-winkler algoritmini amaliy masalalarda qo‘llash yo‘nalishlari 6 jaro-winkler algoritmining boshqa algoritmlar bilan o‘xshashliklari va farqli tomonlari 9 noto‘g‘ri yozilgan so‘zlar ustida ishlashning nazariy asoslari 11 imlo xatolarining tasnifi 12 xatolarni tuzatishda foydalaniladigan metodlar 12 noto‘g‘ri yozilgan so‘zlarni to‘g‘irlashda jaro-winkler algoritmidan foydalanilgan dasturiy ta’minot 17 dasturning psevdokodi 17 dasturning blok sxemasi 19 dastu...

Этот файл содержит 28 стр. в формате DOCX (1,1 МБ). Чтобы скачать "jaro-winkler similarity algoritmi", нажмите кнопку Telegram слева.

Теги: jaro-winkler similarity algorit… DOCX 28 стр. Бесплатная загрузка Telegram