mantiqiyqidiruvmodeli

PPTX 46 sahifa 750,7 KB Bepul yuklash

Sahifa ko'rinishi (5 sahifa)

Pastga aylantiring 👇
1 / 46
title lug'atlarni qayta tiklash asoslari mantiqiy qidiruv modeli 2 mantiqiy qidiruv modeli - bu qiduruv jarayonida mantiqiy ifoda ko'rinishida ifodalash mumkin bo’lgan har qanday so'rovni qayta ishlashingiz (bu erda and, not, or). daryo ziyonet kun tuit mantiqiy 1 1 0 1 qidiruv 0 1 1 0 modeli 1 1 0 0 strukturasi 0 0 1 0 agar “mantiqiy qidiruv modeli” so’rovi qidirilayotgan bo’lsa, bunda 1101&0110&1100 = 0100. bu so’rovga javob – ziyonet da mavjud bo’ladi. lug'atlar uchun tuzilmalarni qidirish invertlangan indeks va so'rovni inobatga olgan holda, birinchi vazifamiz har bir so'rov termni lug'atda mavjudligini aniqlash va agar mavjud bo'lsa, tegishli ma’lumotga mos ko'rsatgichni aniqlashdir. ushbu qidirish operatsiyasi lug'at deb ataladigan klassik ma'lumotlar strukturasidan foydalanadi va ikkita keng toifadagi yechimlarga ega: heshlash va qidiruv daraxtlari. 3 heshlash heshlash – har bir termni butun songa aylantirib qidirishda qidiriladi. tegishli lekin beradi va butun son lemmasi bir bo’lgan turli shakldagi so’zlarni heshlashda qiymat …
2 / 46
odatda ildiz so'z oxirida qo'llaniladi. ish* [ “rang”, “rangli”, “ish”, “ishchi”, “ishlagan”, … ] [ “ish”, “ishchi”, “ishlagan” ] 7 the question mark (?) belgisi so’roq (?) belgisi – so'zning istalgan joyida bitta belgini ifodalash uchun ishlatiladi. bu so'zning o'zgaruvchan imlolari mavjud bo'lganda va bir vaqtning o'zida barcha variantlarni qidirishda foydali hisoblanadi. ra?g [ “rang”, “rangli”, “ish”, “ishchi”, “ishlagan”, … ] [“rang”, “rangli”] 8 umumiy joker so'rovlari vaqtinchalik indekslar (permuterm indexes) – bu $ - maxsus belgini termni oxirini bildirish uchun so’zning bir nechta variantini qidirish uchun foydalaniladi. vaqtinchalik belgilariga ega bo'lgan termlar to'plami vaqtinchalik lug'at (permuterm vocabulary) deb ataladi. 9 so'rovni qayta ishlash 10 ayni paytda biz lug'atdagi joker so'rovga mos keladigan barcha atamalarni sanab o'tamiz. masalan, so'rovni ko'rib chiqish: se*ate and fil*er ! bu ko'plab mantiqiy va so'rovlarning bajarilishiga olib kelishi mumkin. sec. 3.2 b-daraxtlar so'rov term ining oxirida * ni ishlatadi 11 so'rov muddati o'rtasida * ni …
3 / 46
qidiruvi sifatida qabul qiling va post filtrdan foydalaning h*a*o uchun o$h* ga qarab h*o ni qidiringpost filtrdan keyingi hello va halo ni saqlang joker belgili so'rovlarni qo’llash (python) 14 pythonda regex (regular expressions – “muntazam ifodalar”) kutubxonasidan foydalanib joker belgilarni amalga oshirishimiz mumkin. qo’shish (+) belgisi bir yoki bir nechta belgilarga mos kelish uchun ishlatiladi (masalan, yulduzcha * belgisi). import re # regular expression library wordlist = ["color", "colour", "work", "working", "fox", "worker"] for word in wordlist: # + belgisi yulduzcha * belgisi o’rnida ishlatiladi if re.search('work.+', word) : print (word) natija: working worker joker belgili so'rovlarni qo’llash (python) 15 pythonda regex (regular expressions – “muntazam ifodalar”) kutubxonasidan foydalanib joker belgilarni amalga oshirishimiz mumkin. nuqta (.) belgisi so'roq (?) belgisi o'rnida ishlatiladi. import re wordlist = ["color", "colour", "work", "working", "fox", "worker", "working"] for word in wordlist: # nuqta (.) belgisi so'roq (?) belgisi o'rnida ishlatiladi if re.search('col.r', word) : …
4 / 46
2 bigram indeksiga misol k-gramm indeksi k-grammlardan tashkil topgan so‘rov asosida atamalarni topadi (bu yerda k=2). mo on among $m mace along amortize madden among sec. 3.2.2 18 k-gram indekslari 19 vaqtinchalik indeks oddiy bo'lsa-da, u bir term uchun bir necha takrorlanishlar sonidan sezilarli muammoga olib kelishi mumkin; ingliz tilidagi atamalar lug'ati uchun bu deyarli o'n baravar ko'p joyni ko'rsatishi mumkin. buning uchun k-gramm dan foydalaniladi. k-gram – bu shunday ketma-ketlik bo’lib, termlar k uzunlikdagi bo’laklarga ajratiladi. agar k=1 bo’lsa “unigrams”, k=2 bo’lsa “bigrams” va k=3 bo’lsa “trigrams” deb ataladi. misol uchun, catastrophic uchun: unigrams: [“c”, “a”, “t”, “a”, “s”, “t”, “r”, “o”, “p”, “h”, “i”, “c”] bigrams: [“ca”, “at”, “ta”, “as”, “st”, “tr”, “ro”, “op”, “ph”, “hi”, “ic”] trigrams: [“cat”, “ata”, “tas”, “ast”, “str”, “tro”, “rop”, “oph”, “phi”, “hic”] k-gram indekslari k-gram indeksi k-gramni o'z ichiga olgan barcha mumkin bo'lgan lug'at atamalari ro'yxatiga moslashtiradi. quyidagi rasmda bigram "ur" ga …
5 / 46
lgan so'zlarning “nomzodlar” ro'yxatini shakllantirishda eng ko'p tuzatishlarni topish uchun "k-gramm o‘xshashligi" dan foydalanish mumkin. xato yozilgan so'zni ko’rib chiqamiz: "appe". undagi bigramlar uchun e'lonlar ro'yxati quyida ko'rsatilgan. e'tibor bering, bular faqat e'lonlar ro'yxatining namunaviy to'plamlari; haqiqiy e'lonlar ro'yxati, albatta, ularda minglab so'zlarni o'z ichiga oladi. 23 imlo tuzatish uchun ilovalar web search phones word processing 24 imlo tuzatish vazifalari 25 imlo xatosini aniqlash imlo xatosini tuzatish: avtomatik tuzatish htethe tuzatishni taklif qiling takliflar ro'yxati imlo xatolarining turlari 26 non-word xotliklar graffe giraffe real-word xatoliklar matn terishdagi xatliklar three there kognitiv xatolar (gomofonlar) piecepeace, too  two your you’re non-word tuzatish kontekstga sezgir emas real-word tuzatish kontekstga sezgir bo'lishi kerak non-word imlo xatoliklari 27 non-word imlo xatosini aniqlash: lug'atda bo'lmagan har qanday so'z xato hisoblanadi lug'at qanchalik katta bo'lsa, shuncha yaxshi. (internet noto'g'ri imlolarga to'la, shuning uchun internet lug'at bo'lishi shart emas ...) non-word imlo xatolarini tuzatish:: nomzodlarni yarating: xatoga …

Ko'proq o'qimoqchimisiz?

Barcha 46 sahifani Telegram orqali bepul yuklab oling.

To'liq faylni yuklab olish

"mantiqiyqidiruvmodeli" haqida

title lug'atlarni qayta tiklash asoslari mantiqiy qidiruv modeli 2 mantiqiy qidiruv modeli - bu qiduruv jarayonida mantiqiy ifoda ko'rinishida ifodalash mumkin bo’lgan har qanday so'rovni qayta ishlashingiz (bu erda and, not, or). daryo ziyonet kun tuit mantiqiy 1 1 0 1 qidiruv 0 1 1 0 modeli 1 1 0 0 strukturasi 0 0 1 0 agar “mantiqiy qidiruv modeli” so’rovi qidirilayotgan bo’lsa, bunda 1101&0110&1100 = 0100. bu so’rovga javob – ziyonet da mavjud bo’ladi. lug'atlar uchun tuzilmalarni qidirish invertlangan indeks va so'rovni inobatga olgan holda, birinchi vazifamiz har bir so'rov termni lug'atda mavjudligini aniqlash va agar mavjud bo'lsa, tegishli ma’lumotga mos ko'rsatgichni aniqlashdir. ushbu qidirish operatsiyasi lug'at deb ataladigan klassik ma'lumotlar strukturasidan foydalanadi va ik...

Bu fayl PPTX formatida 46 sahifadan iborat (750,7 KB). "mantiqiyqidiruvmodeli"ni yuklab olish uchun chap tomondagi Telegram tugmasini bosing.

Teglar: mantiqiyqidiruvmodeli PPTX 46 sahifa Bepul yuklash Telegram