semantik annotatsiya algoritmi

DOCX 14 sahifa 141,3 KB Bepul yuklash

Sahifa ko'rinishi (5 sahifa)

Pastga aylantiring 👇
1 / 14
3.3. dialektal korpusdagi lakunar birliklarning semantik annotatsıyasi korpus lingvistik tadqiqotlarida nisbatan keng tarqalgan lingvistik annotatsiya turlaridan biri semantik annotatsiya - korpusdagi so'z shakllarining ma'nolarini aniqlashni o'z ichiga oladi, bu so'z ma'nosini ajratish deb ham ataladi. so c z ma'nosini belgilash va ma'nolar ro c yxatidan har bir so c z shakliga mos tushunchani aniqlash algoritmini yaratish ustida tadqiqotlar amalga oshirilmoqda. makkenri, ksio, tonolar semantik izohlashni matndagi so c zlarning semantik xususiyatlarini yoki semantik maydonlarini ko'rsatadigan kodlarni tayinlaydi deb ma'lumot berishad1 [footnoteref:1] . ba'zi olimlar esa bunday algoritmlarni bilimga asoslangan, korpusga asoslangan yoki turli xil texnikalarni birlashtirgan gibrid yondashuv [1: mcenery t. , xiao r. , tono y. corpus-based language studies: an advanced resource book. — routledge, 2006.] ekanligini e'tirof etishadl• 196 shuningdek, semantik ma'lumot tufayli tilga kirish mumkinligini, konseptual bilimlar o'rtasidagi ko'prik deb hisoblashadi 197 semantik izohning keng tarqalgan ikkita turi mavjud. birinchi turi jumladagi tarkibiy qismlar o'rtasidagi semantik munosabatlarni …
2 / 14
semantik maydon tahlili bo'lib, korpusda so'zning ielsikografik ma'nolarini farqlash vositasi hisoblanadi. ba'zi tadqiqotlarda semantik maydon tartibi bir xil semantik maydonga ega so'zlarni birlashtiradi va shu bilan ma'no doirasi uchun mavjud bo'lgan so'z boyliklari ro'yxatini taqdim etadi deya baholanadi [footnoteref:2] . bu esa o'z navbatida, chet ellik o'quvchi yoki o'z ona tilida so'zlashuvchi o'quvchilar uchun tildan foydalanishda so'zlar orasidagi tuslmunarsiz ma'no farqlarini baholashga imkon beradi. [2: jackson h. , zé amvcla e. words, meaning and vocabulary: an in(roduc(ion (o modern english icxicology. london/ncw york: cassell, 2000.] semantik izohlashda til korpuslarida avtomatik teglash algoritmi ishlab chiqilishi bo c yicha tadqiqot ishlari boshlangan. bunday tadqiqot namunalarini ingliz va rus tillari milliy korpuslarida kuzatish mumkin. shu kungacha olimlar tomonidan bir qancha loyihalar amalga oshirilgan. shunday loyihalardan biri g.shtin tomonidan tayyorlangan bo c lib, bnc da 4 million so c z namunasini gries s., berez a.. linguistic annotation in/for corpus linguistics. - usa, 2()17. navarro …
3 / 14
siy kategoriyadan iborat bo'lib, ular ichida yana 232 ta kichik subkategoriyalarga bo'lingan. tizim birinchi navbatda claws taggeri yordamida har bir leksik birlikka morfologik teg tayinlaydi va keyin semtag deb nomlangan semantik teglash to'plamiga beradi. zamonaviy matnlar bilan o'tkazilgan tajribalar shuni ko'rsatganki, tizim aniqlik darajasi taxminan 920 0 ni tashkil qilgan. bugungi kunda mashhur bo'lgan ingliz tili (bnc), rus tili (rucorpora) va turk tili (tnc) korpuslarida nutq qismlarini (pos) morfologik, aksentologik, morfosintaktik teglash mavjud, ammo bunday hajmdagi korpuslar uchun ajoyib qiymati uning semantik izohlanishidir. bunday turdagi korpuslar leksik va grammatik izohlanishdan tashqari keng imkoniyatlarni taqdim etadi. masalan, bu turli leksik konstruksiyalarning qurilishi, birgalikda nutqda foydalanishi va yoki fe'llarning semantik jihatdan tavsiflangan sinflarini boshqarish bo'yicha so'rovlar o'tkazishga imkon beradi. tadqiqotimizning asosi o'zbek tili axborot matnlari korpusida til birliklarining har biri semantik izohlandi. ya'ni har bir nutq bo'lagi morfosintaktik xususiyatlaridan boshqa harakati, rangi, tovushi, miqdori, vaqti, qismi va boshqa xususiyatlariga ko c ra …
4 / 14
rilgan ta'riflar asosida qo'lda tasniflanadi. lekin shuni ta'kidlashimiz kerakki, o'zbek tilida semantik maydonni aniqlashga ko'maklashuvchi, barcha matn turlarida foydalanadigan umumiy maqsadli lug'at hali mavjud emas. mavjud bilimlar va turli lug'atlar yordamida mazkur amalni to'g'ri bajarishga harakat qildik. hozircha o'zbek tilida semantik avtomatik teglovchi dasturlar yaratilishi jarayoni endi boshlangani sababli, dasturda semantik annotatsiya qo'l mehnati orqali amalga oshirildi. lekin korpus kengaygani sari semantik izohlangan har bir birlik keyingi matnlarda uchrashi davomida avtomatik belgilanadi. yuqorida ta'kidlaganimizdek, sh.hamroyeva, d.ahmedova va a.eshmo'minovlarning korpus lingvistikasi sohasidagi tadqiqotlarida semantik izohlash bo'yicha va teglar tanlanishi yuzasidan namunalar berilgan. mavjud tadqiqotlarni tahlil qilib, hozirgi vaqtda axborot matnlari korpusi annotatsiyasida 40 ta semantik tegni tanlab olishga qaror qildik. semantik annotatsiya tasnifi asosiy semantik xususiyatlarni belgilaydigan muhim leksik bo'linmalarga ko'ra tanlandi. bular: 3.13-jadval o'zbekcha qisqartma xalqaro qisqartma ibora idiom juft so'z juft ech takror so'z tak rdp atoqli otlar aot propn antroponim (kishi ismi) ant prs toponim (joy nomi top …
5 / 14
uhi -holat fe'llari ruhi f ps ch nut fe'llari nut f s eech ishora fe'llari ishoraf semelf jismoniy holat fe 'llari jismoniyf physiol tabiiy holat fe 'llari tabiiyf changest ko'rish fe'llari ko'rishf noncaus xususiyat sifatlari xususiyats humq rang-tus sifatlari tuss physq:color ma' za-ta'm sifatlari ta'ms physq:taste hajm-o'lchov sifatlari physq:form hid sifatlari hids physq:smell makon-zamon belgisini bildiruvchi sifatlar makzams place:time mazkur tasniflashni o'z ichida yana tizimli turlarga ajratish mumkin. masalan, turlarning iyerarxik tuzilishiga ko'ra butun qism munosabatiga ko'ra, obyektning topologik holatiga ko'ra, shakli va miqdoriga ko'ra, birliklarning obyektga nisbatan baholash qiymatiga ko'ra tasniflash mumkin. korpusda jumla nutq qismlariga ajratilib, birlik lemmasi aniqlangan jarayonda, avvalo, unga morfosintaktik annotatsiya beriladi. morfosintaktik annotatsiyadan keyin birlik uchun korpusda kodlangan semantik teglar orqali izohlanish algoritmi ishlaydi. har bir semantik teglangan birlik avtomatik kodlanadi, keyingi duch kelishlarda qayta semantik izohlanishga xojat qolmaydi, dastur avtomatik teglaydi. albatta korpusda semantik annotatsiyada ba'zi birliklarning yozilishi bir xil, ammo turli vaziyatlarda …

Ko'proq o'qimoqchimisiz?

Barcha 14 sahifani Telegram orqali bepul yuklab oling.

To'liq faylni yuklab olish

"semantik annotatsiya algoritmi" haqida

3.3. dialektal korpusdagi lakunar birliklarning semantik annotatsıyasi korpus lingvistik tadqiqotlarida nisbatan keng tarqalgan lingvistik annotatsiya turlaridan biri semantik annotatsiya - korpusdagi so'z shakllarining ma'nolarini aniqlashni o'z ichiga oladi, bu so'z ma'nosini ajratish deb ham ataladi. so c z ma'nosini belgilash va ma'nolar ro c yxatidan har bir so c z shakliga mos tushunchani aniqlash algoritmini yaratish ustida tadqiqotlar amalga oshirilmoqda. makkenri, ksio, tonolar semantik izohlashni matndagi so c zlarning semantik xususiyatlarini yoki semantik maydonlarini ko'rsatadigan kodlarni tayinlaydi deb ma'lumot berishad1 [footnoteref:1] . ba'zi olimlar esa bunday algoritmlarni bilimga asoslangan, korpusga asoslangan yoki turli xil texnikalarni birlashtirgan gibrid yondashuv ...

Bu fayl DOCX formatida 14 sahifadan iborat (141,3 KB). "semantik annotatsiya algoritmi"ni yuklab olish uchun chap tomondagi Telegram tugmasini bosing.

Teglar: semantik annotatsiya algoritmi DOCX 14 sahifa Bepul yuklash Telegram