dialektal korpusdagi lakunar birliklarning semantik annotatsiyasi

DOC 14 pages 206.5 KB Free download

Page preview (5 pages)

Scroll down 👇
1 / 14
3.3. dialektal korpusdagi lakunar birliklarning semantik annotatsıyasi korpus lingvistik tadqiqotlarida nisbatan keng tarqalgan lingvistik annotatsiya turlaridan biri semantik annotatsiya - korpusdagi so'z shakllarining ma'nolarini aniqlashni o'z ichiga oladi, bu so'z ma'nosini ajratish deb ham ataladi. so c z ma'nosini belgilash va ma'nolar ro c yxatidan har bir so c z shakliga mos tushunchani aniqlash algoritmini yaratish ustida tadqiqotlar amalga oshirilmoqda. makkenri, ksio, tonolar semantik izohlashni matndagi so c zlarning semantik xususiyatlarini yoki semantik maydonlarini ko'rsatadigan kodlarni tayinlaydi deb ma'lumot berishad1 . ba'zi olimlar esa bunday algoritmlarni bilimga asoslangan, korpusga asoslangan yoki turli xil texnikalarni birlashtirgan gibrid yondashuv ekanligini e'tirof etishadl• 196 shuningdek, semantik ma'lumot tufayli tilga kirish mumkinligini, konseptual bilimlar o'rtasidagi ko'prik deb hisoblashadi 197 semantik izohning keng tarqalgan ikkita turi mavjud. birinchi turi jumladagi tarkibiy qismlar o'rtasidagi semantik munosabatlarni belgilaydi, ikkinchi turi esa matndagi so'zlarning semantik xususiyatlarini belgilaydi. biz ishimizda semantik izohlarning ikkinchi turi bilan cheklanib qolamiz, chunki bu …
2 / 14
emantik maydon tartibi bir xil semantik maydonga ega so'zlarni birlashtiradi va shu bilan ma'no doirasi uchun mavjud bo'lgan so'z boyliklari ro'yxatini taqdim etadi deya baholanadi . bu esa o'z navbatida, chet ellik o'quvchi yoki o'z ona tilida so'zlashuvchi o'quvchilar uchun tildan foydalanishda so'zlar orasidagi tuslmunarsiz ma'no farqlarini baholashga imkon beradi. semantik izohlashda til korpuslarida avtomatik teglash algoritmi ishlab chiqilishi bo c yicha tadqiqot ishlari boshlangan. bunday tadqiqot namunalarini ingliz va rus tillari milliy korpuslarida kuzatish mumkin. shu kungacha olimlar tomonidan bir qancha loyihalar amalga oshirilgan. shunday loyihalardan biri g.shtin tomonidan tayyorlangan bo c lib, bnc da 4 million so c z namunasini gries s., berez a.. linguistic annotation in/for corpus linguistics. - usa, 2()17. navarro b., mart'mez-barco p., palomar m. semantic annotation of a natural language corpus for knowledge ex(rac(ion. natural language processing and information systems, international conferencc on applications of natural language (o information systems, alican(c. - spain, 2()()5. …
3 / 14
kazilgan tajribalar shuni ko'rsatganki, tizim aniqlik darajasi taxminan 920 0 ni tashkil qilgan. bugungi kunda mashhur bo'lgan ingliz tili (bnc), rus tili (rucorpora) va turk tili (tnc) korpuslarida nutq qismlarini (pos) morfologik, aksentologik, morfosintaktik teglash mavjud, ammo bunday hajmdagi korpuslar uchun ajoyib qiymati uning semantik izohlanishidir. bunday turdagi korpuslar leksik va grammatik izohlanishdan tashqari keng imkoniyatlarni taqdim etadi. masalan, bu turli leksik konstruksiyalarning qurilishi, birgalikda nutqda foydalanishi va yoki fe'llarning semantik jihatdan tavsiflangan sinflarini boshqarish bo'yicha so'rovlar o'tkazishga imkon beradi. tadqiqotimizning asosi o'zbek tili axborot matnlari korpusida til birliklarining har biri semantik izohlandi. ya'ni har bir nutq bo'lagi morfosintaktik xususiyatlaridan boshqa harakati, rangi, tovushi, miqdori, vaqti, qismi va boshqa xususiyatlariga ko c ra izohlandi va maxsus teglar bilan belgilandi. rus tili milliy korpusida semantik annotatsiya bir buncha tizimli ishlab chiqilgan. masalan, korpusda taksonomik sinflar tizimi ishlab chiqilgan. bu sifatlar uchun o'lcham, masofa, miqdor, vaqt, jismoniy va insoniy xususiyatlarni ichiga oladi. …
4 / 14
i bajarishga harakat qildik. hozircha o'zbek tilida semantik avtomatik teglovchi dasturlar yaratilishi jarayoni endi boshlangani sababli, dasturda semantik annotatsiya qo'l mehnati orqali amalga oshirildi. lekin korpus kengaygani sari semantik izohlangan har bir birlik keyingi matnlarda uchrashi davomida avtomatik belgilanadi. yuqorida ta'kidlaganimizdek, sh.hamroyeva, d.ahmedova va a.eshmo'minovlarning korpus lingvistikasi sohasidagi tadqiqotlarida semantik izohlash bo'yicha va teglar tanlanishi yuzasidan namunalar berilgan. mavjud tadqiqotlarni tahlil qilib, hozirgi vaqtda axborot matnlari korpusi annotatsiyasida 40 ta semantik tegni tanlab olishga qaror qildik. semantik annotatsiya tasnifi asosiy semantik xususiyatlarni belgilaydigan muhim leksik bo'linmalarga ko'ra tanlandi. bular: 3.13-jadval o'zbekcha qisqartma xalqaro qisqartma ibora idiom juft so'z juft ech takror so'z tak rdp atoqli otlar aot propn antroponim (kishi ismi) ant prs toponim (joy nomi top top gidronim (suv havzalari nomi) gid hyd 200 lashevskaja o., shcmanacva o. semanlic annolalion laycr in russian national corpus: lexical classcs of nouns and adjcclivcs. hllps://publicalions.hsc.ru/mirror/pubs/sharc/foldcr/j3hsyhlz15/dirccl/69147252.pdf famili a fam famn otasinin ismi otalsm …
5 / 14
-ta'm sifatlari ta'ms physq:taste hajm-o'lchov sifatlari physq:form hid sifatlari hids physq:smell makon-zamon belgisini bildiruvchi sifatlar makzams place:time mazkur tasniflashni o'z ichida yana tizimli turlarga ajratish mumkin. masalan, turlarning iyerarxik tuzilishiga ko'ra butun qism munosabatiga ko'ra, obyektning topologik holatiga ko'ra, shakli va miqdoriga ko'ra, birliklarning obyektga nisbatan baholash qiymatiga ko'ra tasniflash mumkin. korpusda jumla nutq qismlariga ajratilib, birlik lemmasi aniqlangan jarayonda, avvalo, unga morfosintaktik annotatsiya beriladi. morfosintaktik annotatsiyadan keyin birlik uchun korpusda kodlangan semantik teglar orqali izohlanish algoritmi ishlaydi. har bir semantik teglangan birlik avtomatik kodlanadi, keyingi duch kelishlarda qayta semantik izohlanishga xojat qolmaydi, dastur avtomatik teglaydi. albatta korpusda semantik annotatsiyada ba'zi birliklarning yozilishi bir xil, ammo turli vaziyatlarda turli ma'nolarga ega birliklar masalasida murakkablikka duch keldik. shunday birliklardan biri omonimlar masalasi. masalan, fe'l shakllari bo'yicha omonimlik masalasiga lemmatizatsiya orqali yechim topilishi d.ahmedova tadqiqotida hal qilingan . qolgan so'z shakllari o'rtasidagi omonimlik masalasi "tug'ro" internet axborot matnlari korpusida o'z yechimini topgan. …

Want to read more?

Download all 14 pages for free via Telegram.

Download full file

About "dialektal korpusdagi lakunar birliklarning semantik annotatsiyasi"

3.3. dialektal korpusdagi lakunar birliklarning semantik annotatsıyasi korpus lingvistik tadqiqotlarida nisbatan keng tarqalgan lingvistik annotatsiya turlaridan biri semantik annotatsiya - korpusdagi so'z shakllarining ma'nolarini aniqlashni o'z ichiga oladi, bu so'z ma'nosini ajratish deb ham ataladi. so c z ma'nosini belgilash va ma'nolar ro c yxatidan har bir so c z shakliga mos tushunchani aniqlash algoritmini yaratish ustida tadqiqotlar amalga oshirilmoqda. makkenri, ksio, tonolar semantik izohlashni matndagi so c zlarning semantik xususiyatlarini yoki semantik maydonlarini ko'rsatadigan kodlarni tayinlaydi deb ma'lumot berishad1 . ba'zi olimlar esa bunday algoritmlarni bilimga asoslangan, korpusga asoslangan yoki turli xil texnikalarni birlashtirgan gibrid yondashuv ekanligini e'tir...

This file contains 14 pages in DOC format (206.5 KB). To download "dialektal korpusdagi lakunar birliklarning semantik annotatsiyasi", click the Telegram button on the left.

Tags: dialektal korpusdagi lakunar bi… DOC 14 pages Free download Telegram