dialektal korpusdagi lakunar birliklar sintaktik annotatsiyasi

DOC 7 sahifa 151,0 KB Bepul yuklash

Sahifa ko'rinishi (5 sahifa)

Pastga aylantiring 👇
1 / 7
3.2. dialektal korpusdagi lakunar birliklar sintaktik annotatsiyasi o'zbek tilidagi internet axborot matnlari korpusining sintaktik annotatsiyasi. sintaktik izohlash bu sintaktik ma'lumotni korpusga qo'shish, sintaktik strukturaning ko'rsatkichlarini matnga kiritish jarayoni . xuddi morfologik annotatsiya kabi sintaktik annotatsiya ham korpuslar uchun qiymat beradi. nutq qismlarini izohlashdagi keyingi qadamlardan biri hisoblanadi. sintaktik annotatsiyada korpusda berilgan kontekstdagi jumlalarning tarkibiy qismlari tahlil qilinadi. bu korpus lingvistikasida parsing yoki grammatik tahlil qilish deyiladi. sintaktik izohlangan korpusning ahamiyati haqida gap ketganda olimlar ikki fikrni olg'a surishadi 191 ya'ni sintaktik izohli korpus bilan biz tabiiy til ma'lumotlarining barcha xilma-xilligi va murakkabligini o'z ichiga olgan o'quv korpusiga ta'sir qilish orqali tayyorlashimiz mumkin; uning ishlashini test sifatida berilgan korpusga qarab baholash orqali tahlilchini sinab ko'rishimiz mumkin. tabiiy tilni qayta ishlash (nlp) dasturlari uchun parsing muhim hisoblanadi. chunki parsing dasturlari nlp dasturlarida sintaksis xatolarning mavjudligi to'g'risida xabar beradi, shuningdek, sintaksis tahlili uchun belgilar tizimini ishlab chiqadi. nlp dasturlari tilni tushunishi uchun sintaksis …
2 / 7
blanib, bu sxema ism, fe'l, sifat, ergash gap va ergash gapli iboralarni o'z ichiga oladi, birinchisi, ergash gap, qiyosiy gap, nominal gap kabi turli xil turlarni ajratib turadi, ikkinchisi esa turli xil jumlalar turlarini ajratadi (masalan, ot, ergash gap va predlogli iboralar). penn treebank bu jumla skeletini tahlil qilish namunasidir. masalan, barcha ismli iboralar n deb belgilanadi, ammo to'liq tahlil qilish so'z iboralarining turlarini ajratib beradi. gap sxemasini tahlil qilish to'liq tahlil qilish kabi ma'lumot bera olmasa-da, bu tahlilchilarga korpusda tezroq va izchil tahlil qilish yoki tahrirlashga imkon beradi. avtomatik parsing hali yetarlicha ishonchli emasligi sababli treebank bilan ishlov berish jarayonida qo'l mehnati bilan izohlash yoki tahrirlashdan butunlay voz kechish mumkin emas. sintaktik izohlash aslida grammatikaga binoan matnlarni avtomatik tahlil qilish bilan bog'liq jarayon hisoblanad1 . texnik jihatdan, bu matnga sintaktik tuzilishni tayinlash amaliyotiga murojaat qilish uchun ishlatiladi . korpusda sintaktik annotatsiya odatda morfologik annotatsiya aniqlangandan keyin amalga oshiriladi. chunki …
3 / 7
irdi gaplari quyidagicha izohlanadi: is[np the cat_np1 npi[vp sat vvd [pp [np the_at1 table nn i npi ppi isinp osqituvchi_np1 inp xonada nni npi [vp o;tirdi vvd ppi gaplar sintaktik annotatsiyalang:anda morfosintaktik izohlar pastki chiziqcha c) bilan beriladi. gapning ochilish va yopilishi is sl shaklida belgilandi. ammo yuqoridagi ikkita gap misolida ko'rish mumkinki, har doim ham parsing tizimlari o•xshash bo'lmaydi. asosiy va oddiy farqlarni quyidagilarda ko•rish mumkin: 1) tizim izohlaydigan gapning tarkibiy tuzilislli va 2) tarkibiy turlarning bir-biri bilan birlashish usuliga ko•ra. biroq ushbu farqlarga qaramay talllil qilish sxemalafining barchasi xususiy til grammatikasi shakliga asoslangan bo'ladi. o*zbek tilida yaratilayotgan korpuslarda sintaktik annotatsiya qo'l mehnati bilan amalga oshirilishi, agar avtomatik izohlovchi treebanklarga o'xshash resurslar tayyorlansa, korpusda bog'lash muammo emasligi avvalgi ishlarda ham tatkidlangan 194 . treebanklar bu tabiiy tillarning izohlarini turli xil tuzilmalar darajasida: so-z darajasida, iboralar darajasida, jumla darajasida, ba'zan funksiyalaming tuzilishi darajasida taqdim etadigan til resursi hisoblanadi. quyida ingliz …
4 / 7
sini bajaruvchi birliklar fe'lli birikma qismida izohlanadi. lekin ikkala qism ham bir butunlikda (s) izohlanadi. zamonaviy tilshunoslikda sxema orqali tilni tushunish mumkin deb hisoblanadi. gap va gap bo'laklarining funksional xususiyatiga ko'ra bir nechta qolip sxemalari tuziladi. o'zbek tili grammatikasiga ko'ra korpuslarda sintaktik annotatsiya sxemasi va qoliplari o'zgarishi mumkin. tillar uchun yaratilgan parser dasturlar uchun ehtimoliy qoliplarning barchasi kiritiladi, bu esa gap bo'laklarining sxemadagi tartibi o'zgarsa-da, avtomatik izohlash amalga oshiriladi. umuman, gap bo'laklarini annotatsiyalash, aniq bir qolipini belgilab olish tilning kompyuter tiliga aylantirishda, mashina tarjimasida muhim hisoblanadi. morfologik va sintaktik izohlash leksika va grammatikani rivojlantirish kabi sohalarda aniq qo‘llanilishi sababli matn korpuslari rivojlanishining hozirgi bosqichida izohlashning eng muhim turlari hisoblanadi. lemma izohi morfologik izoh bilan chambarchas bog‘liq va unga qo‘shimcha sifatida qaralishi mumkin. lemmalar shartli ravishda kichik harflar bilan yoziladi. til korpuslarida izohlashning eng asosiy turlaridan biri bu lemmatizatsiya, har bir so‘zni korpusda uning asosini (iqtibos yoki lug‘at) aniqlash va belgilash …
5 / 7
har bir nutq birligiga lemma izohi berilmoqda. korpus tilshunosligidagi tadqiqotlar turlicha bo‘lishining yana bir usuli lingvistik tahlillarning korpus ma'lumotlarining o‘zida kodlanganligi yoki yo‘qligi bilan bog‘liq. korpus izohi deb ataladigan bunday kodlashga ma'lumotlami tahrirlash yoki tarkibiga ba'zi tahlillami kiritish yoki tahlilni alohida saqlash, ma'lumotlar bilan bog‘lanish orqali erishish mumkin 183. agar korpusda tilning katta miqdordagi namunalari lingvistik belgilar orqali teglangan bo‘lsa, keyinchalik korpusdan matnlami avtomatik teglash funksiyasidan bemalol foydalanish mumkin bo‘ladi. albatta, o‘zbek tilida ingliz tilida mavjud avtomatik teggerlar bo‘lmaganligi sababli izohlash ishlari qo‘l mehnati orqali amalga oshiriladi. masalan, kontekstdagi har bir so‘ zga grammatik toifa berib, nutq qismlarini ko‘rsatishimiz uchun korpusga izohlashni kiritishimiz kerak. kiritilgan izoh saqlanadi, har safar xuddi shunday nutq qismi kontekstda uchraganda avtomatik izohlanadi. masalan, saylovchilarning so‘ zi [morf. ot+ko‘p+ qark+yas, sem. aot] tarzida izohlanadi, belgilar orqali belgilanadi. morfologik korpus izohi biroz murakkab, bajarilishi qiyindek tuyulishi mumkin, aslida tilshunoslar uchun uzoq yillar davomida ko‘z va qo‘l mehnati …

Ko'proq o'qimoqchimisiz?

Barcha 7 sahifani Telegram orqali bepul yuklab oling.

To'liq faylni yuklab olish

"dialektal korpusdagi lakunar birliklar sintaktik annotatsiyasi" haqida

3.2. dialektal korpusdagi lakunar birliklar sintaktik annotatsiyasi o'zbek tilidagi internet axborot matnlari korpusining sintaktik annotatsiyasi. sintaktik izohlash bu sintaktik ma'lumotni korpusga qo'shish, sintaktik strukturaning ko'rsatkichlarini matnga kiritish jarayoni . xuddi morfologik annotatsiya kabi sintaktik annotatsiya ham korpuslar uchun qiymat beradi. nutq qismlarini izohlashdagi keyingi qadamlardan biri hisoblanadi. sintaktik annotatsiyada korpusda berilgan kontekstdagi jumlalarning tarkibiy qismlari tahlil qilinadi. bu korpus lingvistikasida parsing yoki grammatik tahlil qilish deyiladi. sintaktik izohlangan korpusning ahamiyati haqida gap ketganda olimlar ikki fikrni olg'a surishadi 191 ya'ni sintaktik izohli korpus bilan biz tabiiy til ma'lumotlarining barcha xilma-xilli...

Bu fayl DOC formatida 7 sahifadan iborat (151,0 KB). "dialektal korpusdagi lakunar birliklar sintaktik annotatsiyasi"ni yuklab olish uchun chap tomondagi Telegram tugmasini bosing.

Teglar: dialektal korpusdagi lakunar bi… DOC 7 sahifa Bepul yuklash Telegram