python nltk kutubxonasi

PPTX 10 pages 435.3 KB Free download

Page preview (5 pages)

Scroll down 👇
1 / 10
powerpoint presentation python nltk kutubxonasi dasturlash texnologiyalari 1. nltk kutubxonasiga kirish 2. matnni qayta ishlashning asosiy usullari 3. nltk bilan murakkab vazifalar reja: lemmatizatsiya va stemming ingliz tili uchun porter stemmeri va lemmatizatsiya uchun wordnetlemmatizer algoritmlaridan foydalanib, 5000 ta tweet’ni tahlil qilish natijalari shuni ko'rsatdiki, stemming tezroq bo'lsa-da, lemmatizatsiya semantik tahlil uchun samaraliroqdir. stemming va lemmatizatsiya algoritmlarini taqqoslash natijalariga ko'ra, lemmatizatsiya 20% ko'proq hisoblash vaqtini talab qiladi, ammo natijalar aniqroq bo'ladi, masalan, toshkent shahri misolida. nltk kutubxonasi yordamida o'zbek tilidagi 1000 ta so'zdan iborat korpusda lemmatizatsiya jarayonini amalga oshirish, so'zlarning asosiy shakllarini aniqlashda 90% aniqlikka erishish mumkin. qismdan so'z tahlili nltk kutubxonasi yordamida o'zbekiston hududida to'plangan 10 000 dan ortiq so'zdan iborat korpusda so'z tahlili o'tkazish mumkin, bu esa grammatik tuzilmalarni aniqlashga imkon beradi. nltk'ning pos-tagging (so'z turkumlari aniqlash) funksiyasi 30 dan ortiq turkumni aniqlay oladi, bu esa toshkent universiteti tomonidan o'qitilgan modellar bilan yanada aniqroq natijalar beradi. so'z tahlili …
2 / 10
ularning ma'nolarini aniqlash imkoniyatini beradi, natijalar esa toshkent shahridagi universitetlarda tadqiqotlar uchun ishlatilishi mumkin. sintaksis tahlili nltk da mavjud boʻlgan 20 ga yaqin turli xil sintaktik tahlil vositalari, jumladan, dependency grammar va constituency parsing algoritmlaridan foydalanib, turli xil til ma'lumotlarini tahlil qilish mumkin. nltk kutubxonasi yordamida oʻzbekiston hududida toʻplangan 1000 ta gapdan iborat korpusda sintaktik tahlil oʻtkazish imkoniyatini beradi va natijalarni daraxtshaklarda (tree structures) tasvirlaydi. ingliz tilidagi 50 ta jumladan iborat namunaviy toʻplamga sintaktik tahlil qoʻllash orqali nltk ning tarkibiy grammatikalar (constituency grammars) bilan ishlash imkoniyatlarini koʻrsatish mumkin. stanford universiteti tomonidan ishlab chiqilgan vositalar bilan integratsiyalashuv mavjud. nltk ning qo'llanilishi nltk kutubxonasi yordamida 2000 dan ortiq turli tillardagi matnlarni tahlil qilish, jumladan, o'zbek tili hamda ingliz, rus tillarida lemmatizatsiya va morfologik tahlilni amalga oshirish mumkin. nltk, 1990-yillarning oxiridan boshlab rivojlanib kelayotgan va 30 dan ortiq mamlakatdagi olimlar tomonidan qo'llaniladigan, tabiiy tilni qayta ishlashda keng qo'llaniladigan vositadir. o'zbekiston bo'yicha 50 dan …
3 / 10
lish, lemmatizatsiya, stemmatizatsiya, sintaksis tahlili kabi vazifalarni bajarish uchun 500 dan ortiq algoritm va ma'lumotlar to'plamlarini taklif etadi, masalan, wordnet kabi lug'atlarni o'z ichiga oladi. matnni oldindan qayta ishlash matnni oldindan qayta ishlashda, 3 grammatik xususiyatni (fe'l, ot, sifat) aniqlash uchun nltk ning "pos_tag" funksiyasi samarqand viloyatidan olingan 100 ta tweetda ishlatilishi mumkin, bu esa matn tahlilini yaxshilaydi. nltk kutubxonasi yordamida matnni oldindan qayta ishlash jarayonida, masalan, 5000 ta so'zdan iborat toshkent shahridagi gazeta maqolasini tozalashda, to'xtash belgilarini olib tashlash va kichik harflarga o'tkazish kabi bosqichlar muhim ahamiyatga ega. nltk yordamida andijon viloyatidan olingan 20 ta turli xil matn namunalarini oldindan qayta ishlashda, lemmatizatsiya va stemming kabi texnikalarni qo'llash orqali, lug'atdagi 1500 ta so'zni hisobga olgan holda, matnni samarali tarzda soddalashtirish mumkin. e'tiboringiz uchun rahmat @taqdimot_robot image1.jpeg
4 / 10
python nltk kutubxonasi - Page 4
5 / 10
python nltk kutubxonasi - Page 5

Want to read more?

Download all 10 pages for free via Telegram.

Download full file

About "python nltk kutubxonasi"

powerpoint presentation python nltk kutubxonasi dasturlash texnologiyalari 1. nltk kutubxonasiga kirish 2. matnni qayta ishlashning asosiy usullari 3. nltk bilan murakkab vazifalar reja: lemmatizatsiya va stemming ingliz tili uchun porter stemmeri va lemmatizatsiya uchun wordnetlemmatizer algoritmlaridan foydalanib, 5000 ta tweet’ni tahlil qilish natijalari shuni ko'rsatdiki, stemming tezroq bo'lsa-da, lemmatizatsiya semantik tahlil uchun samaraliroqdir. stemming va lemmatizatsiya algoritmlarini taqqoslash natijalariga ko'ra, lemmatizatsiya 20% ko'proq hisoblash vaqtini talab qiladi, ammo natijalar aniqroq bo'ladi, masalan, toshkent shahri misolida. nltk kutubxonasi yordamida o'zbek tilidagi 1000 ta so'zdan iborat korpusda lemmatizatsiya jarayonini amalga oshirish, so'zlarning asosiy shakl...

This file contains 10 pages in PPTX format (435.3 KB). To download "python nltk kutubxonasi", click the Telegram button on the left.

Tags: python nltk kutubxonasi PPTX 10 pages Free download Telegram