kompyuter lingvistikasi

PPTX 12 sahifa 2,5 MB Bepul yuklash

Sahifa ko'rinishi (5 sahifa)

Pastga aylantiring 👇
1 / 12
powerpoint presentation matn va uning birliklari qosimova hamidaxon 1. gaplar va bo'laklar 2. please provide the words and phrases you want translated. 3. belgilar va gliflar reja: kompyuter lingvistikasi matn birliklarini avtomatik qayta ishlash uchun algoritmlarni qo'llaydi. tabiiy tilni qayta ishlash (nlp) vositalari matnlarni gaplarga ajratadi (gap chegaralarini aniqlash), so'zlarga bo'ladi va nomlangan ob'ektlarni (shaxslar, joylar, tashkilotlar: "barak obama", "vashington d.s.", "maykrosoft") aniqlaydi matn tahlili birliklarning funksiyalarini o'rganadi: sintaktik bog'lanishlar (inglizcha gaplardagi fe'l-fe'l-to`ldiruvchi), semantik rollar (agent, pasient) va pragmatik jihatlar (dialoglardagi nutq harakatlari, masalan, so'rovlar, buyruqlar) til birliklari korpuslar va to'plamlar matn birliklari alohida so'zlardan (masalan, "mushuk", "it", "yugur"), morfemalardan ("sin-may-digan"), va iboralardan ("katta qizil to'p") tortib jumla va bandlargacha cho'zilishi mumkin. tahlil bigramlar ("mushuk") yoki trigramlar ("mushuk o'tirdi") kabi n-gramlarni (n ta so'z ketma-ketligini) o'z ichiga olishi mumkin braun korpusi (500+ matn, amerika ingliz tili, 1 million so'z) va penn treebank (wall street journal maqolalari, sintaksis izohlari) kabi korpuslar …
2 / 12
-100 so'z), gaplarga (10-20 so'z) va so'zlarga (5-7 harf) bo'lingan. muallif, sana, joylashuv (nyu-york shahri) kabi metama'lumotlar qo'shimcha ma'lumot beradi fayllarni boshqarish tizimlari (windows, macos, linux) hujjatlarni papkalar (masalan, "project x", "2024 reports"), pastki papkalar va kutubxonalarda tashkil qiladi. hujjat versiyalarini nazorat qilish (1.0, 1.1, 1.2 versiyalar) muhim ahamiyatga ega so'z va tokenlar matn tahlili birliklari belgilar (masalan, 1000 belgidan iborat parchani tahlil qilish) dan hujjatlargacha (masalan, universitet kutubxona bazasidan 1000 hujjatni klasterlash) o'zgaradi. gaplar ko'pgina nlp vazifalari uchun asos bo'ladi; bandlar katta ma'no birliklarini tuzadi matnni tokenlash (masalan, python'dagi nltk yordamida) xom matnni (masalan, oksford universiteti matbuotidan 2000 so'zli romanni) tinish belgilarini (nuqta, vergul) va bo'sh joylarni hisobga olgan holda tokenlar ketma-ketligiga aylantiradi. tiplar noyob so'zlarni ifodalaydi (masalan, 500 tipli lug'at hajmi) so'zlar asosiy birliklar; tokenlar voqealarni ifodalaydi (masalan, "the" 5 marta qaytarilsa, 5 token bo'ladi). matn segmentatsiyasi jumlalarga (150 jumla), bandlarga (10 band), boblarga (3 bob) bo'lishni o'z …
3 / 12
iborat glif variantlari yozuv tizimlari ichida va o'rtasida mavjud (masalan, qo'lyozma va chop etilgan, serif va sans-serif shriftlar). bu variantlar ocr (optik belgini tanib olish) aniqligiga ta'sir qiladi matn kodlash (masalan, unicode, ascii, utf-8) gliflarda raqamli qiymatlarni belgilaydi, turli yozuv tizimlarida raqamli ifoda va matnni qayta ishlash imkonini beradi bandlar va baytlar she'r tuzilishiga satr uzunligi, qofiya (aabb, abab) va oʻlchov (yambik pentametr) ta'sir qiladi; xat uzunligi sur'atga ta'sir qiladi; chikago, london, nyu-york nashriyotlari paragraf/band uzunligi va joylashuviga ta'sir qiluvchi turli formatlash konventsiyalaridan foydalanadilar. abzaslar (1-5 jumla), prozaning asosiy birliklari; baytlar (2-12+ qator), she'riy birliklar; matn segmentatsiyasi janrlarga (masalan, romanlar, she'rlar, insholar) qarab farq qiladi. gaplar (fe'l-mavzu mosligi), bo'laklar (mustaqil/to'la bo'lmagan), so'z birikmalari (ot, fe'l, ravishdosh) paragrafning asosiy tuzilishini tashkil qiladi; she'rda qator almashinuvi bandlarni ajratib turadi; tinish belgilarining (nuqta, vergul, nuqta vergul) ingliz, ispan va nemis matnlarida matn birliklarining ma'nosi va oqimiga ta'siri bor. matn tuzilmalari matn tuzilmalari hikoya …
4 / 12
edi"). aniqlovchi gaplar ("kim", "qaysi", "ki") otlarni aniqlaydi (mas., "men olgan kitob muddati o'tgan") matn birliklari (bandlar, bo'limlar, boblar): katta tuzilmalar. bandlar bog'liq gaplarni birlashtiradi; bo'limlar/boblar esa bandlarni guruhlash orqali iyerarxik tuzilmani yaratadi. bog'lovchi vositalar (olmoshlar, bog'lovchi so'zlar, o'tish iboralari) gaplar/bandlarni bog'laydi; mantiqiy ketma-ketlik (masalan, xronologik tartib, sabab-oqibat) izchillikni ta'minlaydi gaplardan (sodda, murakkab, qoʻshma, qoʻshma-murakkab) fikrni toʻliq ifodalovchi yozma/ogʻzaki muloqotning asosiy birliklari. grammatik tuzilmalar subyekt-fe'l mosligi (masalan, ingliz tilidagi birlik/koʻplik), xabar, soʻroq, buyruq, undov gap turlarini oʻz ichiga oladi; tinish belgilari (nuqta, soʻroq belgisi, undov belgisi) gap chegaralari uchun muhimdir e'tiboringiz uchun rahmat @taqdimot_robot image1.png image2.png image3.png image4.png image5.png
5 / 12
kompyuter lingvistikasi - Page 5

Ko'proq o'qimoqchimisiz?

Barcha 12 sahifani Telegram orqali bepul yuklab oling.

To'liq faylni yuklab olish

"kompyuter lingvistikasi" haqida

powerpoint presentation matn va uning birliklari qosimova hamidaxon 1. gaplar va bo'laklar 2. please provide the words and phrases you want translated. 3. belgilar va gliflar reja: kompyuter lingvistikasi matn birliklarini avtomatik qayta ishlash uchun algoritmlarni qo'llaydi. tabiiy tilni qayta ishlash (nlp) vositalari matnlarni gaplarga ajratadi (gap chegaralarini aniqlash), so'zlarga bo'ladi va nomlangan ob'ektlarni (shaxslar, joylar, tashkilotlar: "barak obama", "vashington d.s.", "maykrosoft") aniqlaydi matn tahlili birliklarning funksiyalarini o'rganadi: sintaktik bog'lanishlar (inglizcha gaplardagi fe'l-fe'l-to`ldiruvchi), semantik rollar (agent, pasient) va pragmatik jihatlar (dialoglardagi nutq harakatlari, masalan, so'rovlar, buyruqlar) til birliklari korpuslar va to'plamlar matn...

Bu fayl PPTX formatida 12 sahifadan iborat (2,5 MB). "kompyuter lingvistikasi"ni yuklab olish uchun chap tomondagi Telegram tugmasini bosing.

Teglar: kompyuter lingvistikasi PPTX 12 sahifa Bepul yuklash Telegram