klasterlash

PPTX 50 pages 5.8 MB Free download

Page preview (5 pages)

Scroll down 👇
1 / 50
презентация powerpoint mavzu-6. klasterlash klasterizatsiya masalasi klasterizatsiya masalasi – o'qituvchisiz o'rgatish masalasi (unsupervised learning) berilgan: – obyektlar fazosi – o'rgatuvchi tanlanma – obyektlar orasidagi masofa funksiyasi topish kerak: – klasterlar to'plami – klasterlash algoritmi: - har bir klaster yaqin o'zaro yaqin obyektlardan tashkil topgan - turli klasterlar obyektlari sezilarli turlicha joylashgan klasterizatsiya masalasi nokorrektligi masalaning aniq qo'yilishi mavjud emas; klasterizatsiya sifatini baholovchi kriteriyalar ko'p; klasterizatsiyaning ko'plab evristik metodlari mavjud; y klasterlar soni oldindan ma'lum emas; klasterlashning natijasi p metrikaga kuchli bog'liq, metrikaning tanlovi ham evristika namuna: qancha klaster mavjud? klasterlashning maqsadi berilganlarni qayta ishlashni osonlashtirish x l to'plamni o'xshash obyektlar guruhlariga bo'lish. natijada har bir guruh bilan alohida ishlash mumkin (klassifikatsiya, regressiya) saqlanadigan berilganlar hajmini kamaytirish: har bir klasterdan bittadan vakil qoldirish orqali notipik obyektlarni ajratish hech qaysi klasterga mos kelmaydigan obyektlarni ajratish obyektlar to'plamining ierarxiyasini qurish taksonomiya masalasi (masalan, k.linneyning hayvonlar va o'simliklar klassifikatsiyasi) klaster tuzilmalarning turlari jamlangan: odatda …
2 / 50
'xshashlik prinsipiga ko'ra shakllanmasligi mumkin, aksincha, obyektlarning oldindan ma'lum bo'lmagan xossalariga ko'ra shakllanishi mumkin klasterlar umuman mavjud bo'lmasligi mumkin. bunday holda klasterlash emas, berilganlarni tahlil qilishning boshqa usullarini qo'llash kerak har bir klasterlash algoritmi o'z cheklovlariga ega va ayrim turdagi klasterlarnigina ajrata oladi "klaster tuzilmaning turi" tushunchasi usulga bog'liq va formal aniqlanishiga ega emas normallashtirish klasterlash natijasi qiymatlarni normallashtirishga bog'liq ichma-ich klasterlar it algoritmlar algoritmlar va berilganlar strukturalari mashinali o'qitish usullari metrik fazoda klasterlash sifati obyektlar orasida juftliklar masofalari ma'lum bo'lsin. klaster ichidagi o'rtacha masofa: klasterlar aro o'rtacha masofa: funksionallar juftligining munosabati: chiziqli vektor fazoda klasterlash sifati obyektlar vektor ko'rinishida berilgan bo'lsin. klaster ichidagi o'rtachalar masofalari yig'indisi: – a klaster – a klasterning og'irlik markazi klasterlar aro o'rtacha masofa: funksionallar juftligining munosabati: k o'rtacha usuli (k-means) lloyd algoritmi (voronoi diagrammasi) k o'rtacha usuli (k-means) takrorlash: har bir xi ni yaqin markazga tayinlash: markazlarning yangi joylashuvini hisoblash: toki ai o'zgarmaguncha k …
3 / 50
shga intiladi klasterdagi berilganlar zichligini hisobga olmaydi optimal k ni topish. tirsak usuli (elbow rule) klaster ichidagi kvadratlar yig'indisi (within-cluster-sum-of-squares (wcss)) g'oyasiga asoslanadi. optimal k ni topish. siluet usuli (silhouette method) klasterdagi nuqtalar o'rtacha masofasi (a) va eng yaqin klastergacha bo'lgan o'rtacha masofa (b) orqali hisoblanadi: natija manfiy bo'lsa yomon, musbat bo'lsa yaxshi degan ma'noda ishlatiladi. optimal klaster soni eng katta siluet qiymatida olinadi. dbscan algoritmi density-based clustering algorithm – zichlikka asoslangan klasterlash algoritmi. klaster berilganlar fazosida yuqori zichlikdagi nuqtalar sohasidan tashkil topadi va boshqa klasterlar bilan past zichlikdagi tutash sohalar orqali bog'lanadi degan g'oyaga asoslanadi. afzalliklari: katta hajmdagi berilganlarda tezkor klasterlash ixtiyoriy shakldagi klasterlar obyektlarni yadro, chegara va shovqin obyektlarga ajratish k-means vs dbscan dbscan algoritmi parametrlari: minpts – soha zich deb hisoblanishi uchun zarur minimal nuqtalar soni eps (ε) – har qanday nuqtaning yaqinidagi nuqtalarni aniqlash uchun ishlatiladigan masofa o'lchovi nuqtalar turlari: yadro nuqta (core) – o'zidan n …
4 / 50
va 1-qadamga o'tiladi klasterdagi har bir qo'shni nuqta uchun qo'shnilik hisobi rekursiv takrorlash orqali kengaytiriladi. bunda, ε atrofida minptsdan kam nuqta bo'lsa chegara nuqta deb belgilanadi belgilanmagan nuqtalar qolgan bo'lsa 1-qadamga o'tish. https://www.naftaliharris.com/blog/visualizing-dbscan-clustering/ k-medians va k-medoids algoritmlari k-means algoritmidan farqlari: k-medians algoritmida o'rtacha qiymatning o'rniga qiymatlarning medianasi topiladi (mediana – qiymatlarning o'rtasi) k-medoids algoritmida o'rtacha qiymatning o'rniga qiymatlarning medoidi topiladi (medoid – qiymatlarning o'rtasi, mavjud nuqtalardangina) k-medians va k-medoids algoritmlari namuna: [1, 2, 3, 4, 100000] o'rtachasi = 20002 mediana = 3 medoid = 3 https://scikit-learn-extra.readthedocs.io/en/stable/generated/sklearn_extra.cluster.kmedoids.html k-medians va k-medoids algoritmlari afzalliklari: shovqin va noto'g'ri obyektlarga nisbatan turg'un, chunki o'zaro farqlarni minimallashtiradi k-medoid ixtiyoriy masofa metrikalari bilan ishlaydi (k-means odatda evklid metrikasida, k-medians manhetten metrikasida ishlaydi) kamchiliklari: murakkab algoritm hisoblash murakkabligi o(n2*k*i), k-meansda esa o(n*k*i) k-means++ algoritmi k-means algoritmining natijasi sentroidlarning boshlang'ich joylashuviga bog'liq k-means++ algoritmi sentroidlarni tanlash uchun k-means algoritmining kengaytirilgan variant – k-means++ algoritmi mavjud. sentroidlarni tanlash quyidagi ketma-ketlikda …
5 / 50
ash qat'iymas klasterlash (c-means algoritmi) qat'iymas klasterlash (fuzzy (soft) clustering, c-means) qat'iy klasterlash (hard clustering, k-means) c-means algoritmi 1973 yilda j.c.dunn tomonidan yaratilgan va 1981 yilda j.c.bezdek tomonidan takomillashtirilgan. ishlatilish sohalari: bioinformatika (genlar), rasmlarni tahlil qilish, marketing qat'iymas klasterlash (c-means algoritmi) algoritm quyidagicha: klasterlar sonini va epsilon qiymatini tanlash har bir nuqta uchun klasterlarga tegishlilik koeffitsientlarini tasodifiy tanlash (tegishlilik matritsasi) tegishlilik koeffitsientlari epsilon aniqlikda o'zgarmaguncha takrorlash: har bir klaster uchun sentroidni tanlash har bir nuqta uchun klasterga tegishlilik koeffitsientlarini hisoblash qat'iymas klasterlash (c-means algoritmi) tegishlilik matritsasi: sentroidni tanlash tegishlilikni hisoblash minimallashtirishga intiluvchi maqsad funksiya m – giperparametr, klaster qanchalik qat'iymas bo'lishini aniqlaydi, qancha katta bo'lsa shuncha qat'iymas bo'ladi. odatda m = 2 qat'iymas klasterlash afzalliklari: moslashuvchanlik: qat'iymas klasterlash bir-birini yopadigan klasterlarni yaratish imkonini beradi. bu berilganlar murakkab tuzilmaga ega bo'lganda juda foydali barqarorlik: qat'iymas klasterlash shovqin va noto'g'ri obyektlarga turg'un, chunki bir klasterdan ikkinchisiga bosqichma-bosqich o'tish imkonini beradi interpretatsiya: qat'iymas …

Want to read more?

Download all 50 pages for free via Telegram.

Download full file

About "klasterlash"

презентация powerpoint mavzu-6. klasterlash klasterizatsiya masalasi klasterizatsiya masalasi – o'qituvchisiz o'rgatish masalasi (unsupervised learning) berilgan: – obyektlar fazosi – o'rgatuvchi tanlanma – obyektlar orasidagi masofa funksiyasi topish kerak: – klasterlar to'plami – klasterlash algoritmi: - har bir klaster yaqin o'zaro yaqin obyektlardan tashkil topgan - turli klasterlar obyektlari sezilarli turlicha joylashgan klasterizatsiya masalasi nokorrektligi masalaning aniq qo'yilishi mavjud emas; klasterizatsiya sifatini baholovchi kriteriyalar ko'p; klasterizatsiyaning ko'plab evristik metodlari mavjud; y klasterlar soni oldindan ma'lum emas; klasterlashning natijasi p metrikaga kuchli bog'liq, metrikaning tanlovi ham evristika namuna: qancha klaster mavjud? klasterlashning maqsad...

This file contains 50 pages in PPTX format (5.8 MB). To download "klasterlash", click the Telegram button on the left.

Tags: klasterlash PPTX 50 pages Free download Telegram