katta ma'lumotlar to‘plami uchun klasterlash usullarining qiyosiy tahlili.

DOCX 11 pages 915.6 KB Free download

Page preview (5 pages)

Scroll down 👇
1 / 11
mavzu: katta ma'lumotlar to‘plami uchun klasterlash usullarining qiyosiy tahlili. reja: 1.kirish 2.klasterlash usullarining nazariy asoslari 3.asosiy klasterlash usullari va ularning qiyosiy tahlili 4.klasterlash usulining afzalliklari va kamchiliklari 5.amaliy natijalar va taqqoslash 6.xulosa. 7.foydalanilgan adabiyotlar. kirish. hozirgi davrda texnologiya rivoji natijasida ma'lumotlar hajmi juda tez sur’atda oshib bormoqda. har kuni milliardlab foydalanuvchilar internetda turli faoliyatlarni amalga oshirishi, sanoat korxonalari, davlat muassasalari va ilmiy markazlar tomonidan katta hajmdagi ma'lumotlar yaratib borilishi natijasida big data (katta ma'lumotlar) tushunchasi paydo bo‘ldi. ushbu ma’lumotlarni samarali tahlil qilish va foydali xulosalar chiqarish uchun turli ma’lumotlarni qayta ishlash usullari talab qilinadi. klasterlash algoritmlari esa katta ma'lumotlarni samarali tahlil qilishda asosiy usullardan biri hisoblanadi. klasterlash mashinali o‘rganishning nazoratsiz o‘rganish (unsupervised learning) turiga mansub bo‘lib, ma’lumotlarni o‘zaro o‘xshashlik mezoniga asoslangan holda guruhlarga ajratish jarayonidir. ushbu usul katta va murakkab tuzilishga ega bo‘lgan ma’lumotlarni tushunish, vizualizatsiya qilish hamda ulardan samarali foydalanishga imkon beradi. klasterlash bugungi kunda quyidagi muhim sohalarda keng …
2 / 11
ing) usullaridan biri bo‘lib, u o‘xshash obyektlarni guruhlarga ajratish va bir-biridan farqli obyektlarni turli klasterlarga joylashtirish jarayonidir. klasterlash katta hajmdagi ma’lumotlarni tahlil qilish, vizualizatsiya qilish va ma’lumotlar strukturasini tushunishga yordam beradi. klasterlash algoritmlarining nazariy asoslarini yaxshiroq tushunish uchun quyidagi jihatlarni ko‘rib chiqamiz: klaster tushunchasi va asosiy tamoyillar klasterlash algoritmlarining asosiy turlari klasterlash jarayoni va uning bosqichlari klaster tushunchasi va klasterlash tamoyillari klaster tushunchasi klaster – bu umumiy xususiyatlarga ega bo‘lgan obyektlarning to‘plami bo‘lib, ushbu obyektlar o‘xshashlik yoki yaqinlik mezonlari asosida bir guruhga birlashtiriladi. klasterlashning asosiy maqsadi: o‘xshash obyektlarni bitta guruhga jamlash bir-biridan farqli obyektlarni turli klasterlarga ajratish ma’lumotlarning strukturasini tushunish va vizualizatsiya qilish klasterlarning xususiyatlari: klaster ichidagi obyektlar bir-biriga o‘xshash bo‘lishi kerak. har xil klasterlardagi obyektlar bir-biridan maksimal darajada farq qilishi kerak. klasterlar soni oldindan belgilanishi yoki algoritm tomonidan avtomatik aniqlanishi mumkin. klasterlash algoritmlarining asosiy turlari klasterlash usullari quyidagi asosiy turlarga bo‘linadi: klasterlash jarayoni va uning bosqichlari klasterlash algoritmi quyidagi …
3 / 11
nlanadi har bir obyekt eng yaqin markazga bog‘lanadi klaster markazlari qayta hisoblanadi jarayon markazlar barqaror holatga kelgunga qadar takrorlanadi iyerarxik klasterlash (agglomerativ usul) iyerarxik klasterlashda obyektlar bosqichma-bosqich guruhlanadi. quyidagi diagrammada iyerarxik klasterlash natijasi dendrogramma shaklida tasvirlangan: afzalliklari: klasterlar sonini oldindan belgilash shart emas dendrogramma orqali natijani vizual ko‘rish mumkin dbscan klasterlash (zichlikka asoslangan) dbscan algoritmi obyektlarning zichligi asosida klasterlar hosil qiladi. quyidagi diagrammada dbscan natijasi aks etgan: 🟢🟢🟢🟢 (klaster 1) 🔵🔵🔵🔵 (klaster 2) ⚫ (noise – klasterga tegishli emas) afzalliklari: klasterlar sonini oldindan belgilash talab etilmaydi noaniq shakldagi klasterlarni aniqlay oladi gaussian mixture model (gmm) gmm klasterlarni yumshoq ajratish (soft clustering) asosida hosil qiladi. quyidagi diagrammada klasterlar orasidagi chegara aniq emas, ular bir-biriga o‘tib boradi: 🟡🟢🔵 (ranglar asta-sekin o‘zgaradi) afzalliklari: klasterlar o‘zaro qisman bir-biriga o‘tishi mumkin murakkab shakldagi klasterlarni aniqlashga moslashuvchan klasterlash usullarining qiyosiy tahlili k-means – katta hajmdagi ma’lumotlar uchun tezkor va samarali usul, ammo klaster sonini oldindan bilish …
4 / 11
terlash usullarining umumiy afzalliklari ma’lumotlarni avtomatik guruhlash klasterlash algoritmlari nazoratsiz o‘rganish usullari bo‘lib, ular oldindan belgilangan yorliqlarsiz (label) ma’lumotlarni guruhlashi mumkin. bu katta hajmdagi tasniflanmagan ma’lumotlarni tuzilgan shaklga keltirish uchun foydalidir. ma’lumotlar tahlili va tushunishni yaxshilash klasterlash ma’lumotlarning ichki tuzilishini vizualizatsiya qilish va muhim tendensiyalarni aniqlash imkonini beradi. masalan, marketing sohasida iste’molchilar segmentatsiyasini amalga oshirish mumkin. ma’lumotlar siqish (data compression) klasterlash yordamida o‘xshash ma’lumotlar bitta umumiy vakil orqali ifodalansa, ma’lumot hajmini kamaytirish mumkin. bu ma’lumotlarni samarali saqlash va qayta ishlash imkonini beradi. anomaliyalarni aniqlash klasterlash normal va anomaliyalar (outliers) orasidagi farqni aniqlashga yordam beradi. dbscan kabi zichlikka asoslangan usullar firibgarlikni aniqlash, hujumlarni aniqlash, sensor ma’lumotlarida xatolarni topish uchun qo‘llaniladi. moslashuvchanlik va ko‘p sohalarda qo‘llanilishi klasterlash biologiya, biznes, geologiya, kompyuter fanlari va boshqa ko‘plab sohalarda muvaffaqiyatli qo‘llaniladi. dori vositalarini tadqiq qilish, tibbiy tashxis qo‘yish, internetdagi ma’lumotlarni filtrlash kabi ko‘plab sohalarda ishlatiladi. klasterlash usullarining umumiy kamchiliklari klaster sonini oldindan aniqlash zarurati k-means, …
5 / 11
obyektlarni ham shovqin sifatida baholashi mumkin. hisoblash murakkabligi va resurs talabi iyerarxik klasterlash katta hajmdagi ma’lumotlar uchun juda sekin ishlaydi (o(n²) yoki o(n³)). gmm kabi statistik modellar ko‘p hisob-kitob talab qiladi, ayniqsa katta hajmdagi ma’lumotlar bilan ishlaganda. klasterlarning murakkab shakllarini aniqlash qiyinligi k-means faqat sfera shaklidagi klasterlar bilan yaxshi ishlaydi. murakkab shakldagi klasterlar uchun dbscan yoki gmm kabi usullar ishlatiladi. har bir klasterlash usulining afzalliklari va kamchiliklari k-means klasterlash afzalliklari: tez ishlaydi va katta hajmdagi ma’lumotlarga mos keladi. oddiy va samarali algoritm. tahlil qilish va tushunish oson. kamchiliklari: klasterlar sonini oldindan belgilash kerak. shovqin va anomaliyalar natijaga ta’sir qiladi. faqat sfera shaklidagi klasterlar bilan yaxshi ishlaydi. iyerarxik klasterlash afzalliklari: klaster sonini oldindan belgilash shart emas. dendrogramma yordamida klasterlash jarayoni tushunarli bo‘ladi. kamchiliklari: katta hajmdagi ma’lumotlar uchun sekin ishlaydi. jarayon qaytarib bo‘lmaydi (bir marta ajratilgan yoki birlashtirilgan klasterlarni o‘zgartirib bo‘lmaydi). dbscan klasterlash afzalliklari: klaster shakli bo‘yicha cheklov yo‘q, murakkab strukturalarni ham …

Want to read more?

Download all 11 pages for free via Telegram.

Download full file

About "katta ma'lumotlar to‘plami uchun klasterlash usullarining qiyosiy tahlili."

mavzu: katta ma'lumotlar to‘plami uchun klasterlash usullarining qiyosiy tahlili. reja: 1.kirish 2.klasterlash usullarining nazariy asoslari 3.asosiy klasterlash usullari va ularning qiyosiy tahlili 4.klasterlash usulining afzalliklari va kamchiliklari 5.amaliy natijalar va taqqoslash 6.xulosa. 7.foydalanilgan adabiyotlar. kirish. hozirgi davrda texnologiya rivoji natijasida ma'lumotlar hajmi juda tez sur’atda oshib bormoqda. har kuni milliardlab foydalanuvchilar internetda turli faoliyatlarni amalga oshirishi, sanoat korxonalari, davlat muassasalari va ilmiy markazlar tomonidan katta hajmdagi ma'lumotlar yaratib borilishi natijasida big data (katta ma'lumotlar) tushunchasi paydo bo‘ldi. ushbu ma’lumotlarni samarali tahlil qilish va foydali xulosalar chiqarish uchun turli ma’lumotlarni qay...

This file contains 11 pages in DOCX format (915.6 KB). To download "katta ma'lumotlar to‘plami uchun klasterlash usullarining qiyosiy tahlili.", click the Telegram button on the left.

Tags: katta ma'lumotlar to‘plami uchu… DOCX 11 pages Free download Telegram