data mining va data warehousing tushunchalari

DOCX 13 pages 17.1 KB Free download

Page preview (5 pages)

Scroll down 👇
1 / 13
oʻzbekiston respublikasi oliy ta’lim, fan va innovatsiyalar vazirligi mustaqil ish mavzu: data mining va data warehousing tushunchalari tayyorladi: akobirbek ruzikulov kirish 1. ma'lumotlarni qazib olish asoslari 2. ma'lumotlar ombori tushunchalari 3. ma'lumotlarni qazib olish va ma'lumotlar omborining integratsiyasi xulosa foydalanilgan adabiyotlar kirish “kirish” ma’lumotlar omborida etl jarayonining dastlabki 25% qismi, ma’lumotlarni tozalash va transformatsiya qilish kabi muhim bosqichlarni o’z ichiga oladi, bu esa yakuniy tahlil sifatini oshiradi. “kirish” fazasida ko’pincha 8-12 ta asosiy ma’lumot manbalaridan olingan ma’lumotlar sinov tariqasida yuklanadi, bu esa keyinchalik kengaytirilgan miqyosda xatoliklarni aniqlashga yordam beradi. “kirish” bosqichida, 7 xil turdagi ma’lumotlar formati (masalan, csv, json, xml) bilan ishlash talab etiladi, bu esa moslashuvchanlik va turli manbalardan ma’lumot olish qobiliyatini sinovdan o’tkazadi. ma'lumotlarni qazish nima? ma'lumotlarni qazish - bu katta hajmdagi ma'lumotlar to'plamidan qimmatli naqshlar, tendentsiyalar va 10 yildan ortiq davr mobaynida yashirin bilimlarni avtomatik ravishda topish jarayoni. ushbu jarayon statistik usullar, masalan, regressiya, klassifikatsiya va klasterlash …
2 / 13
r ombori - bu operatsion tizimlardan farqli o'laroq, ma'lumotlarni saqlash va tahlil qilish uchun mo'ljallangan, 99.9% ishonchlilikni ta'minlaydigan markaziy repozitoriydir. ma'lumotlarni qazish va ma'lumotlar omborining asosiy farqlari ma'lumotlarni qazish namunalarni topish uchun ma'lumotlarni tahlil qiladi, ma'lumotlar ombori esa qaror qabul qilish uchun markazlashtirilgan saqlash joyidir. farq shundaki, birinchisi o'zgaruvchan, ikkinchisi esa 100% barqaror. ma'lumotlarni qazish predictive analytics va data discovery kabi texnikalardan foydalanadi, data ombori esa etl jarayonlariga (extract, transform, load) tayangan holda ma'lumotlarni yig'adi va tashkil etadi. 5-bosqichli farq muhim. data mining 20% biznes qobiliyati va 80% analitik modelga tayanadi, data ombori esa sql so'rovlari va hisobot vositalari orqali tarixiy ma'lumotlarga kirishni ta'minlaydi. 2 ta asosiy yondashuv farqi mavjud. ma'lumotlarni qazishning asosiy vazifalari klassifikatsiya vazifasi ma'lumotlar to'plamida oldindan belgilangan sinflarga tegishli obyektlarni aniqlash uchun ishlatiladi, 80% aniqlik bilan. assotsiatsiya qoidalari bozorda tahlil qilish uchun mahsulotlar orasidagi bog'liqlikni aniqlaydi, masalan, 75% mijozlar non bilan birga sut sotib oladilar. klasterlash algoritmlari …
3 / 13
sosiy segmentni aniqlashga olib kelishi mumkin. ma'lumotlarni qazish arxitekturasi ma'lumotlarni qazish arxitekturasi 3 ta asosiy qatlamdan iborat: ma'lumotlar manbalari, ma'lumotlar ombori va tahliliy server, bu esa ma'lumotlarni saralash imkonini beradi. mdx arxitekturasida etl jarayoni muhim rol o'ynaydi, chunki u 100+ turli manbalardan ma'lumotlarni tozalaydi, o'zgartiradi va yuklaydi, sifatini ta'minlaydi. metadata repozitoriysi ma'lumotlar qazish tizimida muhim komponent bo'lib, 20+ turli ma'lumotlar modellari va algoritmlari haqida ma'lumot saqlaydi. ma'lumotlar omborining arxitekturasi ma'lumotlar ombori arxitekturasi 4 qatlamdan iborat: manba, saqlash, metadata va mijozga mo'ljallangan. etl jarayoni 3 qatlam bo'ylab ma'lumotlarni oladi va tozalaydi. arxitektura turli xil ma'lumotlar bazalarini, masalan, 5 terabaytgacha bo'lgan relyatsion tizimlarni birlashtiradi, olap va ma'lumotlarni qazib olish uchun birlashgan ko'rinish beradi. data martlar markaziy omborning kichik, 200 gigabaytlik bo'laklari bo'lib, ma'lum bir bo'limga xizmat qiladi va ma'lumotlarga tezroq kirish imkonini beradi. ma'lumotlar omborining afzalliklari ma'lumotlar ombori tarixiy ma'lumotlarni 5-10 yilgacha saqlash orqali tendensiyalarni tahlil qilish va kelajakdagi bashoratlarni aniqlashtirish imkonini …
4 / 13
i, yo'qotishlarni kamaytiradi. ma'lumotlarni qazish 3)operatsion samaradorlikni oshiradi, yetkazib berish zanjirini optimallashtirib, inventar xarajatlarini 25% kamaytiradi va mijozlarga xizmat ko'rsatish tezligini 30% ga oshiradi. ma'lumotlarni qazishning qo'llanilish sohalari chakana savdo va elektron tijoratda ma'lumotlarni qazish xaridorlarning xatti-harakatlarini tahlil qilish orqali savdo strategiyalarini optimallashtirish, cross-selling imkoniyatlarini aniqlash uchun qo'llaniladi. moliyaviy xizmatlar sohasida ma'lumotlarni qazish firibgarlikni aniqlash, kredit risklarini baholash va mijozlarning segmentatsiyasini amalga oshirish kabi vazifalarda qo'llaniladi. sog'liqni saqlash sohasida ma'lumotlarni qazish kasalliklarni erta tashxislash, davolash usullarini takomillashtirish va bemorlarning xatti-harakatlarini tahlil qilish uchun ishlatiladi. ma'lumotlar omborining qo'llanilish sohalari ma'lumotlar omborlari chakana savdoda mijozlar xatti-harakatini tahlil qilish, inventarizatsiya darajasini optimallashtirish va marketing kampaniyalarining samaradorligini o'lchash uchun ishlatiladi, savdo hajmini 15-20% oshirish imkonini beradi. moliyaviy xizmatlar sohasida, ma'lumotlar omborlari firibgarlikni aniqlash, risklarni boshqarish, mijozlar segmentatsiyasi va tartibga soluvchi hisobotlarni yaratish uchun qo'llaniladi, xavf darajasini 10-15% kamaytirishga yordam beradi. sog'liqni saqlashda ma'lumotlar omborlari bemorlarning davolash tarixini tahlil qilish, kasalliklar tarqalishini kuzatish va klinik …
5 / 13
sh algoritmlarining samaradorligiga chek qo'yadi. interpretability qiyinligi ma'lumotlarni qazish algoritmlari yaratgan murakkab 5-10 o'lchovli modellarni tushunishda yuzaga keladi, ularning ishonchliligini baholashni qiyinlashtiradi. xulosa xulosa ma'lumotlarni tahlil qilishning muhim bosqichidir, u erda asosiy natijalar 95% ishonch intervalida taqdim etiladi, biznes uchun amaliy ahamiyatga ega bo'lgan narsalarga e'tibor qaratiladi. ma'lumotlar omborida xulosa jadvallari saqlash xarajatlarini 30% ga kamaytirishi mumkin, chunki ular batafsil ma'lumotlarni umumlashtirib, tezkor so'rovlar uchun optimallashtiradi, bu esa hisobotlarni tezlashtiradi. xulosa chiqarish uchun turli algoritmlar, masalan, qarorlar daraxtlari va regressiya modellari qo'llaniladi, bu esa ma'lumotlar to'plamining 80% dan ortig'ini tushuntirishi mumkin bo'lgan asosiy omillarni aniqlashga imkon beradi. xulosa ma'lumotlar ombori va ma'lumotlarni qazib olish tushunchalari tashkilotlarga qimmatli bilimlarni aniqlash va biznes qarorlarini qabul qilishda yordam beruvchi kuchli vositalardir. foydalanilgan adabiyotlar 1. kimball, r., ross, m. (2013). data warehouse lifecycle toolkit. john wiley sons. 2. han, j., kamber, m., pei, j. (2011). data mining: concepts and techniques. morgan kaufmann. 3. inmon, …

Want to read more?

Download all 13 pages for free via Telegram.

Download full file

About "data mining va data warehousing tushunchalari"

oʻzbekiston respublikasi oliy ta’lim, fan va innovatsiyalar vazirligi mustaqil ish mavzu: data mining va data warehousing tushunchalari tayyorladi: akobirbek ruzikulov kirish 1. ma'lumotlarni qazib olish asoslari 2. ma'lumotlar ombori tushunchalari 3. ma'lumotlarni qazib olish va ma'lumotlar omborining integratsiyasi xulosa foydalanilgan adabiyotlar kirish “kirish” ma’lumotlar omborida etl jarayonining dastlabki 25% qismi, ma’lumotlarni tozalash va transformatsiya qilish kabi muhim bosqichlarni o’z ichiga oladi, bu esa yakuniy tahlil sifatini oshiradi. “kirish” fazasida ko’pincha 8-12 ta asosiy ma’lumot manbalaridan olingan ma’lumotlar sinov tariqasida yuklanadi, bu esa keyinchalik kengaytirilgan miqyosda xatoliklarni aniqlashga yordam beradi. “kirish” bosqichida, 7 xil turdagi ma’lumotlar...

This file contains 13 pages in DOCX format (17.1 KB). To download "data mining va data warehousing tushunchalari", click the Telegram button on the left.

Tags: data mining va data warehousing… DOCX 13 pages Free download Telegram