pandas kutubxonasi yordamida csv fayllarni o‘qish va tahlil qilish

PPTX 20 стр. 540,1 КБ Бесплатная загрузка

Предварительный просмотр (5 стр.)

Прокрутите вниз 👇
1 / 20
powerpoint presentation pardasi yordamida csv fayllarini o‘qish va tahlil qilish. bahodirova munisa 1. pandas kutubxonasiga kirish 2. csv fayllarini o'qish 3. ma'lumotlarni tahlil qilish reja: pandas'da `assign()` metodi yordamida 2 ta yangi ustun, masalan, "hisoblash1" va "hisoblash2" qo'shishingiz va ularga mos ravishda mavjud ustunlardagi qiymatlarning yig'indisi va farqini hisoblashingiz mumkin. `numpy` kutubxonasi funksiyalarini qo'llab, mavjud ustunlardagi qiymatlarga asoslangan holda 10 ta yangi ustun hosil qilishingiz va ularni dataframega qo'shishingiz mumkin. masalan, standart deviatsiyani hisoblash. lambda funksiyalari va `apply()` metodi yordamida murakkab hisob-kitoblarni amalga oshirish orqali 3 dan ortiq yangi ustunlar yaratib, ma'lumotlarni boyitishingiz mumkin. masalan, 5 ta ustunni birlashtirish. yangi ustunlar yaratish ma'lumotlarni filtrlash `query()` funksiyasi yordamida murakkab shartlar, masalan, 'sana' ustuni 2023 yildan keyin va 'narx' ustuni 100 dan kam bo'lgan qatorlarni samarali filtrlash mumkin. boolen indekslash yordamida 'miqdor' ustunida qiymati 5 dan katta bo'lgan qatorlarni ajratib olish va ular bilan bog'liq ma'lumotlarni tahlil qilish mumkin. pandasda `loc` yoki …
2 / 20
as kutubxonasini o'rnatish va import qilish pandas versiyasini tekshirish uchun "pd.__version__" buyrug'ini ishlatishingiz mumkin, bu sizga o'rnatilgan pandas ning aniq versiya raqamini 0.25.0 yoki undan yuqori ekanligini ko'rsatadi. pandas kutubxonasini o'rnatish uchun siz terminal yoki command promptda "pip install pandas" buyrug'ini 1-2 daqiqa ichida bajarasiz va 100 mb dan kamroq joy egallaydi. muvaffaqiyatli o'rnatilgandan so'ng, python skriptingizda "import pandas as pd" buyrug'i yordamida pandas kutubxonasini import qilasiz, bu esa barcha funksiyalariga kirish imkonini beradi. ma'lumotlarni saqlash katta hajmdagi ma'lumotlarni (masalan, 100,000 dan ortiq qatorli) samarali saqlash va qayta ishlash uchun pandas optimallashtirilgan bo'lib, xotira samaradorligini ta'minlaydi. ma'lumotlarning turli xil formatlarini (integer, float, string, datetime) qo'llab-quvvatlash orqali pandas csv fayllarni to'liq va aniq tahlil qilish imkonini beradi, bu esa ma'lumotlarning ishonchliligini oshiradi. pandas kutubxonasi csv fayllarni o'qish va tahlil qilishda samaradorlikni oshirish uchun turli xil ma'lumotlar tuzilmalarini, jumladan, series va dataframe obyektlarini qo'llab-quvvatlaydi. ma'lumotlarni guruhlash katta hajmdagi ma'lumotlar to'plamini 5 ta …
3 / 20
ida saqlashi mumkin, masalan, 3 ta sonli va 2 ta matnli ustun. dataframe'ni yaratish uchun siz ro'yxatlar, lug'atlar yoki csv fayllar kabi turli xil manbalardan foydalanishingiz mumkin; bu obyekt 1 million qator va 100 ustungacha katta hajmdagi ma'lumotlarni samarali boshqarishga imkon beradi. dataframe obyekti pandas kutubxonasining asosiy ma'lumotlar tuzilmasini ifodalaydi, ikki o'lchamli massiv (matritsa) bo'lib, indekslangan satr va ustunlardan iborat, 1000 dan ortiq satr va 50 dan ortiq ustunni saqlashi mumkin. xatolarni bartaraf etish agar csv faylida 1000 dan ortiq ustun mavjud bo'lsa va ularning nomlari juda uzun bo'lsa, xotira yetishmasligi muammosiga duch kelishingiz mumkin. buning oldini olish uchun `usecols` parametri yordamida faqat kerakli ustunlarni yuklang yoki `chunksize` parametri bilan faylni bo'laklarga bo'lib o'qing. pandasda `read_csv()` funksiyasi bajarilayotganda fayl topilmasa yoki fayl formatida xatolik bo'lsa, `filenotfounderror` yoki `pd.errors.parsererror` kabi xatolar paydo bo'lishi mumkin. bunday hollarda fayl yo'lini tekshiring va kerak bo'lsa, `sep`, `header`, `encoding` parametrlarini o'zgartiring. `valueerror: columns must be …
4 / 20
ilan ishlash yo'qolgan qiymatlarni to'ldirishdan oldin, yo'qolish sababini tahlil qilish va tegishli to'ldirish strategiyasini tanlash muhim, masalan, 5 dan kam kuzatish bo'lgan qatorlarni o'chirish. `fillna()` funksiyasi yordamida yo'qolgan qiymatlarni o'rtacha qiymat (mean), mediana (median) yoki moda (mode) kabi statistik o'lchovlar bilan to'ldirish mumkin, bu esa ma'lumotlar tahlilining aniqligini oshiradi. pandas'da nan qiymatlarini aniqlash uchun `isnull()` funksiyasi 20% dan ortiq bo'sh qiymatlarga ega ustunlarni aniqlashda foydali bo'ladi va ma'lumotlar tozalash strategiyasini belgilashga yordam beradi. ma'lumotlarni o'zgartirish pandas .rename() metodi yordamida ustun nomlarini o'zgartirish mumkin, masalan, 1-ustunni "id" dan "id_raqami" ga o'zgartirish uchun .rename(columns={"id":"id_raqami"}) funksiyasidan foydalaniladi. dataframe.astype() funksiyasi yordamida ma'lumotlar turini o'zgartirish mumkin, misol uchun, "object" turini "int64" yoki "float64" ga o'zgartirish. bu ma'lumotlarni tahlil qilishni soddalashtiradi. ma'lumotlarning bir qismini olib tashlash yoki qo'shish uchun .drop(), .append() va .loc[] kabi funksiyalardan foydalaniladi, bu 5000 qatorlik dataframe'dagi keraksiz ustunlarni olib tashlashga yordam beradi. ma'lumotlarni tahlil qilish usullari korrelyatsion matritsa yordamida o'zgaruvchilar orasidagi bog'liqlikni …
5 / 20
di, masalan, vaqt oralig'i bo'yicha. pandas'da `sort_values()` funksiyasi yordamida ustunlar bo'yicha (masalan, 3-ustun) ma'lumotlarni o'suvchi yoki kamayuvchi tartibda (ascending=true/false) saralash mumkin. katta hajmdagi fayllarni saralashda `chunksize` parametrini qo'llab, xotira sarfini kamaytirish va samaradorlikni oshirish mumkin, masalan, 1000 qatorlik bo'laklar bilan ishlov berish. ma'lumotlar turini aniqlash pandas `dtype` atributi ma'lumotlar turini (masalan, int64, float64, object) aniqlashda foydalaniladi va 1000 qatorli faylda 5 ta turli xil ustun ma'lumot turini aniqlash imkonini beradi. `info()` metodi ma'lumotlar to'plamining umumiy ko'rinishini, jumladan, har bir ustunning nomi va ma'lumot turini, shuningdek, bo'sh qiymatlar sonini ko'rsatadi, bu esa 5000 qatorli katta fayllarni tahlil qilishni osonlashtiradi. `info()` metodi ma'lumotlar to'plamining umumiy ko'rinishini, jumladan, har bir ustunning nomi va ma'lumot turini, shuningdek, bo'sh qiymatlar sonini ko'rsatadi, bu esa 5000 qatorli katta fayllarni tahlil qilishni osonlashtiradi. csv fayllarini ochish va o'qish katta hajmdagi (masalan, 100mb dan ortiq) csv fayllarini samarali o'qish uchun `chunksize` parametrini qo'llab, faylni bo'laklarga bo'lib o'qish mumkin, …

Хотите читать дальше?

Скачайте все 20 страниц бесплатно через Telegram.

Скачать полный файл

О "pandas kutubxonasi yordamida csv fayllarni o‘qish va tahlil qilish"

powerpoint presentation pardasi yordamida csv fayllarini o‘qish va tahlil qilish. bahodirova munisa 1. pandas kutubxonasiga kirish 2. csv fayllarini o'qish 3. ma'lumotlarni tahlil qilish reja: pandas'da `assign()` metodi yordamida 2 ta yangi ustun, masalan, "hisoblash1" va "hisoblash2" qo'shishingiz va ularga mos ravishda mavjud ustunlardagi qiymatlarning yig'indisi va farqini hisoblashingiz mumkin. `numpy` kutubxonasi funksiyalarini qo'llab, mavjud ustunlardagi qiymatlarga asoslangan holda 10 ta yangi ustun hosil qilishingiz va ularni dataframega qo'shishingiz mumkin. masalan, standart deviatsiyani hisoblash. lambda funksiyalari va `apply()` metodi yordamida murakkab hisob-kitoblarni amalga oshirish orqali 3 dan ortiq yangi ustunlar yaratib, ma'lumotlarni boyitishingiz mumkin. masalan, 5 ...

Этот файл содержит 20 стр. в формате PPTX (540,1 КБ). Чтобы скачать "pandas kutubxonasi yordamida csv fayllarni o‘qish va tahlil qilish", нажмите кнопку Telegram слева.

Теги: pandas kutubxonasi yordamida cs… PPTX 20 стр. Бесплатная загрузка Telegram