optimizatsiyaning apparat arxitekturasi bilan bog'liq jihatlari

PPTX 22 стр. 2,4 МБ Бесплатная загрузка

Предварительный просмотр (5 стр.)

Прокрутите вниз 👇
1 / 22
optimizatsiyaning apparat arxitekturasi bilan bog'liq jihatlari optimizatsiyaning apparat arxitekturasi bilan bog'liq jihatlari dasturning mashinaga bog'liq optimizatsiyasi 1-ma’ruza reja 1. kirish 2. asosiy apparat omillar 3. xotira tizimi 4. parallel hisoblash 5. amaliy misollar 6. mashinaga bog‘liq optimizatsiya 7. xulosa kirish optimizatsiya nima? - dasturiy darajada - apparatura darajasida nima uchun apparat muhim? protsessor arxitekturasi cisc va risc farqlari buyruqlarni bajarish tezligi arxitekturaga mos optimizatsiya # oddiy sikl result = [x*2 for x in range(10**6)] # numpy vektorlashtirish import numpy as np arr = np.arange(10**6) result = arr * 2 numpy vektorlashtirish oddiy sikllarga qaraganda ancha tezroq, chunki u c darajasida optimallashtirilgan. pipeline (konveyer) buyruqlarni ketma-ket emas, bosqichma-bosqich bajarish konveyerning ishlash printsipi optimallashtirish usullari # oddiy sikl s = 0 for i in range(0, n): s += arr[i] # loop unrolling s = 0 for i in range(0, n, 4): s += arr[i] + arr[i+1] + arr[i+2] + arr[i+3] loop unrolling …
2 / 22
texnologiyalari xotira tarmoqlanishi kesh xotira darajalari: tezlik yuqoridan pastga qarab sekinlashadi, hajm esa kattalashadi. parallel hisoblash ko‘p yadroli protsessorlar vazifalarni bo‘lish paralellashgan algoritmlar cpu – murakkab vazifalar uchun, gpu – massiv parallel hisoblash uchun samarali. gpu hisoblash cuda, opencl grafik protsessorlarning ustunligi matritsa amallari misolida hisoblash samaradorligi memory bandwidth va hisoblash quvvatiga bog‘liq. simd texnologiyalari single instruction multiple data sse, avx vektorli hisoblash simd arxitekturasida bitta buyruq bitta komanda protsessori (kontroller) tomonidan barcha ma’lumotlarni saqlovchi ko‘plab protsessor elementlariga yuboriladi. parallel operatsiyalar: barcha protsessor elementlari bitta buyruqni o‘zlarining ma’lumotlarida bir vaqtning o‘zida bajaradi. ma’lumotlarni to‘plamlarga bo‘lish: ma’lumotlar pog‘onalar yoki to‘plamlar holatida, yakka tartibda emas, balki bir xil operatsiyalar ko‘p marotaba bajarilishi kerak bo‘lgan holatlarda qayta ishlanadi. dasturning mashinaga bog‘liq optimizatsiyasi kompilyator darajasi protsessorga mos assembly kod maxsus buyruqlar mashinaga bog‘liq optimizatsiya — dastur kodini ma’lum bir protsessor arxitekturasi yoki apparat platformasi uchun moslab yozish. maqsad — eng yuqori tezlik va samaradorlikka …
3 / 22
gan kutubxonalar (nvidia cuda, opencl, rocm, tensorflow, pytorch kabi platformalarda gpu optimallashtirilgan funksiyalar mavjud.) gpu — bu massiv parallel hisoblash qurilmasi. dastur gpu’da samarali ishlashi uchun ma’lumot va algoritmni parallelizatsiya qilish kerak xotira optimizatsiyasi cache locality prefetching vectorization xotira optimizatsiyasi — dastur bajarilishida ram, kesh va registrlardan samarali foydalanish orqali tezlikni oshirish va energiya sarfini kamaytirish jarayoni. bu optimizatsiya ma’lumotlarni qanday saqlash, chaqirish va qayta ishlash tartibiga bevosita bog‘liq. energiya samaradorligi mobil qurilmalarda optimizatsiya past quvvat rejimi batareya tejash energiya samaradorlik. dastur yoki apparat qurilma biror hisoblash vazifasini bajarishda qancha elektr energiya sarflashi. hayotiy misollar intel mkl (math kernel library) maxsus optimizatsiya qilingan funksiya hayotiy misollar nvidia cublas va cudnn gpu uchun maxsus kutubxonalar kelajak texnologiyalari kvant kompyuterlar neyromorfik chiplar ularning optimizatsiya imkoniyatlari xulosa dastur samaradorligi ko‘pincha apparat arxitekturasi (cpu, gpu, kesh, xotira, konveyer) imkoniyatlaridan foydalanish darajasiga bog‘liq. pipeline, kesh iyerarxiyasi va parallel hisoblash texnologiyalarini inobatga olgan holda yozilgan dasturlar …
4 / 22
optimizatsiyaning apparat arxitekturasi bilan bog'liq jihatlari - Page 4
5 / 22
optimizatsiyaning apparat arxitekturasi bilan bog'liq jihatlari - Page 5

Хотите читать дальше?

Скачайте все 22 страниц бесплатно через Telegram.

Скачать полный файл

О "optimizatsiyaning apparat arxitekturasi bilan bog'liq jihatlari"

optimizatsiyaning apparat arxitekturasi bilan bog'liq jihatlari optimizatsiyaning apparat arxitekturasi bilan bog'liq jihatlari dasturning mashinaga bog'liq optimizatsiyasi 1-ma’ruza reja 1. kirish 2. asosiy apparat omillar 3. xotira tizimi 4. parallel hisoblash 5. amaliy misollar 6. mashinaga bog‘liq optimizatsiya 7. xulosa kirish optimizatsiya nima? - dasturiy darajada - apparatura darajasida nima uchun apparat muhim? protsessor arxitekturasi cisc va risc farqlari buyruqlarni bajarish tezligi arxitekturaga mos optimizatsiya # oddiy sikl result = [x*2 for x in range(10**6)] # numpy vektorlashtirish import numpy as np arr = np.arange(10**6) result = arr * 2 numpy vektorlashtirish oddiy sikllarga qaraganda ancha tezroq, chunki u c darajasida optimallashtirilgan. pipeline (konveyer) buyruqla...

Этот файл содержит 22 стр. в формате PPTX (2,4 МБ). Чтобы скачать "optimizatsiyaning apparat arxitekturasi bilan bog'liq jihatlari", нажмите кнопку Telegram слева.

Теги: optimizatsiyaning apparat arxit… PPTX 22 стр. Бесплатная загрузка Telegram