optimizatsiyaning apparat arxitekturasi bilan bog'liq jihatlari

PPTX 22 sahifa 2,4 MB Bepul yuklash

Sahifa ko'rinishi (5 sahifa)

Pastga aylantiring 👇
1 / 22
optimizatsiyaning apparat arxitekturasi bilan bog'liq jihatlari optimizatsiyaning apparat arxitekturasi bilan bog'liq jihatlari dasturning mashinaga bog'liq optimizatsiyasi 1-ma’ruza reja 1. kirish 2. asosiy apparat omillar 3. xotira tizimi 4. parallel hisoblash 5. amaliy misollar 6. mashinaga bog‘liq optimizatsiya 7. xulosa kirish optimizatsiya nima? - dasturiy darajada - apparatura darajasida nima uchun apparat muhim? protsessor arxitekturasi cisc va risc farqlari buyruqlarni bajarish tezligi arxitekturaga mos optimizatsiya # oddiy sikl result = [x*2 for x in range(10**6)] # numpy vektorlashtirish import numpy as np arr = np.arange(10**6) result = arr * 2 numpy vektorlashtirish oddiy sikllarga qaraganda ancha tezroq, chunki u c darajasida optimallashtirilgan. pipeline (konveyer) buyruqlarni ketma-ket emas, bosqichma-bosqich bajarish konveyerning ishlash printsipi optimallashtirish usullari # oddiy sikl s = 0 for i in range(0, n): s += arr[i] # loop unrolling s = 0 for i in range(0, n, 4): s += arr[i] + arr[i+1] + arr[i+2] + arr[i+3] loop unrolling …
2 / 22
texnologiyalari xotira tarmoqlanishi kesh xotira darajalari: tezlik yuqoridan pastga qarab sekinlashadi, hajm esa kattalashadi. parallel hisoblash ko‘p yadroli protsessorlar vazifalarni bo‘lish paralellashgan algoritmlar cpu – murakkab vazifalar uchun, gpu – massiv parallel hisoblash uchun samarali. gpu hisoblash cuda, opencl grafik protsessorlarning ustunligi matritsa amallari misolida hisoblash samaradorligi memory bandwidth va hisoblash quvvatiga bog‘liq. simd texnologiyalari single instruction multiple data sse, avx vektorli hisoblash simd arxitekturasida bitta buyruq bitta komanda protsessori (kontroller) tomonidan barcha ma’lumotlarni saqlovchi ko‘plab protsessor elementlariga yuboriladi. parallel operatsiyalar: barcha protsessor elementlari bitta buyruqni o‘zlarining ma’lumotlarida bir vaqtning o‘zida bajaradi. ma’lumotlarni to‘plamlarga bo‘lish: ma’lumotlar pog‘onalar yoki to‘plamlar holatida, yakka tartibda emas, balki bir xil operatsiyalar ko‘p marotaba bajarilishi kerak bo‘lgan holatlarda qayta ishlanadi. dasturning mashinaga bog‘liq optimizatsiyasi kompilyator darajasi protsessorga mos assembly kod maxsus buyruqlar mashinaga bog‘liq optimizatsiya — dastur kodini ma’lum bir protsessor arxitekturasi yoki apparat platformasi uchun moslab yozish. maqsad — eng yuqori tezlik va samaradorlikka …
3 / 22
gan kutubxonalar (nvidia cuda, opencl, rocm, tensorflow, pytorch kabi platformalarda gpu optimallashtirilgan funksiyalar mavjud.) gpu — bu massiv parallel hisoblash qurilmasi. dastur gpu’da samarali ishlashi uchun ma’lumot va algoritmni parallelizatsiya qilish kerak xotira optimizatsiyasi cache locality prefetching vectorization xotira optimizatsiyasi — dastur bajarilishida ram, kesh va registrlardan samarali foydalanish orqali tezlikni oshirish va energiya sarfini kamaytirish jarayoni. bu optimizatsiya ma’lumotlarni qanday saqlash, chaqirish va qayta ishlash tartibiga bevosita bog‘liq. energiya samaradorligi mobil qurilmalarda optimizatsiya past quvvat rejimi batareya tejash energiya samaradorlik. dastur yoki apparat qurilma biror hisoblash vazifasini bajarishda qancha elektr energiya sarflashi. hayotiy misollar intel mkl (math kernel library) maxsus optimizatsiya qilingan funksiya hayotiy misollar nvidia cublas va cudnn gpu uchun maxsus kutubxonalar kelajak texnologiyalari kvant kompyuterlar neyromorfik chiplar ularning optimizatsiya imkoniyatlari xulosa dastur samaradorligi ko‘pincha apparat arxitekturasi (cpu, gpu, kesh, xotira, konveyer) imkoniyatlaridan foydalanish darajasiga bog‘liq. pipeline, kesh iyerarxiyasi va parallel hisoblash texnologiyalarini inobatga olgan holda yozilgan dasturlar …
4 / 22
optimizatsiyaning apparat arxitekturasi bilan bog'liq jihatlari - Page 4
5 / 22
optimizatsiyaning apparat arxitekturasi bilan bog'liq jihatlari - Page 5

Ko'proq o'qimoqchimisiz?

Barcha 22 sahifani Telegram orqali bepul yuklab oling.

To'liq faylni yuklab olish

"optimizatsiyaning apparat arxitekturasi bilan bog'liq jihatlari" haqida

optimizatsiyaning apparat arxitekturasi bilan bog'liq jihatlari optimizatsiyaning apparat arxitekturasi bilan bog'liq jihatlari dasturning mashinaga bog'liq optimizatsiyasi 1-ma’ruza reja 1. kirish 2. asosiy apparat omillar 3. xotira tizimi 4. parallel hisoblash 5. amaliy misollar 6. mashinaga bog‘liq optimizatsiya 7. xulosa kirish optimizatsiya nima? - dasturiy darajada - apparatura darajasida nima uchun apparat muhim? protsessor arxitekturasi cisc va risc farqlari buyruqlarni bajarish tezligi arxitekturaga mos optimizatsiya # oddiy sikl result = [x*2 for x in range(10**6)] # numpy vektorlashtirish import numpy as np arr = np.arange(10**6) result = arr * 2 numpy vektorlashtirish oddiy sikllarga qaraganda ancha tezroq, chunki u c darajasida optimallashtirilgan. pipeline (konveyer) buyruqla...

Bu fayl PPTX formatida 22 sahifadan iborat (2,4 MB). "optimizatsiyaning apparat arxitekturasi bilan bog'liq jihatlari"ni yuklab olish uchun chap tomondagi Telegram tugmasini bosing.

Teglar: optimizatsiyaning apparat arxit… PPTX 22 sahifa Bepul yuklash Telegram