Sunday, 16 December 2012

5.4 Graphics Processing Units (GPU)


Graphics Processing Units (GPU)

Sejarah GPU

GPU merupakan :

     1.   Kad video yang terawal.

-         merupakan frame memori penampan dengan generasi alamat untuk output video

     2.   Pemprosesan grafik 3D

-         kos yang rendah
-         3D grafik kad hanya untuk process image sahaja. Sebagai contoh : PC dan game consoles

     3.   Unit moden pemprosesan grafik  sering diguna dengan luas dalam “single    instruction multiple data’’(SIMD), dan boleh loads dan simpan pada 128 or 256 bits pada suatu masa.

Ciri-ciri network

    1.   Dari segi performance :

-         latency per message
-         hasil daripada penghantaran data ialah link bandwidth, total network bandwidth dan bisection bandwidth.

    2.   Harga

    3.   Kuasa



Multicore Processor

Multicore processor mempunyai banyak “cores”.Cores ialah dalam bentuk chips. Tujuan multiple cores ialah ada beberapa process atau banyak kerja boleh dibuat dalam satu masa. Multi-core CPU ialah MIMD machine.Multi-core processor ialah satu processor yang berlainan berbanding dengan multiproccesor lain.

Multi-core processors is MIMD :

Cores yang berlainan akan melaksanakan threads yang berbeza(Multiple Instructions), dan akan berfungsi pada memori-memori yang tertentu (Multiple Data).

Multi-core ialah satu memory multiprocessor yang dikongsi dan semua “cores” akan berkongsi dengan memori yang sama.



5.3 Multithreading

Apakah maksud multithreading?
- Keupayaan sesebuah sistem operasi untuk melaksanakan threads, iaitu bahagian-bahagian program yang berbeza dengan serentak.


Multithreading dibahagikan kepada 3 jenis:
• Fine-grain Multithreading
• Coarse-grain Multithreading
• Simultaneous Multithreading



Fine-grain Multithreading





Fine-grain Mutithreading (FMT) mempercepatkan penyiapan semua threads yang sedang berjalan, dan ia adalah throughput keseluruhan yang secara umumnya perkara yang paling penting. FMT dijalankan untuk menyembunyikan latencies yang sangat panjang dalam pelaksanaan thread. Grafik perjalanan FMT telah ditunjukkan di atas.

Kecekapan yang bertambah baik disebabkan penurunan dalam "vertical waste". "Vertical waste" bermaksud situasi di mana tiada unit fungsian berjalan disebabkan untuk satu thread punah.



Coarse-grain Multithreading





Coarse-grain Multithreading (CMT) meningkatkan kecekapan dengan penggunaan unit berfungsi dengan melaksanakan satu thread untuk satu kitaran jam dan kemudian beralih ke seterusnya. Apabila beralih ke thread lain, pemproses menjimatkan keadaan benang itu (ia menjimatkan mana arahan yang berada dalam pipeline yang unit sedang digunakan) dan beralih kepada satu lagi. Dengan itu, pemproses CTM n-way dapat menyimpan keadaan n-threads.



Simultaneous Multithreading





Simultaneous Multithreading (SMT) pemproses dapat menjalankan arahan daripada thread yang berbeza, pada bila-bila masa yang diberikan serta mana-mana unit fungsi yang diberikan. Dengan berputar melalui thread, cip SMT bertindak seperti pemproses FMT, dengan melaksanakan arahan daripada thread yang berbeza pada masa yang sama, ia bertindak seperti pemproses CMP.

5.2 Multiple Instruction


Multiple Instruction, Single Data Stream – MISD
  • Urutan data
  • Dihantar kepada set pemproses
  •  Setiap pemproses melaksanakan urutan arahan yang berbeza
  • Tidak pernah dilaksanakan

    Multiple Instruction, Multiple Data Stream - MIMD
  • Set pemproses
  • Melaksanakan urutan arahan yang berbeza serentak
  • Set data yang berbeza
  • SMPs, clusters dan system NUMA

Hardware and Software (Perkakasan dan Perisian)
  •  'Hardware'/Perkakasan
            Siri : contohnya, Pentium 4
      Selari : contohnya, quad-core Xeon e5345
  • 'Software'/Perisian
            Turutan: contohnya, pendaraban matriks
      Bersama: contohnya, sistem operasi
  • Perisian serentak boleh dijalankan pada perkakasan bersiri/selari
              - Cabaran : membuat keberkesanan penggunaan perkakasan selari

 
Seni Bina Multipemproses : Memori Dikongsi

Dikongsi memori multipemproses
   -Perkakasan menyediakan ruang alamat fizikal yang tunggal untuk semua pemproses
   -Segerakkan pembolehubah dikongsi menggunakan kunci
   -Memori akses masa
    : SMP / UMA (seragam) vs NUMA (tidak seragam)