GAP8 - Prosesor Aplikasi Internet of Things
GAP8 adalah prosesor aplikasi IoT yang memungkinkan pembelajaran mesin & pemrosesan sinyal pada data sensor yang kaya (gambar, suara, getaran, dan tanda radar) pada tingkat konsumsi daya yang kompatibel dengan pengoperasian bertenaga baterai selama bertahun-tahun. Arsitektur sumber terbukanya mendukung pengembang dengan waktu yang cepat untuk membuat prototipe menggunakan model NN berbasis TFLite yang dioptimalkan secara otomatis untuk GAP8.
Komputasi Parallel Ultra Low Power (PULP) berbasis RISC-V
Prosesor aplikasi Internet of Things (IoT) GAP8 dari GreenWaves Technologies memungkinkan perangkat sensor bertenaga baterai untuk memproses dan bertindak berdasarkan data yang kaya dari gambar, suara, tanda radar, getaran, dan banyak lagi. Memproses informasi ini di tepi menghilangkan kebutuhan untuk mengangkutnya ke cloud dan membuatnya kompatibel dengan jaringan area luas berdaya rendah.
Arsitektur prosesor RISC-V dirancang untuk meminimalkan konsumsi energi. Ia menggunakan desain load-store, dengan instruksi yang hanya membahas register dan menyimpan atau memuat data ke/dari memori. Sebagian besar instruksi muat/simpan menyertakan offset 12-bit dan dua pengenal register untuk menyampaikan posisi alamat.
Prosesor PULP juga menyertakan fitur manajemen daya untuk mengoptimalkan kinerja dan efisiensi energi. Fitur ini mencakup penskalaan frekuensi dan tegangan dinamis, pengaturan jam otomatis dan daya tidur, serta unit perlindungan memori. Prosesor PULP juga memiliki cache level 2 yang besar dan beberapa unit DMA untuk memfasilitasi transfer daya rendah yang cepat antara area memori. Hal ini memungkinkan inti kluster dan HWCE untuk merespons perubahan persyaratan pemrosesan dengan cepat.
Inti berbasis ISA RISC-V yang diperluas dengan kinerja tinggi
Arsitektur prosesor RISC-V terbuka dan dapat diperluas, memungkinkan pengembang untuk berinovasi pada produk baru tanpa bergantung pada ISA milik sendiri. Set instruksinya mencakup instruksi yang dioptimalkan yang mengurangi overhead komputasi, memungkinkan perancang perangkat keras untuk memaksimalkan kinerja dan efisiensi daya. Prosesor ini juga mendukung berbagai periferal dan model memori, yang memungkinkan pengembang untuk mengoptimalkan desain mereka untuk aplikasi tertentu.
GreenWaves memanfaatkan arsitektur RISC-V untuk menghadirkan GAP8, prosesor daya sangat rendah yang dapat menangani tugas pemrosesan AI yang diperlukan dalam IoT dan perangkat sensor. Hal ini penting karena menghilangkan kebutuhan perangkat untuk mengangkut data ke server cloud dan membuat sensor kompatibel dengan jaringan area luas berdaya rendah (LPWAN).
Prosesor GAP8 memiliki hierarki memori yang menggunakan unit DMA otonom untuk mentransfer data antara area memori internal. Hal ini memungkinkannya berjalan dengan konsumsi daya yang sangat rendah dengan mengelola transfer memori secara efisien. Prosesor juga memiliki kode kondisi dan register berdekatan yang terhubung, yang keduanya merupakan yang pertama dalam desain RISC-V.
Mesin Konvolusi perangkat keras (HWCE) untuk aplikasi berbasis Jaringan Neural Konvolusional
GAP8 adalah mesin komputasi IoT-edge yang sepenuhnya dapat diprogram yang menggabungkan kluster multi-inti dengan akselerator CNN yang menyediakan cara yang sangat hemat energi untuk melakukan inferensi jaringan neural. Arsitektur paralel ini memanfaatkan berbagai paralelisme intra dan inter-lapisan yang mengurangi waktu pemrosesan keseluruhan dengan membaca peta fitur input ke dalam chip yang sama dan menggunakan kembali pembacaan filter untuk mengurangi pembacaan memori eksternal. Dengan GAP8, inferensi intensif komputasi pada data sensor dapat dilakukan pada perangkat edge kecil yang dioperasikan dengan baterai yang dapat bertahan selama bertahun-tahun sambil mencapai akurasi dan latensi tinggi. Hal ini secara drastis mengurangi biaya penerapan dan pengoperasian perangkat penginderaan cerdas.
GAP8 menggunakan strategi manajemen daya unik yang mengadaptasi frekuensi dan voltase CPU sistem agar sesuai dengan beban dengan penskalaan voltase dan frekuensi dinamis yang canggih, pengaturan jam otomatis, dan pengurangan daya tidur yang membuat prosesor tetap aktif hanya saat dibutuhkan. Hal ini menghasilkan kinerja pemrosesan maksimum 10 GMAC/dtk untuk inferensi CNN dalam daya tidur retensi status 75 mW.