Thread Block Lock Free Format für dünnbesetzte Matrix-Vektor-Produkte auf Grafikkarten.

Keywords

Abstract

Diese Arbeit stellt das neues Datenformat Thread Block Lock Free (TBLF) für die effiziente Berechnung von MatrixVektorProdukten für dünnbesetzte Matrizen vor. Wir zeigen die Ergebnisse der Implementierung des neuen Datenformats TBLF auf Grafikkarten mittels CUDA C und vergleichen diese mit einer aus der Literatur bekannten Implementierung des Compressed Sparse Row (CSR) Formats. Bei der Verwendung von zufälligen dünnbesetzen Matrizen mit einem maximalen Besetztheitsgrad von 10% wird ein SpeedUp gegenüber CSR von bis zu 6 erreicht.