2016-06-01 19 views
2

Im altera Designbeispiel habe ich versucht, Vektor hinzufügen, aber ich kann nicht den Durchsatz und die Latenz des Kernels aus den Kompilierungsergebnissen erhalten.So überprüfen Sie den Durchsatz und die Latenz in Altera OpenCL

Ich habe die Programmieranleitung von Altera gelesen. Es erwähnt, profile.mon zu verwenden.

Ist es möglich, -march=emulator --profile zu verwenden, um aocl-Bericht auszuführen?

Bitte lassen Sie mich auch wissen, ob es andere Möglichkeiten gibt, den Durchsatz und die Latenz des Kernels zu erhalten.

+0

Ist Ihre CPU AMD oder Intel? Wenn amd, können Sie versuchen, Codexl, die visuelle Darstellung der Kernel-Latenzen und Array-Kopierbandbreiten und einige mehr zeigt. –

+2

Nein meine CPU ist Intel und ich habe Informationen über Kernel-Latenz und -Durchsatz auf FPGA –

Antwort

2

Welche Informationen Sie von Profiler erhalten können, finden Sie in Altera SDK für OpenCL Best Practices Guide. Es gibt Beispiel Screenshots und detaillierte Informationen. Hier ist die link, die Sie direkt zu diesem Abschnitt bringt.

Ich kann falsch liegen, aber ich denke, es ist nicht möglich, Profilinformationen von Emulator zu erhalten. Ich baue immer den vollen Kernel, um das zu bekommen.

+0

gefragt. Danke für die Info. wenn ich voll Kernel bauen erhalte ich einen Dateinamen kernel_name.attrib im Ordner ist mit der folgenden Informationen Vektorisierung: 1 Max_vectorization: 16 Kopien: 2 Max_copies: 2 Durchsatz: 21.75 Copyfactor: 1 Sharing: 1 Max_sharing : 1 Unroll: 1 Max_unroll: 1 Throughput_unroll: 1 Aggressive_unroll: 1 hier gibt es einen Durchsatzwert, aber ich weiß nicht, ob es sich um Kernel bezieht. Gibt es ein Hilfedokument, das Sie über die Details in der .ATTRIB-Datei informiert? –

+0

Siehe [dies] (http://www.alteraforum.com/forum/showthread.php?t=50032&highlight=Copyfactor). Es scheint, dass Sie sich darauf nicht verlassen können, da dies wahrscheinlich nur eine Schätzung ist. Sie können versuchen, etwas mehr über Altera OpenCL Forum zu finden. – doqtor

+0

Danke für die Information –

1

Simon, wenn Ihnen ein kleines historisches "Abenteuer" nichts ausmacht, könnten Sie versuchen, die 13.1-Version des Altera (jetzt Intel) OpenCL SDK herunterzuladen und zu installieren. Diese älteren Tools hatten eine Option, um den Durchsatz standardmäßig oder über die Option --timate-throughput switch auszudrucken. Diese Schätzungen würden nur für Stratix V-Karten (z.B. PCIe385n_d5) funktionieren. Arria 10 existierte damals nicht. Aber wenn man weiß, dass die Geräte in der Architektur etwas ähnlich sind, sollte dies einen Hinweis geben. Danach vergessen Sie nicht, Service Request an Intel zu senden, um diese Schätzungen wieder in den OpenCL SDK-Compiler zu übertragen.

Wenn Sie noch abenteuerlicher Typ sind, könnten Sie Ihren Kernel in Modelsim Intel Starter Edition (kostenlos) sogar ohne DDRx und PCIe Modelle simulieren und dies würde Ihnen Zyklus genaue Antwort auf Durchsatz und Latenz Fragen geben. Mit QSYS können Sie den gesamten Prüfstand automatisch generieren.