Mein Problem ist ein bisschen vage, aber meine Frage ist spezifisch.Junit: Unit Testing für Big Data Verarbeitung natürlicher Sprache
FRAGE
Kann mir jemand zeigen auf gut informierte Dokumentation, wie man Unit-Test große Daten zur Verarbeitung natürlicher Sprache-Systeme?
CONTEXT
Große Datenverarbeitungssysteme sind oft multi-threaded und sind auch von Ausnahmezuständen sehr nachsichtig. Sehr oft werden Ausnahmen eingefangen und nicht geworfen, um "unordentliche" Daten zu ermöglichen.
Bei der Prüfung solcher Systeme sollten die Stringenzgrade jedoch höher sein als unter Produktionsbedingungen. Dieses Maß an Stringenz ermöglicht Entwicklern, sich zumindest darüber im Klaren zu sein, welche Bedingungen Ausnahmen auslösen.
Das Problem ist, dass solche Systeme die Ausnahmen absorbieren, so dass Junit-Tests sie nicht aufnehmen. Ich bin auf der Suche nach einem sparsamen Design für Unit-Tests unter solchen Umständen. Ich will das Rad nicht neu erfinden. Daher suchen Sie nach relevanten Unterlagen.