Ich möchte Objekte in Zellen von Mikroskopiebildern erkennen. Ich habe viele annotierte Bilder (ca. 50.000 Bilder mit einem Objekt und 500.000 ohne Objekt).Objekterkennung in Bildern (HOG)
Bisher habe ich versucht, Features mit HOG und Klassifizierung mit logistischen Regression und LinearSVC zu extrahieren. Ich habe verschiedene Parameter für HOG oder Farbräume (RGB, HSV, LAB) ausprobiert, aber ich sehe keinen großen Unterschied, die Prädiktionsrate beträgt etwa 70%.
Ich habe mehrere Fragen. Wie viele Bilder sollte ich verwenden, um den Deskriptor zu trainieren? Wie viele Bilder sollte ich verwenden, um die Vorhersage zu testen?
Ich habe versucht mit etwa 1000 Bildern für das Training, das gibt mir 55% positiv und 5000, was mir etwa 72% positiv ist. Es hängt jedoch auch stark vom Testset ab, manchmal kann ein Testset 80-90% positiv detektierte Bilder erreichen.
Hier sind zwei Beispiele ein Objekt und zwei Bilder ohne ein Objekt enthält:
Ein weiteres Problem ist, manchmal die Bilder enthalten mehrere Objekte:
Soll ich versuchen, die Beispiele für die Lernmenge zu erhöhen? Wie sollte ich die Bilder für das Trainingssatz auswählen, nur zufällig? Was könnte ich sonst noch versuchen?
Jede Hilfe wäre sehr willkommen, ich habe gerade angefangen, maschinelles Lernen zu entdecken. Ich benutze Python (scikit-image & scikit-lernen).
Vielen Dank für Ihre Vorschläge, sie sind sehr hilfreich! Ich habe schnell LAB-Histogramme ausprobiert (auch von der Mailingliste scikit-image vorgeschlagen) und es sieht so aus, als ob ich mit dem Helligkeitskanal sehr gute Ergebnisse für die korrekte Erkennung von Zellen mit einem Objekt erhalte. Es sagt jedoch sehr schlecht für Zellen ohne ein Objekt voraus. Auf der anderen Seite, um Zellen ohne ein Objekt zu erkennen, funktionierte HOG sehr gut. Ich denke, mit der Kombination beider Modelle könnte es funktionieren (ich bin mir nicht sicher, ob das in Ordnung wäre). Ich habe noch immer nicht bestätigt, also ist alles vorläufig. Danke für diesen Hinweis! – snowflake
Oft sind andere Objekte um die Zelle herum dunkel gefärbt, aber sie sollten nicht erkannt werden. Ich denke, das ist der Grund, warum ich viele falsche Positive bekomme, wenn ich LAB-Histogramm benutze, aber nicht mit HOG. – snowflake
Ich habe noch eine Frage, es sieht so aus, dass die Behältergröße eine große Rolle spielt. Wie wähle ich die richtige Behältergröße? Gibt es Regeln oder eher wie "Versuch und Irrtum"? – snowflake