<img alt="" src="https://secure.leadforensics.com/11743.png" style="display:none;">

So trainieren Sie ein Deep Learning System für Machine Vision

Wie in unserem letzten Blogbeitrag beschrieben, bietet die Implementierung eines Deep Learning Bildverarbeitungssystems im industriellen Umfeld eine Vielzahl an attraktiven Vorteilen. Wir behandelten die Definition von Deep Learning, Machine Learning und KI und sprachen über Datensätze und die erforderliche Vorbereitung beim Training eines Deep Learning Systems für Bildverarbeitungsprojekte.

In diesem Blogbeitrag werden wir dieses Thema konkretisieren und die Schritte skizzieren, die Sie durchlaufen müssen, um ein Deep Learning System für Machine Vision zu trainieren.

Trainieren eines Deep Learning Systems mit Datensätzen

Datensätze für Deep Learning Lösungen sind essenziell für deren grundlegende Funktionalität. Sie sind das Wissen, das ein Modell benötigt, um wie beabsichtigt zu funktionieren. Eine Definition und Einführung zu Datensätzen finden Sie in unserem letzten Blogbeitrag.

Ohne einen Datensatz, der von Ihrem Modell verarbeitet werden soll, kann es nicht zwischen Variablen in Bildern unterscheiden und wird letztendlich bei der geplanten Funktionalität versagen.

Teildatensätze für Bildverarbeitung

Es ist ideal so viele Bilder wie möglich für einen Datensatz zu verwenden, da sie vor dem Training in mindestens zwei (vorzugsweise drei) Teilmengen aufgeteilt werden müssen. Der erste Teilsatz (der „Trainingssatz“) wird verwendet, um das eigentliche Training des Modells durchzuführen, das Anpassungen an mathematischen Gewichtungen beinhaltet.

 image-png-Jul-16-2021-09-17-43-69-AM

Organisieren und Beschriften des Trainingssets mit Matrox Imaging Library (MIL) CoPilot. 

Der Satz „Entwicklung“ (oder “Validierung“) ist der zweite Teilsatz, den Sie benötigen. Diese Teilmenge wird verwendet, um den Trainingsprozess zu überwachen, indem die Differenz zwischen den tatsächlichen und den erwarteten Klassifizierungsergebnissen verfolgt wird.

Aufbau eines guten Datensatzes

Ihr Datensatz muss genau aus den Bildern entsprechen, die Sie in Ihrem tatsächlichen Projekt erwarten.

Je mehr Variablen Ihnen einfallen, desto besser. Je mehr eindeutige Elemente in Ihrem Datensatz enthalten sind, desto besser. Wenn Sie in der Praxis eine konsistente Umgebung (z.B. Beleuchtung) zwischen Ihrem Datensatz und Ihrem Projekt aufrechterhalten können, sind die Schlussfolgerungen und Entscheidungsfähigkeiten Ihrer KI umso genauer.

Welche Daten benötige ich?

Im Kontext von Deep Learning für Bildverarbeitung besteht Ihr Datensatz aus Bildern von Objekten, die sich aufgrund der möglichen Variationen dieser Objekte unterscheiden. Wie wir bisher beschrieben haben, eignen sich Deep Learning Vision Systeme am besten zum Klassifizieren, Erkennen, Auslesen und Detektieren.

Überlegen Sie, wie Sie mit der Automatisierung Ihrer Prozesse beginnen möchten – beginnen Sie klein, zum Beispiel mit der grundlegenden Erkennung der Anwesenheit eines Objekts, und arbeiten Sie sich zu nuancierten Schlussfolgerungen wie Klassifizierung und Auslesen vor.

Optische Zeichenerkennung (OCR) ist eine Aufgabe, die Deep Learning auszeichnet. Dafür würde Ihr Datensatz aus vielen Variationen aller möglichen Zeichen bestehen, die in der praktischen Bildgebung auftauchen können.

image-png-Jul-16-2021-09-18-12-12-AM

MNIST ist ein sehr beliebter Open Source Deep Learning Datensatz mit 70.000 Beispielen handgeschriebener Ziffern. Aber was ist, wenn Ihre Anwendung gedruckte Schriften erfordert? Berücksichtigen Sie sowohl die Vorteile als auch die Einschränkungen bei der Wahl zwischen Open Source- und selbsterstellten Datensätzen.

Es ist eine gute Idee, mit spezifischen Fragen zu beginnen, um alle möglichen Grundlagen zu quantifizieren, die Sie mit Ihrem Datensatz abdecken müssen. Was ist das konkrete Ziel, das Sie mit einem Deep Learning System erreichen möchten? Was bringt Deep Learning für Ihr Projekt, was andere Systeme nicht können? Die Antworten auf diese Fragen liefern Ihnen die richtigen Kriterien, die Sie benötigen um die entsprechenden Probleme zu lösen.

Ich habe einen Datensatz, was nun?

Sobald Sie Ihren Datensatz haben, muss der nächste Schritt darin bestehen, Ihr Dataset für Deep Learning vorzubereiten. Im Rahmen von Deep Learning ist es entscheidend diese Vorbereitung durchzuführen, damit die Daten optimiert und funktionsgerecht sind.

Solange es auch sein mag – sie nimmt die meiste Zeit in Anspruch, die Sie für Ihr Deep Learning Projekt aufwenden werden, denn sie ist von entscheidender Bedeutung. Berücksichtigen Sie die Zeit, die später durch die Automatisierung Ihrer Bildgebungsprozesse gewonnen wird.

Datenaufbereitung

Nachdem Sie den Datensatz gesammelt haben, ist es wichtig, eine gewisse Perspektive einzunehmen, um diesen zu untersuchen. Deckt dieser alle möglichen Variationen ab? Möglicherweise haben Sie einen unausgeglichenen Bildsatz, der durch eine Überabtastung der unterrepräsentierten Klasse oder eine Unterabtastung der überrepräsentierten Klasse behoben werden kann.

All dies geschieht mit einer Technik namens Data Augmentation, die ein Oversampling durch Verwendung von Methoden wie Rotation und Skalierung der vorhandenen Bilder ermöglicht.

image-png-Jul-16-2021-09-18-40-33-AM

Datenerweiterung mit leistungsstarker Deep Learning Software für maschinelles Sehen:
Matrox Imaging Library (MIL) CoPilot

Der nächste Schritt besteht darin, zu verstehen, ob Sie ein Modell von Grund auf neu erstellen oder ein bereits vortrainiertes Modell nutzen. Beim Erstellen eines vollständigen Modells ist die Anzahl der benötigten Bilder viel höher als bei der Verwendung eines vortrainierten Modells. Letzteres ist eine Technik, die als Transferlernen (Transfer Learning) bezeichnet wird und bei den meisten Bildverarbeitungsanwendungen sehr häufig verwendet wird.

Transfer Learning

Die Alternative ein neuronales Netz von Grund auf zu trainieren ist das so genannte Transfer Learning bei dem man Schichten eines vortrainierten Netzwerkes nimmt und diese neu trainiert, um diese explizit auf die eigene Anwendung anzupassen. Dies kann ein effektiver Weg sein, um bei einem Projekt schnell an Dynamik zu gewinnen, da die Gesamtleistung des Netzwerks der eines brandneuen sehr ähnlich ist, aber viel weniger Trainingsdaten erforderlich sind, um direkt zu starten.

Modernste Deep Learning Lösungen von ClearView Imaging

Wir wissen, dass sich die Vorbereitung auf ein Deep Learning Projekt für Machine Learning wie eine schier unlösbare Aufgabe anfühlen kann. Bei ClearView Imaging liefern wir nicht nur alle Komponenten, die Sie für Ihr Bildverarbeitungsprojekt benötigen, sondern verfügen auch über ein großartiges Team von Ingenieuren und Bildverarbeitungsexperten mit dem Wissen und der Erfahrung, um Sie bestmöglich bei Ihrer Anwendung zu unterstützen. Was auch immer die Frage oder Anfrage ist, kontaktieren Sie uns gerne direkt über unsere Kontaktseite.

Bleiben Sie auf dem Laufenden über diese Blogreihe, während wir uns weiterhin mit Deep Learning in einer Vielzahl von Machine Vision Kontexten beschäftigen.

Ob Sie OEM, Systemintegrator, Ingenieur oder Endanwender sind, in unserem umfassenden Angebot an Bildverarbeitungsprodukten finden Sie die besten Komponenten auf dem Markt.

Weiterlesen

BILDVERARBEITUNG GIBT COMPUTERN DIE FÄHIGKEIT ZU SEHEN

Mit Hilfe der Bildverarbeitung können Computer Barcodes, Datamatrixcodes, Teilemarkierungen und optische Zeichen erkennen und auslesen – Erfahren Sie hier mehr über die Computer Vision-Technologie

Erfahren Sie mehr
Laptop Image Small-1