Vor einigen Wochen habe ich an einer Aktion für Studenten der Technischen Universität in Brno (Tschechische Republik) namens ŽijemeIT teilgenommen. Dies ist eine jährliche Minikonferenz für Studenten, auf der eine Reihe großer und bekannter IT-Unternehmen in Brünn Übersichtsvorträge über ihre Aktivitäten, interessante Richtungen und Projekte halten. In diesem Jahr war eine Tendenz zu beobachten, dass Unternehmen maschinelles Lernen und künstliche Intelligenz einsetzen, um verschiedene geschäftliche Probleme zu lösen. In diesem kurzen Rückblick möchte ich einige interessante Beobachtungen zu diesem Thema mitteilen. Wen kümmert es, ich bitte um einen Schnitt
Die Aktion erfolgt in Form von Firmenpräsentationen und Informationsständen mit Werbematerial. Während der Präsentation erhalten Sie einen Überblick über die Aktivitäten des Unternehmens. Während der Pause können Sie den Reportern interessante Fragen stellen oder mit Vertretern des Unternehmens an den Ständen chatten und mehr über Projekte und offene Stellen erfahren. Ziel der Aktion ist es, Studenten potenziellen Arbeitgebern vorzustellen und möglicherweise eine zukünftige Arbeit zu finden.

Wo maschinelles Lernen Anwendung fand
In diesem Jahr wurden zahlreiche Vorträge zu Themen des maschinellen Lernens und der künstlichen Intelligenz gehalten. Diese Technologien werden in einer Vielzahl von Bereichen und Bereichen der IT eingesetzt.
Beispielsweise analysiert das amerikanische Unternehmen Mavenir die Sicherheit der Mobilfunknetze und identifiziert betrügerische Transaktionen (das sogenannte Network Vulnerability Audit). Um Spam-Nachrichten zu analysieren und betrügerische Angriffe zu identifizieren, verwendet Mavenir klassische Methoden des maschinellen Lernens.
Zu Beginn sammeln Unternehmensspezialisten Daten von Mobilfunkbetreibern, insbesondere Daten zu Telefonanrufen und SMS-Nachrichten (Anrufdauer, Anrufernummer, Absendernummer, Nachrichtentext). Darauf aufbauend werden statistische Graphen erstellt und verschiedene Analysemethoden angewendet: soziale Graphen, semantische Analyse. Ziel ist es, verdächtige Aktivitäten im Netzwerk zu identifizieren. Durch die Analyse statistischer Daten können Sie einen Textklassifizierer für Nachrichten erstellen. Letztendlich liefern die Experten von Mavenir einem Mobilfunkanbieter einen detaillierten Bericht und eine Prognose des Potenzials für betrügerische Aktivitäten in seinem Mobilfunknetz.
Hier besteht das Problem, Daten zu Anrufen und Nachrichten in verschiedenen Ländern zu empfangen. Zur Analyse von Schwachstellen im Netzwerk werden echte Betreiberdaten benötigt. Verschiedene Aufsichtsbehörden für die Kontrolle personenbezogener Daten sind in verschiedenen Ländern tätig: Die DSGVO ist in Europa tätig, und die Staaten haben ihre eigenen Gesetze.
In Bezug auf die Technologie werden Keras und Scikit-Learn verwendet. In Bezug auf Python gibt es eine Einschränkung für Multithreading - die bekannte Einschränkung von Global Interpret Locker (GIL), die eine wichtige Einschränkung bei der Verarbeitung großer Datenmengen darstellt. Bisher verwendetes C ++ XGBoost. Hiermit können Sie eine sehr kleine Verzögerung (weniger als 0,1 ms) erzielen.

Ein weiteres Beispiel ist Y Soft. Das Unternehmen entwickelt Benutzeroberflächen für Drucker. Eine wichtige Aufgabe hierbei ist es, das fertige Programm zu testen. Manuelles Testen ist sehr zeitaufwändig, zeitaufwändig und schließt Fehler nicht aus. Daher automatisierte das Unternehmen das manuelle Testen der Benutzeroberfläche des Programms mithilfe von Computer Vision und einem Roboterarm (das RQA-Projekt kann
hier und
hier gelesen
werden ).

Der Roboterarm wird im Terminal mit Berechtigungsnachweisen autorisiert, wechselt zum Zielbildschirm, wählt die gewünschte Aufgabe (Scannen, Drucken), prüft den Erfolg und wechselt schließlich zum Hauptbildschirm.

Der Roboter wird von einer Kamera überwacht, die seine Aktionen auf Video aufzeichnet. Hier werden die Aufgaben der Bildschirmerkennung und Erkennung von Elementen in der Anwendung gelöst. Ursprünglich wurden die klassischen Bildverarbeitungsmethoden verwendet: Feature Descriptors, OCR. Eines der Probleme war der sogenannte Moiré-Effekt - das Auftreten einer Reihe horizontaler Streifen auf dem Monitorbildschirm, die häufig auftreten, wenn der Monitorbildschirm durch die Kamera betrachtet wird. Als Ergebnis von Experimenten wurden Probleme unter Verwendung eines neuen Bildklassifikators gelöst, der auf Histogrammen lokaler kumulativ verzerrter Kanten basierte. In diesem Fall kann die Verwendung von AI die Geschwindigkeit des Vorgangs erheblich erhöhen (etwa eine Sekunde gegenüber 20 Sekunden bei herkömmlichen Bildverarbeitungsverfahren).

Technologisch nutzten sie zunächst CNTK (Wrapper over C ++) und Accord. CNTK verfügt über eine komplexe API, und Accord wird nicht mehr unterstützt und weist eine geringe Parallelität auf. Letztendlich wird die ML .NET-Bibliothek in Verbindung mit .NET-Technologien (ASP .NET) verwendet.
Wo maschinelles Lernen noch nicht anwendbar ist
In einigen Fällen bleiben traditionelle Methoden zur Problemlösung ohne maschinelles Lernen die beste Option. Beispielsweise entwickelt Thermo Fisher Scientific ein Bildgebungsprogramm für ein Elektronenmikroskop mit Bildvorverarbeitung. Für die Bildverarbeitung werden herkömmliche Bildverarbeitungsmethoden verwendet.

Dies ist auf mehrere Faktoren zurückzuführen. Erstens können maschinelle Lernmethoden keine 100-prozentige Genauigkeit liefern, auch wenn immer ein unbedeutender Fehler auftritt. In diesem Fall ist die kritische Genauigkeit für den Kunden der Akzeptanzfaktor, wenn der Kunde eine wissenschaftliche Organisation ist (z. B. Forschungslaboratorien, die mit der Herstellung von Mikrochips befasst sind). Zweitens erfordern dieselben Schwammlernmodelle, um eine maximale Vorhersageeffizienz zu erzielen, eine große Datenmenge für das Training, vorzugsweise so viele wie möglich, wie ihre Genauigkeit bewertet wird. Im Falle von Thermo Fisher Scientific ist der Kunde nicht bereit, seine Daten für Leistungstests bereitzustellen.

Schließlich ist das Ergebnis, das durch die Folgerung eines neuronalen Netzes erhalten wird, schwer zu erklären (das bekannte Phänomen der neuronalen Netze als "Black Box"). Dies ist der Fall, wenn die äußerste Genauigkeit und das Verständnis des Entscheidungsprozesses eine höhere Priorität haben als die Umsetzung der Aufgabe und die Geschwindigkeit der Ausführung.
Das ist alles für jetzt. Viel Glück an alle und bis bald!