Was ist der größte Feind eines jeden Computeruser? DATENVERLUST. Dieses mal hat es mich leider getroffen, die OCR Software ist weg :-(
Aber aus der Not heraus ist eine neue OCR Software entstanden. Nachdem die alte mehr oder weniger 3 oder 4 mal verändert wurde und die alten Routinen doch sehr langsam waren, habe ich mit den Erkenntnissen, die ich mit der ersten Version gesammelt habe, eine zweite Version geschrieben. Die Software wollte ich mal kurz vorstellen.
Funktionsweise:
- Erst werden im Bild die zwei Stellen mit Zahlen (Speed und Alt) gesucht
- Dann werden die Ziffern aus den Zahlen herauskopiert, zentriert (und am Monitor angezeigt)
- Im letzten Schritt werden die Ziffern mit Vorlagen vergleichen. Eine Zahl wird als erkannt gezählt, wenn < 30 Pixel Abweichung herrscht zur Vorlage UND wenn die Abweichung in Pixeln zum nächstbesten Fund mindestens doppelt so schlecht ist.
- Zur Sicherheit wird jede gefunden Ziffer auf der Festplatte gespeichert. Damit kommen zwar einige 10.000 Dateien zusammen, aber man kann diese schnell überfliegen und kontrollieren.
- Als Referenz sind bei einem kurzen Video von ca. 12 Minuten nur 9 Referenzen pro Ziffer notwendig gewesen.
Was noch stört, ist daß die Software nicht von alleine weiter läuft, wenn eine Ziffer nicht gefunden wurde. Ich habe keine Datenbank programmiert, sondern jede Erkennung wird an die Zieldatei angehängt. Fehlt eine Ziffer, muss das Programm warten. Aber bei derzeit einem Start alle 2-3 Wochen ist das zu verkraften.
Ggf. bekommt die Software noch eine Verbesserung bei der Schwarz-Weiß-Bild Umrechnung. Denn die ist mal besser und mal schlechter. Zum einen müsste der Kontrast automatisch angepasst werden, da er im laufe des Videos sich häufig ändern, zum anderen ist der Hintergrund halbtransparent, was die Auswertung erschwert. Ggf. müsste man die Transparenz erst ein wenig zurück rechnen. Man sieht den Balken vom Livebild hinter den Ziffern häufiger mal in den Schwarz-Weiß-Zahlen.
So sieht die OCR Software jetzt aus:
Oben links geht es mit einer Minivorschau des aktuellen Bildes los.
daneben sind Testknöpfe um einzelne Funktionen (manuell) zu testen, gefolgt von den Kopien der im Bild gefunden Zahlen, lediglich die Farben wurden auf 2 Stück reduziert.
Da drunter sind alle gefundenen Ziffern aufgelistet. Die Anzeige dient nur zur Kontrolle, gerechnet wird Intern. Unter den Ziffern ist direkt das gefundene Ergebnis. Die jeweils aktuelle Zahl wird auch als Klartext mit Beschreibung angegeben. Im Bild wurde eine 4 mit 4 Pixeln Abweichung gefunden. Die nächstbeste Ziffer wäre eine 1 gewesen (1 und 4 sind sich ähnlich), aber mit 113 Pixeln Abweichung ist die 4 eindeutig.
Ganz unten ist ein Zahlenfeld auf dem ich nicht erkannte Zahlen schnell mit der Maus anklicken kann. Sollte SpaceX die Schriftart ändern, ist das also kein Problem.
Ganz rechts wird das Ergebnis für die Grafiken angezeigt, welches ich dann Copy-Paste herausschneiden kann.
Wo ich noch unsicher bin: Derzeit Prüfe ich nicht jede gefunden Ziffer mit jeder Vorlage. Das würde länger dauern. Sondern ich breche die Prüfung ab, sobald die Zahl sicher genug erkannt wurde (<30 Pixel abweichung zur Vorlage und die nächste Ziffer muss 2 mal schlechter sein). Im Moment liege ich damit bei 100% Trefferquote. Hoffentlich bleibt das so.
Ein wenig gesucht habe ich einen "Bug". In den Daten war aufeinmal die Zahl 10,, also 10 mit zwei Kommastellen, statt einer 100 enthalten. Da ich das SES9 Video verwende, welches ich schon zig mal ausgewertet hatte, habe ich den Bug erst in der Software gesucht. Aber der BUG liegt bei SpaceX. Hier das Beweisfoto:
Vorher ist es nie aufgefallen, da ich nur 1 Bild pro Sekunde auswerte. Das reicht zum Erstellen der Kurven aus. Aber heute habe ich die Auswertung nicht mit dem Start/Abheben Synchronisiert und somit andere Bilder ausgewertet als sonst. Diese Zahl wird von SpaceX 0,1 Sekunden lange gemeldet. Ich hoffe mal, daß es nur ein Fehler im TV-Bild ist und kein Fehler in der Falcon9-Software welcher bis zum TV-Bild weiter gereicht wurde.