Schlagwort-Archiv: Bild

Voice Vision: Werkzeug ohne Werkstoff?

Vor längerem hatte ich über das Projekt “The Voice” http://www.seeingwithsound.com geschrieben. Es handelt sich um eine recht einfache Methode Bilder in Töne umzuwandeln – sie also zu sonifizieren. Dabei geht es nicht darum sie zu beschreiben oder zu analysieren, sondern ihren Inhalt möglichst verlustfrei akustisch wahrnehmbar zu machen. Da hinter steht die Theorie von Peter Meyer, dass das menschliche Gehirn dazu in der Lage sein sollte solche Bilder die akustisch aufgenommen wurden in eine optische Wahrnehmung umzusetzen.

The Voice gibt es für den PC und für Symbian sowie Android, aber nicht für IPhone. Deshalb hat ein chinesischer Entwickler quasi den gleichen Algorithmus in einer IPhone-App namens “Voice Vision” umgesetzt. die App ist (inkl. Upgrades auf die Vollversion) kostenlos. Wer “The Voice” kennt, kommt hiermit sicher auch schnell zurecht. die Tutorials zeigen anhand von Beispielen wie Bilder “klingen”.

Nun gut, die App funktioniert wie erwartet und man kann erahnen, welche bekannten Gegenstände sich auf den Bild befinden könnten, wenn man weiß, was man vor sich hat. Es wäre also eine Frage der Übung unbekannte Bilder zu erkennen. Dabei muss man wissen, dass sich nur recht grobe Strukturen erkennen lassen können (die Auflösung ist gering und für komplexe Bilder braucht es viel Erfahrung und Wissen über optische Gesetze). Was macht man nun mit einer solchen app? Wo lässt sie sich wirklich anwenden?

Der Entwickler gibt an, dass man mit dem Tool Kanten, Türen etc. erkennen kann. Schön, aber war das bislang wirklich ein Problem? Das IPhone muss man mindestens mit einer hand halten und ausrichten – die könnte man auch zum tasten nach den gleichen Hindernissen verwenden. Außerdem ist die Auswertung der akustischen Echos von Schritten und Klicks bei vielen blinden Anwendern recht gut ausgeprägt, sodass sie auch mit vollen Händen durch die Tür finden. The Voice schlägt eine ideosonnenbrille wie Google Glasses vor. Dabei wären die Hände dann wirklich frei und man „sieht“ ohne etwas in der Hand halten zu müssen. Gleichzeitig unterstützt The Voice Spracheingaben, sodass man die Anwendung anweisen kann, ein- oder auszuzhoomen etc. Dies sind zentrale Unterschiede, die auch ü ber die tatsächliche Anwendbarkeit entscheiden dürften.

Endlich die Freundin auf einem Foto “anschauen”? Das würde nicht viel bringen, da ein solches Bild viel zu komplex wäre. Farben von Klamotten etc. können auch andere Anwendungen oder Geräte erkennen. Geschriebene Texte sollte man wohl besser durch eine OCR jagen, denn die dürfte deutlich leichter den Text extrahieren können.

Leider bietet die App nicht die Möglichkeit durch die eigenen Fotos auf dem Gerät zu stöbern und sich evtl. deutliche Abbildungen anzuhören. Das wäre vielleicht eine interessante Erweiterung.

Ich will nicht behaupten, dass die Anwendung unnütz wäre. Es ist eine Möglichkeit in die Welt der Bilder einzutauchen. The voice hilft hier wiederum, weil man beliebige Bilder öffnen kann, sodass auch einfache zeichnungen von anderen Personen in gewisser Weise erkannt werden können. Durch die Mathematik-funktion (die ausgabe von Grasfen) ist eine sehr pragmatische und interessante Anwendung gelungen.

Kurz: Ich kann mir derzeit nicht recht eine sinnvolle Anwendung vorstellen. Vielleicht hat ja einer meiner Leser eine gute Idee?