»Einen Fehler zu machen, ist nicht gleichbedeutend mit Scheitern« Featured
- Written by Martin Szelgrad
- font size decrease font size increase font size
Wilfried Schaffner, Speech Processing Solutions, mischt bei Sprachtechnologien weltweit mit – und stellt Traditionen auf den Kopf.
Die Abteilung für Diktiergeräte wurde von den Mitarbeiten damals als »kleines, gallisches Dorf« am Konzernstandort Wien gesehen, erzählt Wilfried Schaffner lächelnd. Während Philips das große Geschäft mit Videorekordern, Faxgeräten und später auch Beamern machte – zu Spitzenzeiten waren an die 4.000 Beschäftige im Werk in Wien-Favoriten tätig –, führten die Mitarbeiter der Sprachlösungssparte über Jahre ein Nischendasein. Und heute? Der Konzern ist hierzulande nicht mehr direkt präsent. Die Diktiergeräte-Experten nützen mit dem Firmennamen Speech Processing Solutions zwar noch die Marke Philips, agieren aber als eigenständiges österreichisches Unternehmen. Mit einem Management-Buyout und der Hilfe von österreichischen Investoren wurde aus der einstigen Produktnische ein Hidden Champion mit kräftigen Forschungs- und Entwicklungsaktivitäten geformt.
Seit zwei Jahren leitet Wilfried Schaffner das Innovationsteam bei Philips Speech und kann auf einen Riesenwissensschatz seiner Mitarbeiterinnen und Mitarbeiter zugreifen. Das Geschäft ist im Wandel: Aus Hardwareprodukten wurden in Kombination mehr und mehr auch Softwarelösungen. Das erfordert auch neue Strategien. »Bei Philips herrschte noch das Credo, alle Produktionsschritte selbst abdecken zu müssen. Das funktioniert allein schon im Softwarebereich nicht mehr, da man auf Standardkomponenten setzt und nicht ständig das Rad neu erfinden kann«, beschreibt der Technologievorstand Schaffner.
Sinnbildlich für das neue Denken im Unternehmen steht das jüngste Produkt »SmartMike«. Seine Entwicklung wurde durch ein agiles Zusammenwirken, übergreifend über Abteilungen, begünstigt. In der Sprachtechnologie wird nun Machine Learning eingesetzt. Während die Produktpalette von »Philips Speech« bisher schon eine hohe Aufnahmequalität mit Prozessen wie etwa Transkriptionsservices verknüpft hat, bildet das jüngste Baby auch natürliche Gesprächssituationen ab. Dazu gehören auch überlappende Gesprächsphasen, wenn zwei Menschen parallel sprechen. Mit der sauberen Trennung der Kanäle können die Aufnahmen fehlerfrei in Text verwandelt und den Sprechern zugeordnet werden.
SmartMike wurde in Wien aus der Taufe gehoben und auch die Endfertigung findet am Standort statt. Philips Speech beschäftigt rund 100 Mitarbeiter in Österreich, weltweit sind es über 170 – von Atlanta bis Sydney. Rund 20 Spezialisten sind im Hardware- und im Softwarebereich an der Entwicklung des neuen Produkts beteiligt. Das enge Zusammenspiel der Komponenten mache seine Einzigartigkeit aus. Ohne die besondere Anordnung der Mikrofone würden die softwaregesteuerte Aufnahme und folglich Erkennung des Gesprochenen nicht funktionierten, sagt der Manager. »Der besondere Kick ist die Zusammenführung dieser beiden Welten.«
Das neue Gerät wird derzeit über strategische Partnerschaften in andere Softwarelösungen integriert. Im Laufe des Jahres will Speech Processing Solutions, wie das Unternehmen hinter der Marke Philips Speech heißt, einen Dienst aus der Cloud launchen, der die Übersetzung in die Schriftform von mehreren Sprechern gleichzeitig bietet. Mit der Lösung »Speech Live« können bereits heute herkömmliche Aufnahmen in Text übertragen werden, sowohl mit Spracherkennungs-Software als durch die manuelle Arbeit von Transkriptionisten. Die Daten, die hochgeladen und verarbeitet werden, verlassen den Rechtsraum der Kundschaft nicht – die Österreicher betreiben für ihre Unternehmenskunden jeweils Server in Europa, in den USA, in Kanada und in Australien. Die Klientel der Philips-Geräte sind Beschäftigte der Versicherungsbranche, Rechtsanwälte und vor allem Personal im medizinischen Bereich. Es sind Berufsgruppen, die oft mobil arbeiten und einen hohen Diktieraufwand haben. Auch in Bereichen wie im Bau- und im Bankensektor müssen Abläufe zunehmend dokumentiert werden. Die smarten Lösungen aus Wien unterstützen bei dieser mühseligen Tätigkeit.
Schaffner arbeitet mit seinem Team an einem ganzen Ökosystem dieser praktischen Arbeitshilfen: fürs Handy, als Tischgerät und bald auch als mobiles Device für die Brusttasche, um Arztgespräche aufzuzeichnen und das Erstellen von Befunden zu unterstützen. In der Pathologie sind die Highend-Mikrofone besonders gefragt: Die Spracherkennung und automatisierte Transkription sind dem Tippen auf der Tastatur weit überlegen. Ohne technische Hilfe wäre die Arbeit im Gesundheitsbereich oft nicht in der gewohnten Qualität möglich. Und nicht nur dort. »Mit der neuen Lösung adressieren wir verschiedenste Anwendungsbereiche: Das Führen von Interviews, Gespräche der Personalabteilung, Verkaufsgespräche von Maklern«, sagt Schaffner. Es gehe eben nicht nur um das reine Audio-Recording, sondern um die Möglichkeit, Dokumentiertes später nach Schlagworten zu durchsuchen.
Weltreisender wieder zuhause
Nach seinem Studium in Hagenberg hatte Wilfried Schaffner zur Jahrtausendwende seine Karriere bei einem Münchner Startup gestartet. Man baute für Kunden in der Logistik GSM-Modems in die damals klobigen Ortungsgeräte von LKWs und vertrieb diese – früh für seine Zeit – in einem reinen Mietmodell. »Das Unternehmen wurde dann viel zu günstig verkauft – aber wir waren jung und einfach glücklich, einen Investor gefunden zu haben«, sagt er heute. Nach Stationen in Australien und den USA – bei Unternehmen, die sich auf Mobile Payment und auf Luftaufnahmen spezialisierten – kehrte der Österreicher zurück und übernahm 2013 die Geschäftsführung des Reiseführer-Startups tripwolf. Das Unternehmen überlebte die Coronakrise im Vorjahr nicht mehr, für Schaffner kam zuvor bereits der Ruf von Speech Processing Solutions. »Ich bin in keiner bestimmten Branche zuhause«, sinniert Schaffner. »Was ich aber am liebsten mache, ist Produkte zu entwickeln – zunehmend auch softwarebasierte Innovationen, dynamisch und in agilen Teams.« Dazu gehöre auch, Fehler machen zu dürfen. »Das habe ich aus meinen internationalen Erfahrungen mitgenommen. Einen Fehler zu machen, ist nicht gleichbedeutend mit Scheitern. Es bedeutet, zu erkennen, dass etwas nicht funktioniert und daraus zu lernen.«
Umgesetzt auf die Produktentwicklung in einer Ingenieursdisziplin wie Audio-Recording heißt das, auch einmal »nur« mit einem Prototypen zu Kunden zu gehen, um zu beobachten, wie dieser tatsächlich verwendet wird. Was kommt gut an? Was weniger gut? »So etwas ist weit weniger riskant, als Produkte fixfertig zu produzieren und dann auf den Verkaufserfolg zu hoffen«, ist er überzeugt. Sein Credo: Nicht das zu produzieren, wonach der Kunde verlangt, sondern zu hinterfragen, was er wirklich braucht. »Wir haben unser Ohr am Markt, bei unseren Partnern und bei unseren Kunden«, bekräftigt der Technikvorstand. Analyse-Features, die in den Produkten eingebaut sind, melden anonymisiert das Nutzungsverhalten ans Unternehmen zurück. »So können wir unsere Produkte laufend verbessern – auf Basis von echten Daten und nicht im Blindflug von Annahmen«, sagt Schaffner.
Das langfristige Bestehen auf einem Technologiemarkt mache die gute Mischung aus – solide Ingenieurskunst und die Offenheit, auch die eigenen Produkte stets in Frage zu stellen.
Bild: Mit »SmartMike« werden zwei Sprecher getrennt aufgezeichnet und in Text umgewandelt – selbst wenn gleichzeitig gesprochen wird.