Die Maschine spricht!

Seit relativ kurzer Zeit taucht bei jedem heise.de-Artikel ein kleiner Knopf neben der Überschrift auf, der die Aufschrift „Vorlesen“ trägt. Klickt man darauf, wird der Text der Meldung als Audiodatei abgespielt, die offenbar mit einer Text-to-Speech-Funktion generiert wurde. Sprechende Machinen kennt man ja zur genüge vom Telefonbanking, aber dieser Schritt zeigt, dass die Maschine im Vorlesen mittlerweile offenbar „gut genug“ geworden ist, so dass bei heise alle Texte fortan gesprochen zur Verfügung stehen. (Der Vollständigkeit halber möchte ich ergänzen, dass dort steht „Testbetrieb der Sprachausgabe bis zum 9.11.07“) Nchfolgend eine Audiokostprobe des Artikels „Heinz Nixdorf Museumsforum zeigt Hollerithmaschine“

[audio:/wp-upload/hnf.mp3]

Update 6.6.2007
Die Financial Times Deutschland zieht nach: Auch die FTD bietet jetzt ihre Artikel (z.B. diesen hier „Bush-Nachfolger drohen Iran mit Atomschlag“) mit Vorlesefunktion (jetzt selber hören) an.

Update 29.1.2008
Mittlerweile – das war klar, oder – gibt es einen Web 2.0-Dienst, den man natürlich komfortabel in das eigene Blog einbinden kann. Talkingtext füllt diese große Lücke, die da klaffte.

talking_text_player.png

Zuerst gesehen habe ich das im Fernstudiumblog, bei dem man sich bereits alle Beiträge vorlesen oder wahlweise als Audiofile einfach runterladen kann. Das sieht dann so aus wie in der Abbildung (Fenster) gezeigt.

Allerdings hat tt noch ein paar beta-bedingte Probleme (Stand 30.1.2008):

  1. Der Registrierungsprozess für ein Blog ist viel zu kompliziert, statt einfach die Standard Feed-URL zu nutzen braucht das Blog einen eigene Feed-URL, die ein Plugin für WordPress erzeugt
  2. Das WP-Plugin ist an sich ne tolle Sache, funktionierte bei mir aber nur lokal
  3. Das Playerfenster ist doch ziemlich arg hässlich, da wünscht man sich ein custom skinning für Farbe, Buttons, Headlines usw.
  4. Was ohne Ende nervt ist, dass man sich auf der Managementseite stets neu einloggen muss (keine Cookies) – das sollte schleunigst behoben werden
  5. Die Registrierung eines neuen Blogs ist absolut kryptisch, man bekommt zig Mails und blickt es irgendwann gar nicht mehr. Warum kann ich den einzubindenden Code nicht im Managementportal einfach einsehen?
  6. Das die Umwandlung Zeit kostet ist klar, aber zumindest eine kleine Audio“vorschau“ bzw. ein pre-Hearing der Stimmen sollte doch möglich sein, oder??
  7. Sowie man sich einlogged sollte gezeigt werden wie weit der Fortschritt für die Text-to-Audo-Konvertierung fortgeschritten ist, dass man nicht so raten muss.
  8. Das Menü der Managementseite ist wirklich arg beta, nichtmal die Eingabefelder für die wichtigen Sachen sind kommentiert.
  9. Die leicht esoterische Musik im Hintergrund ist ja vielleicht ganz nett, aber zumindest eine optinale Abschaltung sollte drin sein, besser noch eigenes mp3-loop hochladen können

Weitere Infos sollten sich im Blog von talking text finden lassen.

Why do i blog this? Mir kommt die Stimme bekannt vor! Genau die Stimme habe ich auf meinem Laptop schon einmal gehört und ich war ziemlich begeistert von der Qualität der individuellen „Vorlesung“, denn der Computer spricht alles immer exakt gleich aus, egal wie oft er es vorliest, das kann kein Mensch so gut! Die Stimme heißt glaube ich „Klaus Infovox iVox HQ“ auf dem Mac. Durch Eingabe des Unix-Befehls say -v "Ralph" -o ralphLiestVor.aiff "This is the Weblog Thetavellehh." kann man beliebigen Text mit beliebigen Stimmen automatisch in eine Audiodatei umwandeln.

Ich finde dieser Schritt von Heise macht deutlich, dass Text-to-Speech das Tor zur sprechenden Maschine weiter aufgestossen hat.
Sience Fiction aus Star Trek wird peu à peu Wirklichkeit und bald sprechen die Maschinen noch viel mehr. Damit einher geht, dass der Computer unsichtbarer werden kann, weil er kein optisches Display mehr braucht, um seine Informationen zu übermitteln. Ein Audio-Display tritt an seine Stelle. In Star Trek ist dadurch die Brücke (siehe Grafik rechts als Beispiel) ein sehr aufgeräumter Ort ohne Tastaturen, Maus oder gar Desktop-Rechnergehäusen, nur noch die wirklich grafisch notwendigen Informationen werden auf den optischen Displays gezeigt, die Kommunikation mit dem Rechner findet per Audio statt. Heise lässt den Rechner sprechen, jetzt fehlt nur, dass ich Heise auch ganz einfach etwas sagen kann, z.B. „Computer, lies bitte schneller vor!“ ;-)

Web 2.0: Organizational Leadership-Rezept

Anja Wagner fragt: „Vielleicht wäre folgender, von Dave Pollard formulierter Ansatz eine Möglichkeit, die schwerfälligen Hochschulen mit auf den Weg zu nehmen?“ und verweist auf nachfolgende Grafik (via edufuture). Wobei Anja das Wort „reluctant“ noch sehr zaghaft übersetzt hat, leo.org liefert: zu reluctant adj.: abgeneigt, unwillig, widerstrebend, widerwillig, zögernd, zurückhaltend. Ich denke der Ansatz wäre in der Tat geeignet. Mir gefallen vor allem die hervorgehobenen Schritte inklusive „Celebrate Success“, das wird in Deutschland oft vergessen! Wenn etwas gut läuft oder gelaufen ist, dann darf man das auch mal sagen, zeigen und leben.


Grafik von Dave Pollard, mit Hervorhebungen von mir.

Dave Pollard hat die einzelnen Schritte mit Text kommentiert, ein Besuch seiner Seite lohnt sich, um die Details nachzulesen. Für mich ein gelungener Entwurf für ein 1A-Change Management.

Studierendenwünsche an die IT der Universitäten

Das deutsche Presseportal berichtet von einer Studie der Firma Microsoft (Pressemitteilung), die von TNS Infratest durchgeführt wurde. Das Portal Campus Innovation aus Hamburg fragt genauer nach und titelt „Was will die Google-Generation?“. Auf eine Grafik gebracht, die beim Presseportal für redaktionelle Zwecke eingebunden werden darf, zeigt sich folgendes Bild (via Soziologisches Wissen):


Why do I blog this? Wenn ich Student wäre, würde das genau meiner Ansicht entsprechen. Ich bin bei einer von Firmen in Auftrag gegebenen Studie gerne kritisch, diese Grafik scheint mir allerdings ziemlich plausibel. Ich würde auch gerne per SMS die Studierenden auf dem Laufenden halten. Die Veranstaltungen z.B. alle per Video für den iPod aufzeichnen lassen, und Sprechstunden per Videokonferenz oder z.B. Skypecast durchführen. Sowohl mit dem Weblog-Einsatz als auch in Sachen Online-Tests bzw. E-Klausuren sehe ich hier die Uni Bremen bereits recht gut aufgestellt. Foren zu Lehrveranstaltungen sind mit dem stud.ip System ohne weiteres umsetzbar. Virtuelle Arbeitsräume sind ein echter Knackpunkt, da setzen wir derzeit auf das EverLearn-System, weil dort sehr einfach Inhalte von Studierenden erzeugt und arrangiert werden können, ohne dass erst eine komplexe Syntax wie z.B. bei Wikis erlernt werden muss.