Hauptnavigation

Word - DOC next up previous contents
Weiter: Abgrenzung zu bestehenden Systemen Hoch: Markup-Sprachen Zurück: RTF

Word - DOC

Dokumente die mit Textverarbeitungsprogrammen erstellt wurden, sind in den wenigsten F?llen im ASCII-Code gespeichert. Nahezu jedes Textverarbeitungsprogramm besitzt sein eigenes Format, und leider legen nur sehr wenige Firmen die interne Datenstruktur offen. Daher ist es nicht leicht Informationen ?ber diese Formate zu bekommen.

Das sehr weit verbreitete Textverarbeitungsprogramm Word, der Firma Microsoft, weist genau die genannten Probleme auf:

  • es benutzt ein gemischtes ASCII-/Bin?rformat zur Abspeicherung der erstellten Textdateien
  • es ist keine Spezifikation zum DOC-Format ?ffentlich verf?gbar

Aufgrund des Bin?rformates und der fehlenden Formatbeschreibungen ist eine Verarbeitung von Dokumenten die mit Word erstellt wurden nur sehr schwer m?glich.

In ?lteren Word-Versionen war es noch nicht m?glich Formatvorlagen zu definieren, ein erstelltes Dokument konnte nur mit reinen Formatierungsattributen wie Schriftgr??e und -art formatiert werden. Strukturierende Metainformationen konnten nicht eingef?gt werden. Daher f?llt die Formatierung, die alte Word-Versionen vornehmen, unter das visuelle Markup. Werden hingegen Formatvorlagen verwendet, k?nnen beliebige Strukturen ausgezeichnet werden. Damit f?llt das DOC-Format nicht mehr unter die reinen visuellen Auszeichnungssprachen, sondern kann auch zu den semantischen Markup-Sprachen gez?hlt werden.



Christian H?ppe, christian.hueppe@web.de