Word-Dateien weitergeben?

Warum ist das Dateiformat von 'Word' (Endung .DOC) kein Austauschformat?

Microsofts Strategie zur Erstickung aller Konkurrenz durch die Verbreitung ihrer proprietären Dateiformate scheint aufzugehen. Dem Benutzer von Microsoft Office wird vorgegaukelt, es sei ganz einfach, seine Dokumente im jeweiligen Format weiterzugeben. Auf Diskette, per e-mail oder sogar zum Download im WWW.

Wer mit solchen Leuten zu tun hat, wird dadurch gezwungen, sich ebenfalls die Software von Microsoft anzuschaffen, um mit den gesendeten Daten auch etwas anfangen zu können.

Aber es sind nicht nur politische Gründe, die gegen den Austausch von Dateien im .DOC-Format von MS Word sprechen. In den meisten Fällen ist das Format schlicht ungeeignet und zu risikobehaftet.

Inhalt

Virengefahr

Word-Dokumente können Makroviren enthalten. Daher sollten DOCs von fremden Rechnern nur nach sorgfältiger Prüfung geöffnet werden.

Eine ausführliche Untersuchung des BSI kam schon 1997 zu dem Fazit:

Makro-Viren sind ein Problem, das jeden Computer-Nutzer treffen kann. Es sind daher nicht die Anwender oder die Hersteller von Anti-Virus-Software gefordert, sondern die Hersteller der Anwendungsprogramme, die die Möglichkeit bieten, mit Makro-Hochsprachen zu arbeiten. Die Einbettung von Makros, die mit diesen Sprachen geschrieben werden, ist so sicher zu machen, daß ein Anwender nicht Gefahr läuft, lediglich durch das Lesen von Texten oder Tabellen einen Verlust von Daten auf seinem Rechner hinnehmen zu müssen. Sollten die Hersteller weiter nur Wert auf Funktionalität und nicht auch auf Sicherheit legen, so sind die Anwender gefordert, ihre Unzufriedenheit entsprechend kundzutun auch wenn dies nicht immer einfach und sofort wirksam ist.

Den zitierten Text gibt es nicht mehr im Web, dafür einen neuen Grundlagenartikel des BSI über Makrovieren. Auch wenn seit dem Jahr 2000 die E-Mail-Würmer in der Anzahl des Auftretens die Makrovieren überholt haben, sind diese weiterhin eine aktuelle Bedrohung, vor allem im Zusammmenhang mit den neuen kombinierten Multi-Schadprogrammen.

Da es Microsoft auch seither nicht gelungen ist, ihre Scriptsprache wirksam gegen Viren zu schützen, bleibt den Anwendern nur, auf die Weitergabe von script- und makrofähigen Dokumenten zu verzichten.

Auch wenn ich davon ausgehe, dass meine Dokumente sauber sind, will ich niemandem, der nicht genau die Risiken einschätzen kann, empfehlen, irgendein fremdes Word DOC auf seinen Rechner zu holen.

Auch mit neuen Versionen von Office wird das Virenproblem nicht gelöst. Im Gegenteil, jede neue Version liefert neue Ansatzpunkte für Virenprogrammierer:

PC-Welt: Gefährliches Office 2000

Office 2000 enthält einige neue Abwehrfunktionen gegen die heute verbreitetste Virenart, die Makroviren. Wirklichen Schutz bieten sie allerdings nur bedingt - die Schutzfunktionen können sogar bewirken, dass sich Viren erst recht und unerkannt ausbreiten.

(leider hat die PC-Welt schon wieder ihre Website so umgebaut, dass alle dorthin gesetzten Links ungültig wurden. Ich suche gerade nach einer Zitierstelle mit besserer Web-Kompetenz)

Informationen zu Computer-Viren
vom Bundesamt für Sicherheit in der Informationstechnik
c't - Anti-Virus-Bookmarks
Allgemeine Informationen zu Computer-Viren und ihrer Bekämpfung
Porsche verschickte Virus
Was ist unangenehmer, als von einem Computer-Virus befallen zu werden? Aus Versehen einen Virus zu verbreiten. Eben das ist Porsche im Sommer 2001 passiert.
Die Konsequenz: [...] Eventuell wolle man sich als langfristige Lösung überlegen, ganz auf Office-Dateitypen zu verzichten und stattdessen .txt- oder .pdf-Dateien zu verwenden.

Kompatibilität

Nicht einmal ältere Word-Versionen können Dokumente einer neuen WinWord-Version öffnen. Geschweige denn Menschen, die ein anderes Betriebssystem oder ein anderes Schreibprogramm benutzen.

Textsicherheit und Datenschutz

Das DOC Format ist weder veröffentlicht, noch im plaintext nachvollziehbar. Jedes DOC enthält unkontrollierbar Datenmüll von Ihrer Festplatte, die Seriennummer Ihrer Netzwerkkarte und vieleicht noch mehr...

Ich würde es nicht leichtfertig anderen Leuten zur Verfügung stellen.

Bei jedem Speichern werden zusätzliche Daten in die Worddatei geschrieben (das ist auch der Grund, warum ein DOC mit jeder Änderung etwas grösser wird). Das hat zur Folge, dass Fragmente aus den Vorversionen, die längst gelöscht sein sollten und die gesamte Bearbeitungsgeschichte des Textes noch in der DOC-Datei enthalten sind. Mit einem Texteditor lassen sie sich teilweise wieder sichtbar machen.

Ausführlich hat sich damit die Computerzeitschrift PC-Welt in der Ausgabe 07/99 (S. 242-243) beschäftigt. Anhand öffentlicher Pressemitteilungen lässt sich zum Beispiel die interne Organisationsstruktur von Microsoft minutengenau rekonstruieren...

Verborgene Infos
Was Dateien im Word-Format verraten, Microsoft inoffiziell, Was Sie tun müssen (leider gibt es die PC-Welt Artikel nur noch gegen Bezahlung, ich suche derzeit nach einer Alternative)

Alternative: Text

In vielen Fällen ist es überhauptnicht nötig, alle Formatierungen eines Textes weiterzugeben. Gerade bei e-mails würde meist ein einfacher Text, direkt im e-mail-Programm geschrieben oder übers clipboard ("Zwischenablage") einkopiert, völlig genügen.

Alternative: RTF

Ebenfalls von Microsoft entwickelt, aber mit offengelegten Syntaxregeln und im Quelltext nachvollziehbar ist das Rich Text Format (RTF) zumindest das kleiner Übel.

Es enthält alle Textformatierungen, wird von den meisten Textverarbeitungen unterstützt, kann keine Viren übertragen, ist für Word-User genauso unproblematisch in der Handhabung wie 'DOC'.

Eigentlich ist für RTF eine Zeichensatzdeklaration vorgesehen. Leider wird diese von einigen älteren Programmen (Claris Works, Word Perfect) nicht richtig geschrieben und interpretiert, so dass es auch hier beim plattformübergrifenden Dateienaustausch zu Problemen mit falsch dargestellten Umlauten kommen kann.

RTF enthält keine Kompression für eingebundene Grafiken. Grafiklastige Dokumente werden deshalb deutlich grösser als im .DOC-Format und sollten deshalb vor dem Versand komprimiert werden (z.B. im ZIP-Format). Dokumente, die nur Text enthalten, sind dafür kleiner.

Beschreibungsformate: Rich Text Format RTF
In ihrer Diplomarbeit hat Beate Fuhrmann verschiedene Textformate durchleuchtet. Das eignetliche Projekt "GUT" ist zwar dank CSS und XML inzwischen wohl obsolet, aber der Abschnitt über RTF ist das Beste, was mir zu dem Thema untergekommen ist.
RTF-Tools - RTF software and documentation / ftp://ftp.primate.wisc.edu/pub/RTF/
zwar nicht auf dem neusten Stand, für die Nachbearbeitung und Konvertierung allerdings immer noch nützlich. Außerdem gibt es hier die RTF-Specifikationen bis incl. Version 1.5.
upCast
Zum Weiterkonvertieren in andere Formate eignet sich RTF wesentlich besser als DOC. Die Münchner Firma infinity-loop verfolgt einen sehr interessanten Ansatz mit ihrem Programm, das RTF in XML oder xhtml umwandelt.
RTF-Dateien doch nicht ganz ungefährlich
Wenn ein Dokument mittels Microsofts OLE-Funktion andere Objekte eingebettet hat, können diese auch innerhalb einer .RTF-Datei noch Macro-Viren transportieren. (PC-Welt)
Rich Text Format (RTF) Specification, version 1.6
Die aktuellste Version der RTF Spezifikationen, für alle, die es ganz genau wissen wollen.
Die Website von Microsoft mit der Orginalversion ist leider so schauderhaft benutzerfeindlich, daß ich sie nicht empfehlen kann.

Alternative: PDF

Das professionelle Standardformat zur Weitergabe von formatiertem Text in digitaler Form ist das Portable Document Format (PDF).

Es wurde von Adobe als Erweiterung der Seitenbeschreibungssprache PostScript (Standard zum Ansteuern professioneller Drucker) entwickelt. Der Acrobat Reader ist kostenlos und gehört zur Standard-Installation jedes PC.

Die Vorteile sind Layout-Echtheit, Vielseitigkeit und Plattformunabhängigkeit. Mit einem verbreiteten PlugIn können PDF-Dokumente auch direkt aus dem Internet im Web-Browser betrachtet werden.

Die Vollversion von Acrobat, mit der PDF-files auch erzeugt und editiert werden können, ist leider relativ teuer.

Es gibt aber auch eine Vielzahl von Freeware- und Shareware-Programmen, die (z.B. als Druckertreiber installiert) das Erzeugen von PDF-Dateien sehr einfach machen.

Was gegen PDF spricht

Im Jahr 2001 konnte ich PDF als Austausch-Format noch guten Gewissens empfehlen. Inzwischen hat sich die Bedrohungslage leider komplett verkehrt. PDF-Dokumente sind mittlerweile auch eine wichtige Infektions-Quelle für Schadsoftware.

Warum PDF kein Austauschformat ist
nicht ganz aktuell und in vielen Punkten stimme ich dem Autor auch nicht zu, aber zum Thema allemal lesens- und bedenkenswert.
PDF considered harmful
kleine Linksammlung
(Un-)Sicherheit des PDF-Formats (Seite 13 ff)

PDF galt lange Zeit als das universelle Austauschformat für Dokumente. Laut einer Statistik des Antiviren-Herstellers F-Secure werden bei gezielten Angriffen inzwischen häufiger PDF-Dateien als manipulierte Word-Dateien verwendet (…). Mit der Einführung von JavaScript ab der Version 4.0 des Acrobat Readers und der Version 1.3 des Formats selbst begann Adobe eine Reihe aus sicherheitstechnischer Sicht höchst problematische Erweiterungen in PDF zu integrieren. Den damit verbundenen Gefährdungen kann bis heute nicht verlässlich mit den zur Verfügung stehenden Abwehrmaßnahmen begegnet werden.

Da die meisten manipulierten PDF-Dateien JavaScript nutzen, um Exploits auf den Opfersystemen auszuführen, ist eine Deaktivierung von JavaScript in PDF-Betrachtern auf jeden Fall sinnvoll. Die Nutzung von alternativen PDF-Betrachtern neben dem Adobe Reader bietet keine hinreichende Sicherheit, denn diese Alternativen weisen zumindest einen Teil der im Adobe Reader vorhandenen Schwachstellen auf. …

So schreibt es das BSI schon im Quartalsjahresbericht 2-2009. Veröffentlicht ist dieser ... als PDF Datei.

die alten Links

Adobe Acrobat
Die Marketing-Seiten von Adobe
Acrobat Reader
die komplette Liste aller downloadbaren Versionen
Acrobat / PDF Technical Notes
Adobe selbst bietet die exakten Spezifikationen des PDF-Formats und weitere verwandte Dokumente zum Download an.
Create Adobe PDF online
Sicher keine Lösung, wenn man oft PDF-Dokumente zu erstellen hat, aber zum Ausprobieren reicht der online-Konverter schon (Anmeldung notwendig, 5 Versuche kostenlos).
PostScript und PDF
ausführliche und gut lesbarere technische Einführung aus dem RZ der HU-Berlin.
Planet PDF
... is an independent global resource for Adobe Acrobat pdf products, tools, information, tips, free software demos and user discussion forums.
Ghostscript
das Freeware Programmpaket zur Bearbeitung von PS und PDF Dateien
PrintToPDF
MacOS Druckertreiber (auf der Seite gibt es auch diverse Links zu vergleichbaren Windows-Programmen)
Ein Plädoyer für software-unabhängige Klartextformate
Eine eindrucksvolle Erklärung der Vorteile von offenen plaintext-Dateiformaten gegenüber proprietären (= in Firmenbesitz befindlichen) Lösungen findet Ihr in Version 7 von SelfHTML (Stefan Münz). in der aktuellen Ausgabe gestrichen.
Achtung Makroviren!
Eine Einführung zum Thema Viren in Word-DOCs. Wichtigste Neuerung, seit der Text geschrieben wurde (1996): inzwischen gibt es mehrere tausend Makroviren. (Hans-Peter Löw, HRZ Gießen)
Datenbezogene Standards und Normen im Internet
Generell eine gute Einführung in verschiedene Dateiformate bietet diese Studienarbeit der Universität Regensburg aus dem Jahr 2000 (PDF-Format).

Software:

Office 98 Updates & Downloads (MacOS)
Wer Microsoft Office benutzt, sollte mit dem update zumindest die bekannten Sicherheitslöcher schliessen.
Microsoft Word 97-98-2000 Converter (MacOS)
Wenn Ihnen jemand Word-Dokumente zukommen lässt, können Sie sie mit dem 'batch converter' ins RTF-Format umwandeln, auch wenn Sie ansonsten kein Microsoft-Produkt installiert haben.
Spezielle Probleme mit Word
Derzeit 15 Hilfetexte eines Mitarbeiters der ZeDat der FU-Berlin (Jürgen Auer)

Zum Schluss...

Wie immer freue ich mich über Anmerkungen, Ergänzungen und weitere Links.


www.subotnik.net --> misc --> doc | private Homepage | e-mail