Textverarbeitung

Eine Hauptaufgabe von Rechnern in einer Büroumgebung ist die Erstellung und Bearbeitung von Textdokumenten. Dazu zählen Briefe, Rechnungen, Webseiten, Veröffentlichungen, Diplomarbeiten und Bücher.

Auf dem Markt haben sich Systeme durchgesetzt, welche ein ästhetisch ansprechendes Ergebnis versprechen. Gefordert wird dabei, daß auf dem Bildschirm zu jedem Zeitpunkt ein Abbild des Dokumentes, so wie es nach dem Drucken vorliegt, zu sehen ist. Bei der Umsetzung dieser Forderung kann es vor allem mit der Auflösung Probleme geben, der Anzahl der Bildpunkte pro Flächeneinheit.

In den meisten Fällen haben Drucker eine wesentlich höhere Auflösung als Bildschirme. Preiswerte Tintenstrahldrucker erreichen derzeit bereits 1200x1200 dpi (engl. dots per inch), während ein 17"-Monitor mit einer Darstellung von 1280x1024 Pixeln eine Auflösung von 100x100dpi hat.

Zeichen und Schriftarten

Wesentlich mitbestimmend für den ästhetischen Gesamteindruck eines Textdokumentes ist die verwendete Schriftart.

Eine Schriftart (font) ist ein gemeinsames Design für alle Buchstaben des Alphabets. Es wird zwischen fonts fester Zeichenbreite (z.B. Courier) und Proportionalschriften (z.B. Times Roman, Garamond), bei denen die Breite der einzelnen Buchstaben, beispielsweise 't' und 'm', verschieden sind, unterschieden. Ein weiteres Merkmal sind die Serifen, kleine Verbreiterungen am Ende der Striche, aus denen der Buchstabe besteht. Schriftarten, die keine Seife verwenden tragen das Attribut 'sans serif" oder auch nur "sans".

Für die meisten Schriften kann aus verschiedenen Schrifttypen z.B. kursiv (engl. italic) fett (engl. bold) gewählt werden, auch verschiedene Schriftgrade, die in typographischen Punkten pt angegeben werden.

Die einzelnen Zeichen werden an einer Grundlinie angeordnet, können aber auch als Superscript oder Subscript oder unterstrichen verwendet werden. Die wichtigsten Attribute der Zeichen sind somit:

Formatierung

Ein größeres Textdokument kann über Absätze formatiert werden. Ein absatz ist eine Gruppe von Sätzen, in denen ein Gedanke entwickelt wird. Absatzmerkmale sind: Die Zeilen innerhalb eines Absatzes können mit Flattersatz, Blocksatz oder zentriert umgebrochen werden. Die Darstellung der einzelnen Seiten ist ein weiteres Formatierungsmerkmal. Die Seitenformatierung legt das Layout fest. Layouteigenschaften sind: Professionelle Textverarbeitungssysteme sind weiterhin in der Lage, automatisch Inhaltsverzeichnisse und Stichwortverzeichnisse zu erstellen sowie Querverweise einzubauen.

Traditionelles Textsetzen

Traditionell wurden Manuskripte von Schriftsetzern gesetzt. Metallene Buchstaben auf Holzklötzchen wurden in einem Druckstock zum Negativ einer Seite zusammengesetzt. Der Abstand zwischen Wörtern wurde mit Keilen ausgeglichen. Dabei müssen korrekte Schrifttypen und Abstände bei Kapiteln, Überschriften, Seitenumbrüchen etc. beachtet werden. Zum äesthetischen Aufbau einer Seite gehören unter anderem die Vermeidung von Flüssen (vertikales Zusammentreffen vonWortzwischenräumen), Seitenumbrüche nach der ersten Zeile und Seitenumbrüche vor der letzten Zeile eines Absatzes.

Textbeschreibungssprachen

Was sind Textbeschreibungssprachen und wofür sind sie gut? Dazu zunächst ein Beispiel:
ÐÏ.ࡱ.á^Ÿ"®ÇÏ/ÂÀ` .p°x[‹PYÿ‚.û¶Âq∓Àë¢ÞyZÕxu.
pæ¤ü(.§j+ïû/ÑBibäxàØà®£úèNQê>â`.p.N..Zº
9â∓6ÏH¯âö‰FÝs2ó”.‡1Tæú.,d“ ³‚›ÈH“vÄp°=á 
£!Ö´.¸ja¿¨/aié;;³µ G"ßL)fÀ"l. £¿¸u—­ÜÈHÝ_¡bd‚Ìl
ŒC*¬? 
Es handelt sich um einen kurzen Auszug aus einer Microsoft-Worddatei. Hier wird schnell deutlich, daß diese Form der Informationsspeicherung ohne genaue Kenntnis des Dateiformates absolut unbrauchbar ist. Formatierungs- und eigentliche Textinformation werden scheinbar zusammenhangslos vermischt. Sehen wir uns ein anderes Beispiel an:
\documentstyle[a4,12pt]{article}
\newtheorem{theorem}{Satz}
\begin{document}
\title{Der Satz von Gau\ss.}
\date{}
\maketitle  

\begin{abstract} 
Mit vollst\"andiger Induktion zeigen wir 
die Gau\ss sche Formel f\"ur die Summe 
aller Zahlen von $0$ nis $n$. 
\end{abstract}

\section{Der Satz}
Die Gau\ss sche Formel sollte jeder kennen, 
auch in der Informatik kommt sie immer wieder vor.
\begin{theorem} Sei $n \in \mathbf{N} $, 
dann gilt f\"ur die Summe aller Zahlen
von $o$ bis $n$ :
 \[sum_{i=0}^{n}{i}=\frac{n(n+1)}{2}.\]
\end{theorem}
\noindent\underline{Beweis}:F\"ur 
den Induktionsanfang 
$n=$0 setzen wir ein und erhalten
$\sum_{i=0}^{0}{i}=0={0(0+1)\{2}$. 
Als Induktionshypothese
nehmen wir an, da\ss die Formel f\"uer$n=0 
\ldots k$ schon gilt und zeigen
f\"ur $n=k+1$:
\begin{eqnarray} \sum_{i=0}^{k+1}{i} 
∓=∓ \sum_{i=0}^{k}{i}+(k+1) \\
∓=∓ \frac{k[k+1)}{2}+(k+1) \\
∓=∓ \frac{(k+2)(k+1)}{2} \\
∓=∓ \frac{n(n+1]}{2}\.
\end{eqnarray}
\end{document}  

Das obige Beispiel ist ein Auszug aus einer LaTeX Quelltextdatei. LaTeX ist eine Textbeschreibungssprache. Der Text wird logisch beschrieben. Einzelne Teiltexte werden entsprechend ihrer Rolle und Funktion im Text markiert.

Textteile sind zum Beispiel Kapitelüberschrift, Abschnittsüberschrift, Zitat, Formel etc. Die Formatierung wird vom Textverarbeitungssystem übernommen. Die Parameter, die diese Übersetzung bestimmen, werden in einer seperaten Datei (style file, style sheet) festgelegt.

Professionelle Textdokumente können so mit wenig Ressourcen, nicht einmal ein Graphikbildschirm ist nötig, erstellt werden. Veröffentlichungen in Mathematik, theoretischer Informatik, Physik und Chemie werden seit Jahren in LaTeX geschrieben.

Befehle beginnen mit einem backslash '\', Parameter werden in Klammern "{}" gesetzt. Für besondere Textbereiche können gesonderte Stile definiert werden, diese werden mit \begin{bereichsname} und \end{bereichsname} markiert. Aus der Quelldatei produziert LaTeX eine "dvi" Datei (device independent), in welcher die formatierte Ausgabe beschrieben ist. Diese kann dann z.B. in postscript oder pdf umgewandelt werden.

Mit Auszeichnungssprachen (engl. markup language) werden Dokumente logisch beschrieben. Die Dokumente können ohne Änderung auf verschiedenen Medien mit verschiedenen Seitengrößen ein- und mehrspaltig ausgegeben werden.

Eine ästhetische Formatierung wird automatisch aus Beschreibung und Dimension des Ausgabemediums erstellt. Dies bietet sich zum Beispiel im Internet an, wo jeder Betrachter einen anderen Bildschirm hat. So steht HTML für Hypertext Markup Language.

Diskussion

Vorteile Nachteile
Zur Hauptseite