HTML-Einführung von Hubert Partl, September 1997


Die Grundlagen


WWW - Was ist das?


Inhalt des HTML-Files

Was darf ich im WWW veröffentlichen?

Texte, Bilder oder Töne über das WWW verfügbar zu machen, bedeutet, sie weltweit zu veröffentlichen (es sei denn, der Zugriff auf die Files wird durch spezielle Vorkehrungen am WWW-Server auf bestimmte Benutzer mit Userid und Paßwort eingeschränkt). Deshalb müssen alle für Veröffentlichungen gültigen nationalen und internationalen Gesetze und Regelungen eingehalten werden - also z.B. das Urheberrecht, der Datenschutz, das Strafrecht, verschiedene Geheimhaltungspflichten, firmeninterne Regeln und vieles andere mehr.

Die meisten Institutionen, Universitäten, Firmen u.dgl. legen außerdem großen Wert darauf, daß der Inhalt aller Veröffentlichungen dem Ansehen der Institution angemessen ist und mit ihrem Public-Relations-Konzept in Einklang steht, und daß das Layout ihrer "Corporate Identity" entspricht.

Das Speichern von Informationen im World Wide Web bedeutet nicht automatisch den Verzicht des Autors auf das Urheberrecht und die Nutzungsrechte ("Copyright"). Alle kreativen Werke (Texte, Töne, Bilder und dergleichen) sind weltweit urheberrechtlich geschützt, auch wenn sie in Büchern, in Rundfunksendungen oder im World Wide Web veröffentlicht wurden.

Was soll ich im WWW veröffentlichen?

Das WWW eignet sich nicht für Informationen, die man den Adressaten "aufdrängen" will, wie z.B. dringende Hinweise oder Werbungen. Das WWW eignet sich nur für Informationen, die von den Interessenten "freiwillig" aufgesucht und abgefragt werden - also für Informationen, die nützlich und interessant sind oder die unterhalten und Freude bereiten.

Außerdem ist es wichtig, die Informationen so zu strukturieren und anzulegen, daß sie von den Interessenten auch gefunden werden.

Bitte, bedenken Sie:

Frisch geplant ist halb gewonnen!

Bevor Sie Ihre Web-Pages nach allen Regeln der Kunst erstellen, sollten Sie ein Konzept für den Inhalt, die Struktur und das Layout Ihrer Informationen erstellen. Zumindest müssen Sie die folgenden Punkte überlegen: Es ist wünschens- und empfehlenswert, beim Konzept für die Informationsstruktur und beim Layout-Design die Hilfe von professionellen Fachleuten in Anspruch zu nehmen - oder sich zumindest andere Informationssysteme zum Vorbild zu nehmen, die von solchen professionellen Designern entworfen wurden.

Es ist technisch sehr leicht, Web-Pages zu veröffentlichen, die nur geringen Informationsgehalt aufweisen, unlogisch strukturiert, verwirrend angeordnet, schlampig formuliert, schwer verständlich oder schwer auffindbar sind, sachliche oder sprachliche Fehler enthalten, unüberlegt und unprofessionell aussehen oder mit der Mehrzahl der Web-Browser gar nicht richtig gelesen werden können. Die vorliegende HTML-Einführung soll Ihnen helfen, diesbezügliche Fehler zu vermeiden und es besser zu machen, und weitere Hinweise zu Web-Design und WWW-Projekten finden Sie bei Stefan Münz.


Inhalt und Form

Wenn Sie einen Text mit einem Textverarbeitungsprogramm wie z.B. MS-Word für das Ausdrucken auf Ihrem lokalen Drucker erstellen, können Sie das Layout optimal für das verwendete Papierformat und für die auf Ihrem Drucker verfügbaren Schriftgrößen und Schriftarten einrichten.

Bei einem über das World Wide Web veröffentlichten File hingegen können Sie nicht wissen, mit was für einer Client-Software und auf was für einem Bildschirm, mit welchen Fenstergrößen und mit welchen Schriftarten und Schriftgrößen die verschiedenen Benutzer diese Information lesen werden.

Sie müssen deshalb den Inhalt ihrer Information in seiner logischen Struktur festlegen und nicht bloß in seinem sichtbaren Aussehen ("Layout").

HTML unterstützt zu diesem Zweck ein "logisches Markup", bei dem die logische Bedeutung der Text-Teile so festgelegt wird, daß sie vom jeweiligen Web-Browser in der für den Benutzer (Client) optimalen Form dargestellt werden können. Außerdem verwenden Suchhilfen die HTML-Befehle dazu, um zu entscheiden, welche Wörter bei der Stichwort-Suche berücksichtigt werden sollen - auf Grund ihrer logischen Bedeutung.

Verschiedene Web-Browser stellen die im Informationssystem gespeicherten Informationen in ganz verschiedener Art und Weise dar: Die meisten unterstützen Bilder und verschiedene Schriftarten und -größen, es sind auch Browser denkbar, die die Informationen nur zeilenweise in einer einheitlichen Schrift oder in Blindenschrift oder akustisch (als gesprochene Texte) oder in Form von dreidimensionalen Virtual-Reality-Szenen darstellen. Die Steuerung erfolgt je nach dem verwendeten Gerät mit Tastatur, Maus, Track-Ball oder Touch-Screen oder auch mit der Fernbedienung des Fernsehapparats.

Hinweise für die Verwendung Ihrer Informationen sollten Sie deshalb stets so formulieren, daß sie für alle verschiedenen Web-Browser gelten, also z.B. weder "Drücken Sie im Feld ... die Return-Taste" noch "Klicken Sie mit der Maus auf ..." sondern "Wählen Sie ... aus".

Wie funktioniert nun dieses "logische Markup"?

Sie geben in Ihrem HTML-File am WWW-Server mit den in den Text eingestreuten HTML-Befehlen ("Tags") an, daß ein bestimmter Textteil eine Überschrift, ein anderer eine Erklärung, eine Aufzählung, ein hervorgehobenes Wort und dergleichen oder ein Hyper-Link oder ein Bild ist (wie, das lernen Sie in der vorliegenden HTML-Einführung).

Diese Elemente werden dann vom Web-Browser auf dem Bildschirm eines jeden Benutzers so dargestellt, daß das Layout diese logische Bedeutung richtig wiedergibt, und zwar so, wie es der Benutzer haben möchte - in der Anordnung, die er gewöhnt ist und die er übersichtlich findet, und mit der Schriftart, Schriftgröße und Farbe, die er je nach der Auflösung seines Bildschirms und der Sehschärfe seiner Augen am besten lesen kann.

Wenn Ihr HTML-File auf Ihrem eigenen Browser mit Ihren eigenen persönlichen Einstellungen (Optionen, Präferenzen) gut aussieht, dann bedeutet das noch lange nicht, daß es auch bei anderen Lesern mit den von ihnen verwendeten Browsern und persönlichen Einstellungen gut aussieht oder überhaupt sinnvoll lesbar ist.

Wie Sie als Autor das Layout trotzdem mit HTML-Befehlen festlegen oder zumindest beeinflussen können, ist im Kapitel "Layout und Spezialeffekte" beschrieben. In Fällen, bei denen das genaue Layout wichtig ist (z.B. bei Formularen oder Diagrammen), kann es eventuell sinnvoller sein, die Information nicht als HTML-File sondern als PostScript- oder PDF- oder RTF-File oder als GIF-Bild oder Image-Map abzuspeichern.

Ein Beispiel, wie man es nicht machen sollte, finden Sie im Kapitel "Wenn die Glocken locken".


Richtige HTML

Was ist richtig?

Wenn Sie wollen, daß Ihre Information von allen Interessenten gelesen werden kann, dann müssen Sie darauf achten, daß Ihre HTML-Files von allen gängigen Web-Browsern richtig verarbeitet werden ("Norm" im Sinne von "normales Verhalten" oder "De-facto-Standard"). Ein guter Anhaltspunkt dafür sind die vom W3-Consortium zusammengestellten HTML-Spezifikationen und die von den HTML-Prüfprogrammen (Validatoren) ausgegebenen Warnungen. Die De-facto-Norm umfaßt einerseits HTML 3.2 und andererseits diejenigen Teile von HTML 4.0 und CSS1, die schon jetzt von den meisten Browsern unterstützt werden.

Viele, aber nicht alle Web-Browser tolerieren viele, aber nicht alle Abweichungen von den strikten HTML-Sprachregeln. Wenn Ihr HTML-File also von Ihrem eigenen Browser richtig verstanden wird, dann bedeutet das noch nicht, daß es sich tatsächlich um syntaktisch richtige HTML handelt und daß es auch von anderen Lesern mit den von ihnen verwendeten Browsern gelesen werden kann.

Um sicherzustellen, daß Ihre HTML-Files tatsächlich brauchbar sind, müssen Sie deswegen HTML-Prüfprogramme (Validatoren) verwenden, die eigens für diesen Zweck eingerichtet wurden (siehe die Referenzen).

Weltweite Zusammenarbeit oder Firmenabhängigkeit

Das World Wide Web baut, wie schon der Name sagt, auf der Idee einer weltweiten Zusammenarbeit auf: Alle Benutzer mit allen Clients sollen auf alle Informationen und Services auf allen Servern zugreifen können.

Dies kann selbstverständlich nur dann funktionieren, wenn alle Beteiligten die offiziellen oder inoffiziellen Normen für die Datenübertragung und die Datenformate genau einhalten: TCP/IP, HTTP, HTML, CSS1, Java ...

Manche kommerzielle Firmen wie z.B. Netscape oder Microsoft bemühen sich, WWW-Software zu vertreiben, die zusätzliche Features aufweist, die über die vom W3-Consortium zusammengestellten HTML-Spezifikationen hinausgehen oder ihnen, noch schlimmer, sogar widersprechen. Damit werden alle Benutzer, die diese "Extras" ausnützen wollen, gezwungen, die Software dieser Firma zu kaufen.

Die Einengung auf ein bestimmtes Produkt oder eine Firma ist in diesem innovativen Bereich besonders ungünstig, wie die jüngsten Erfahrungen lehren:

1993 wurde für Informationssysteme hauptsächlich Gopher verwendet.

1994 wurde Gopher von Mosaic fast vollständig verdrängt.

1995 wurde Mosaic von Netscape fast vollständig verdrängt, und daneben brachten auch viele andere Firmen (einschließlich der Giganten IBM und Microsoft) ihre eigenen, teilweise inkompatiblen Web-Browser heraus.

1996 und 1997 warfen die Konkurrenten Netscape und Microsoft alle paar Monate neue Versionen ihrer Web-Browser auf den Markt, die immer ausgefeiltere Layout-Spezialitäten vor allem in Hinblick auf hochauflösende PC-Bildschirme unterstützten (Farben, Tabellen, Frames, Style-Sheets). Gleichzeitig wurde mit WebTV eine Möglichkeit geschaffen, Web-Pages auf Fernseh-Bildschirmen zu betrachten, die eine wesentlich geringere Auflösung als PC-Bildschirme aufweisen.

Wenn Ihre HTML-Files auch noch nächstes Jahr brauchbar sein sollen und wenn Sie nicht einen großen Teil der Interessenten vom Zugriff auf Ihre Informationen ausschließen wollen, dann müssen Sie als Autor auf solche firmenspezifische "Extrawürste" verzichten und möglichst nur die HTML-Befehle einsetzen, die auf allen Browsern ein richtig lesbares Ergebnis bewirken (De-facto-Norm).

Beispiele für "Extrawürste", die nicht (oder noch nicht) von allen gängigen Web-Browsern richtig verarbeitet werden, sind <animate>, <applet>, <blink>, <bgsound>, <center>, <embed>, <font>, <frame>, <frameset>, <layer>, <marquee>, <object>, <script>, <spacer>, <style>, u.a.

Wenn Sie solche neue oder nicht genormte oder nicht von allen Web-Browsern unterstützte Elemente verwenden, dann achten Sie bitte darauf, daß Ihre Informationen trotzdem von allen Web-Browsern wenigstens einigermaßen brauchbar dargestellt werden können, z.B. indem Sie "Alternativen" wie ALT= oder NOFRAMES und dergleichen einfügen. Hinweise für solche hilfreiche Tricks finden Sie in den Kapiteln über Tabellen, Zentrierung, Farbe, Bilder, Frames, Image-Maps und bei allen Layout- und Spezialeffekten. Im Zweifelsfall halten Sie sich lieber an die alte Grundregel der Informationsverarbeitung:

Sei möglichst konservativ beim Schreiben
und möglichst liberal beim Lesen!


Format der Markup-Befehle (HTML-Tags)

Die Sprache HTML baut auf der Syntax von SGML auf. Die Markup-Befehle ("Tags") werden vom normalen Text dadurch unterschieden, daß sie zwischen "spitzen Klammern", also zwischen Kleiner- und Größer-Zeichen eingeschlossen werden, in der Form
<xxx>

Manche dieser Befehle (Tags) haben auch Parameter (Attribute und Argumente), z.B. in einer Form wie
<xxx yyy=zzz>

Bei den Befehlen xxx und den Attributen yyy ist die Groß- oder Klein-Schreibung egal, bei den Argumenten zzz trifft dies nicht immer zu. Wenn die Argumente Sonderzeichen enthalten, müssen sie in Anführungszeichen (Quotes) eingeschlossen werden:
<xxx yyy="zzz">

Einfache oder mehrfache Leerstellen oder Zeilenwechsel haben (von Spezialfällen abgesehen) dieselbe Bedeutung, d.h. sie wirken jeweils so wie eine Leerstelle.

Die meisten HTML-Befehle treten paarweise auf, mit einem "Start-Tag" der Form <xxx> und einem "End-Tag" der Form </xxx>. Diese Befehlspaare geben jeweils die Bedeutung des dazwischen liegenden Textes an. So ist z.B. der zwischen <h1> und </h1> stehende Text eine Überschrift.

Manche HTML-Befehle treten einzeln auf, also ohne einen End-Tag. Sie bezeichnen bestimmte Elemente, die zwischen dem Text stehen. So bedeutet z.B. <hr> eine Linie zwischen zwei Absätzen.

Die paarweisen HTML-Befehle müssen immer richtig geschachtelt werden. Dies soll an dem folgenden Beispiel durch das Einrücken der Eingabe-Zeilen veranschaulicht werden. (Was die einzelnen Befehle bedeuten, wird nicht hier sondern in den jeweiligen Kapiteln der HTML-Einführung beschrieben.)


<HTML>

     <HEAD>

          <TITLE>  Der Titel des HTML-Files

          </TITLE>

     </HEAD>

     <BODY>

          <H1> Die Überschrift

          </H1>

          <P>  Der erste Absatz.

          </P>

          <P>  Ein

               <EM>  betontes

               </EM>

               Wort im zweiten Absatz.

               Nach diesem Absatz kommt eine Linie: 

          </P>

          <HR>

          <P>  Das ist der letzte Absatz.

          </P>

     </BODY>

</HTML>

Nicht erlaubt wäre also z.B. eine Konstruktion wie


<P>xxxxxx <EM>xxxx</P>

<P>xxxx</EM> xxxxxx</P>

Stattdessen müßte man es so schreiben:

<P>xxxxxx <EM>xxxx</EM></P>

<P><EM>xxxx</EM> xxxxxx</P>

In einigen Fällen darf der End-Tag weggelassen werden, so ist z.B. die explizite Angabe von </p> in den obigen Beispielen nicht unbedingt notwendig.

Kommentare können in der Form
<!-- Kommentartext -->
eingefügt werden. Damit der Kommentartext tatsächlich von allen Browser-Versionen ignoriert wird, sollte er weder -- noch > enthalten.


Aufbau eines HTML-Files <html> <head> <body>

Jedes HTML-File soll zumindest mit den folgenden Befehlen beginnen:

<html>

<head>

<title>Haupt-Ueberschrift</title>

<link rev=made href="mailto:username@hostname.domainname">

</head>

<body>

<h1>Haupt-&Uuml;berschrift</h1>

und mit den folgenden Befehlen enden:

</body>

</html>

Das gesamte HTML-File wird zwischen <html> und </html> eingeschlossen.

Zwischen <head> und </head> stehen die Angaben, die für die Verwaltung des HTML-Files notwendig sind (Titel, Autor und dergleichen).

Zwischen <body> und </body> steht die Information, die am Bildschirm des Benutzers dargestellt werden soll, also die Textelemente, Hypertext-Links, Bilder und Töne.

Zwischen <title> und </title> steht die Überschrift des HTML-Files, die in Bookmarks und Suchhilfen verwendet wird.

Zwischen <h1> und </h1> steht die Überschrift, die am Bildschirm zu Beginn des Textes erscheint.

Da sie nicht wissen können, über welche Hypertext-Links, Bookmarks oder Suchhilfen die Leser auf Ihre Information zugreifen werden, sollten Sie Titel, Überschriften und Inhalt Ihrer Files immer möglichst vollständig und auch ohne Kontext verständlich formulieren, also z.B. nicht bloß "Einleitung" sondern "Einleitung zur HTML-Einführung", und nicht bloß "Statistik-Abteilung" sondern "Abteilung für Statistik des Instituts für Mathematik an der Universität für Bodenkultur in Wien".

Zwischen <title> und </title> sollen (im Gegensatz zu <h1>) nur normale ASCII-Buchstaben stehen, keine Entities (deutsche Umlaute etc.) und keine HTML-Befehle.

Den Autor und andere Angaben, die sich auf die Web-Page beziehen, kann man innerhalb des <head> mit <link>, <meta> und <style> angeben.

Unabhängig davon ist es empfehlenswert, am Ende des lesbaren Textes im <body> den Namen und die Mail-Adresse des Autors, das Datum der Erstellung oder der letzten Aktualisierung, und ein Hypertext-Link auf die Startseite der Institution anzugeben.

Als erste Zeile des Files (vor dem Befehl <html>) kann man die HTML-Version mit einem SGML-Befehl wie z.B.
<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN">
oder
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2//EN">
angeben. Wenn diese Angabe fehlt, wird HTML 2.0 angenommen.


Organisation der HTML-Files

Aufteilung der Information auf einzelne HTML-Files

Bei der Aufteilung der Information auf eines oder mehrere HTML-Files müssen Sie einen Kompromiß zwischen den folgenden Vor- und Nachteilen wählen.

Für mehrere kleine Files und gegen wenige allzu große Files sprechen die folgenden Punkte:

Für wenige größere Files und gegen allzu viele kleine Files sprechen die folgenden Punkte: Wann ein File als "klein" oder "groß" gilt, hängt von der Anwendung und vom Stand der Technik ab. Zur Orientierung: Ein File von 50 kBytes braucht für die Übertragung über eine Modem-Leitung mit 14.400 bit/s ungefähr eine Minute. Viele Benutzer werden bei Wartezeiten von mehr als 6 Sekunden ungeduldig...

Filenamen und Directories

Manche Web-Browser verarbeiten HTML-Files nur dann richtig, wenn die Extension des Filenamens ".html" lautet. HTML-Files sollten daher immer unter Filenamen der Form "xxxxx.html" oder "xxxxx.htm" abgespeichert werden.

Unter Betriebssystemen, die wie MS-DOS nur 3 Zeichen lange Extensions erlauben, künnen die Files nur unter Filenamen der Form "xxxxx.htm" abgespeichert werden. In manchen Fällen kann man dann trotzdem in den URLs (Hypertext-Links, Bookmarks und Suchhilfen) die Filenamen als "xxxxx.html" mit der kompletten Extension angeben, die Extension wird dann vom Betriebssystem automatisch richtig gekürzt; in vielen Fällen funktioniert das aber nicht.

Es wird empfohlen, zusammengehörende HTML-Files jeweils in einem Directory gemeinsam abzuspeichern und in Querverweisen zwischen ihnen nur relative URLs zu verwenden, damit die Files auch nach einer eventuellen Übertragung auf einen anderen WWW-Server oder in einen anderen Bereich verwendet werden können.


Wie kann ich meine HTML-Files erstellen?

Bevor Sie Ihre HTML-Files erstellen und veröffentlichen, müssen Sie sich ein Konzept für den Inhalt, die Struktur und das Layout ihrer Informationen überlegen.

Methoden und Software zum Erstellen von HTML-Files

Für das Erstellen von HTML-Files gibt es grundsätzlich zwei Wege:

In allen Fällen empfiehlt es sich, nicht für jede Web-Page "das Rad neu zu erfinden", sondern Muster-HTML-Files zu verwenden, die alle HTML-Befehle für den Aufbau und die Struktur der Web-Page, mit Überschrift und Fußzeile, Firmen-Logo, Link zur Home-Page, Mail-Adresse des Autors und dergleichen enthalten und dann nur mehr mit den jeweiligen Daten "gefüttert" werden müssen.

Außerdem kann man durch den Einsatz von Style-Sheets eine möglichst einheitliche und der Corporate Identity entsprechende Darstellung der Web-Pages erreichen.

Integrierte Systeme und Umwandlungsprogramme

Neuere Softwarepakete wie z.B. MS-Office97, Lotus Smartsuite, Lotus Domino, Oracle Web-Server u.a. haben Möglichkeiten für die Umwandlung von Texten, Spreadsheets und Datenbanken in HTML-Files bereits integriert.

Bei etwas älteren Versionen von Software-Produkten wie z.B. Word oder Excel können solche Umwandlungsprogramme nachträglich installiert werden, z.B. der Word Internet Assistant.

Ähnliche Umwandlungsprogramme gibt es auch für andere Software-Produkte wie z.B. Excel und für ander File-Formate wie z.B. RTF (Rich Text Format) oder LaTeX.

Vorgangsweise:

Wenn die Umwandlungs-Software alle benötigten HTML-Elemente richtig wiedergibt, läuft das Erstellen der Web-Pages typisch so ab (am Beispiel der Textverarbeitung mit MS-Word):

  1. Ein Muster-HTML-File mit dem Filetyp "HTML" in Word öffnen (mit automatischer Umwandlung ins Word-Format),
  2. den Inhalt mit den gewohnten Word-Befehlen an den richtigen Stellen eintippen oder ein bereits fertiges Word-Dokument einfügen,
  3. das Ergebnis als Word-Dokument xxxx.doc speichern (für künftige Weiterbearbeitung),
  4. das Dokument als HTML-File xxxx.htm mit dem Datei-Ttyp "HTML" speichern. Dabei werden alle wichtigen Textelemente wie Absätze, Überschriften, Listen usw. und die deutschen Umlaute und scharfen s automatisch in die entsprechenden HTML-Befehle umgewandelt.
Damit die automatische Umwandlung richtig funktonieren kann, müssen allerdings gewisse Grundregeln der Textverarbeitung eingehalten werden (siehe Hinweise für Word).

Außerdem muß das HTML-File fast immer noch kontrolliert und eventuell nachbearbeitet werden, um sicherzustellen, daß es sich um ein wirklich brauchbares HTML-File handelt und daß bei der automatischen Umwandlung nicht wichtige Eigenschaften verloren gegangen sind.

Eventuell kann man diese Nachbearbeitung auch mit einem Batch-Script unterstützen, das im HTML-File gewisse Korrekturen automatisch durchführt. Damit kann man

Wenn die Umwandlungs-Software nicht alle benötigten HTML-Elemente richtig wiedergibt, was leider oft der Fall ist, dann empfiehlt sich eher die folgende Vorgangsweise:

Hinweise zur Verwendung von MS-Word

Diese Hinweise gelten konkret für MS-Word. Analoge Regeln gelten für die Verwendung anderer Textverarbeitungs-Programme wie WordPerfect, AmiPro usw.

Wenn Sie einen Text mit MS-Word für das Ausdrucken auf Ihrem lokalen Drucker erstellen, können Sie das Layout optimal für das verwendete Papierformat und für die auf Ihrem Drucker verfügbaren Schriftgrößen und Schriftarten einrichten.

Bei einem am Web-Server für das Internet gespeicherten File hingegen können Sie nicht wissen, mit was für einer Software und auf was für einem Bildschirm und mit welchen Fenstergrößen und Schriftarten und Schriftgrößen die verschiedenen Benutzer in aller Welt diese Information lesen werden. Sie müssen daher das Layout in seiner logischen Struktur und nicht bloß in seinem sichtbaren Aussehen definieren.

Die automatischen oder halbautomatischen Umwandlungs-Programme wie Word Internet Assistant, Office 97 etc. funktionieren nur dann richtig, wenn Sie die Grundregel einhalten, immer den jeweils logisch richtigen Befehl zu verwenden:

Damit die Umwandlung von Word nach HTML erfolgreich funktionieren kann, sollen Sie im Word-Dokument möglichst nur die Elemente verwenden, für die es eine Entsprechung in HTML gibt:

In Fällen, bei denen das genaue Layout wichtig ist (z.B. bei Formularen), kann es sinnvoll sein, am Web-Server das RTF-File oder PostScript-File abzuspeichern, statt ein HTML-File zu erzeugen.

Direktes Editieren oder Nachbearbeitung von HTML-Files

HTML-Files sind Text-Files, die den Text mit eingestreuten HTML-Befehlen enthalten. Diese Files können einfach mit einem normalen Editor wie z.B.Notepad oder als "Text-Files" mit Textverarbeitungsprogrammen wie z.B. Word erstellt werden.

Dies wird wesentlich vereinfacht, wenn Sie von Muster-Files ausgehen, die bereits die HTML-Befehle für Aufbau, Struktur und Layout der Web-Page enthalten, und dann nur mehr den Inhalt zwischen die HTML-Befehle "einfüllen" müssen.

Es gibt auch HTML-Editoren, mit denen man Web-Pages durch Anklicken der Formatierungselemente in Pull-Down-Menüs direkt am Bildschirm erstellen kann.

Im Fall von Textverarbeitungsprogrammen wie Word müssen Sie darauf achten, daß das File mit dem Dateityp "nur Text" oder "HTML" gespeichert wird und nicht als binäres Word-File (DOC-File). Zu diesem Zweck müssen Sie je nachdem, welche Version von Word Sie verwenden und ob eine automatische HTML-Umwandlung installiert ist oder nicht,

Das analoge gilt für andere Textverarbeitungs-Software.

HTML-Editoren

Mit HTML-Editoren kann man Web-Pages durch Anklicken der Formatierungselemente in Pull-Down-Menüs direkt am Bildschirm schreiben - analog zum Erstellen von Texten mit Word oder von Graphiken mit Corel Draw. Meist ist auch eine Möglichkeit eingebaut, das Aussehen der Web-Page zumindest mit einem lokalen Web-Browser zu kontrollieren ("Preview"), was aber natürlich noch nicht viel über das Aussehen bei anderen Leuten auf deren Bildschirmen und mit deren Software aussagt.

Damit kann man etwas bequemer als beim direkten Editieren und ohne allzu genaue Kenntnisse der HTML-Befehle Web-Pages erstellen. Allerdings ist fast immer noch eine Kontrolle oder Nachbearbeitung der HTML-Files notwendig.

Die meisten HTML-Editoren sind lizenz- und kostenpflichtig, aber meist nicht allzu teuer. Beispiele sind Homesite, Hot Dog, Microsoft Frontpage, HTMLed32 und viele andere (siehe auch Referenzen).

Nicht empfehlenswert sind Editoren die, wie z.B. "Netscape Gold" und "Netscape Composer", aus firmenpolitischen Gründen keine allgemein verwendbaren HTML-Files erzeugen, sondern spezielle Tricks in die HTML-Files einbauen, damit sie nur mit den neuesten firmeneigenen Web-Browsern gelesen werden können und nicht von Lesern, die ältere Versionen oder Software von anderen Herstellern verwenden, oder von Suchmaschinen.

In solchen und ähnlichen Fällen kann es hilfreich sein, mit einem Batch-Script nachträglich alle solchen Tricks automatisch aus dem HTML-File zu entfernen und durch "normale" (richtige) HTML-Befehle zu ersetzen.

Hinweise zum Testen und Validieren der HTML-Files finden Sie im folgenden Abschnitt.


Wie kann ich meine HTML-Files im WWW veröffentlichen?

Für die Veröffentlichung von Informationen über das WWW sind die folgenden Voraussetzungen und die folgenden Schritte notwendig:
  1. Sie müssen ein Konzept für den Inhalt und die Struktur Ihrer Informationen erarbeiten (oder erarbeiten lassen).
  2. Sie brauchen eine Benutzungsbewilligung und ausreichend Speicherplatz auf einem Web-Server.
  3. Sie müssen die HTML-Files und eventuell darin aufgerufene Bilder und Töne, Style-Sheets, Programme oder Applets erstellen, korrekturlesen, testen und validieren.
  4. Sie müssen die HTML-Files und eventuell darin aufgerufene Bilder und Töne, Style-Sheets, Programme oder Applets auf einem WWW-Server abspeichern.
  5. Sie müssen die Verfügbarkeit der HTML-Files bekanntmachen.
Sobald das File öffentlich zugänglich ist, sind Sie dafür verantwortlich, es laufend zu aktualisieren und, wenn es nicht mehr relevant ist, zu löschen.

Testen und Validieren der HTML-Files

Wenn Ihr HTML-File auf Ihrem eigenen Web-Browser mit Ihren eigenen persönlichen Einstellungen (Optionen, Präferenzen) gut aussieht, dann bedeutet das noch lange nicht, daß es auch bei anderen Lesern mit den von ihnen verwendeten Browsern und persönlichen Einstellungen gut aussieht oder überhaupt sinnvoll lesbar ist.

Viele, aber nicht alle Web-Browser tolerieren viele, aber nicht alle Abweichungen von den HTML-Sprachregeln. Wenn Ihr HTML-File also von Ihrem eigenen Browser richtig verstanden wird, dann bedeutet das noch nicht, daß es sich tatsächlich um richtige HTML handelt und daß es auch von anderen Lesern mit den von ihnen verwendeten Browsern gelesen werden kann.

Bevor Sie Ihre Web-Page für alle Welt zugänglich machen, sollen Sie Ihr Werk deshalb mit mindestens zwei verschiedenen Web-Browsern als "lokales File" testen: einem im Line-Mode (z.B. Lynx) und einem im Graphik-Mode (z.B. Internet-Explorer oder Netscape), oder zumindest mit verschiedenen persönlichen Einstellungen (z.B. mit und ohne Bilder) und verschiedenen Fenstergrößen und Hintergrundfarben.

Außerdem sollten Sie sich nicht auf die Fehlertoleranz der eigenen Web-Browser verlassen, sondern HTML-Prüfprogramme ("Validatoren") verwenden, die sowohl die HTML-Sprachregeln als auch die Eigenheiten von allen Web-Browsern berücksichtigen und damit die Brauchbarkeit Ihrer HTML-Files wirklich sicherstellen - so ähnlich wie Spell-Checker-Programme (Rechtschreibprüfung) in der Textverarbeitung.

Solche Programme können am eigenen PC installiert werden, wesentlich einfacher und bequemer ist es aber, die öffentlichen HTML-Validatoren zu verwenden, denen man nur den URL des HTML-Files angibt und die einem dann sofort alle in diesem File enthaltenen Fehler oder ungünstigen Konstruktionen anzeigen (siehe die Referenzen).

Abspeichern der HTML-Files

Sie selbst können Ihr HTML-File als "lokales File" mit Ihrem Web-Browser lesen. Damit auch andere Personen darauf zugreifen können, müssen Sie es aber auf einem an das Internet angeschlossenen WWW-Server speichern.

Dieser Server-Computer muß ständig (24 Stunden täglich) mit dem Internet verbunden sein. Günstig ist ein Rechner mit einem Multi-Tasking-Betriebssystem wie Unix, schnellen Platten und einem leistungsfähigen Internet-Anschluß. Als Server-Software kommen mehrere kostenlose sowie kostenpflichtige Software-Produkte in Frage (siehe die Referenzen).

Wenn Sie keinen solchen Rechner besitzen (z.B. nur einen PC oder nur eine Telefon-Verbindung zum Internet) oder keine solche Software betreiben wollen, müssen Sie einen Bereich auf einem WWW-Server "ausborgen" oder mieten. In vielen Universitäten und größeren Firmen bietet das EDV-Zentrum allen Mitarbeitern eine Möglichkeit dafür, und kommerzielle Internet-Provider stellen privaten Kunden und Firmen WWW-Server-Bereiche gegen Bezahlung zur Verfügung.

HTML-Files müssen immer unter den richtigen Filenamen abgespeichert werden.

Bevor Sie Ihre HTML-Seite für alle Welt zugänglich machen, müssen Sie Ihr Werk korrekturlesen und testen.

Die Vorgangsweise beim Speichern eines HTML-Files auf einem WWW-Server sollte so ähnlich wie im folgenden Beispiel ablaufen:

  1. Das HTML-File am PC erstellen.
  2. Das File am PC mit einem Graphik-Browser wie z.B. Internet-Explorer oder Netscape testen.
  3. Das HTML-File mit FTP auf Ihren privaten Plattenbereich auf dem Unix-Rechner übertragen, auf dem das WWW-Server-Programm läuft.
  4. Das File unter Unix mit einem Text-Browser wie z.B. Lynx testen.
  5. Fehler im HTML-File korrigieren und den Zyklus wiederholen.
    Wenn das File okay ist:
  6. Das HTML-File in den öffentlichen Plattenbereich des WWW-Servers kopieren und mit weltweiter Leseberechtigung versehen.
  7. Das öffentliche File testen und validieren.

Nachdem Sie das File im WWW veröffentlicht haben, sind Sie dafür verantwortlich, den Inhalt laufend zu aktualisieren - oder das File, wenn es nicht mehr relevant ist, zu löschen.

Bekanntmachen der HTML-Files

Die schönste WWW-Information nützt nichts, wenn niemand erfährt, daß und wo es sie gibt. Nachdem Sie Ihre WWW-Informationen erfolgreich verfügbar gemacht haben, sollten Sie ihre Existenz und ihren URL in geeigneter Weise bekanntmachen.

Im einfachsten Fall lassen Sie ein Hypertext-Link auf Ihre WWW-Informationen vom "Webmaster" im EDV-Zentrum Ihrer Institution bzw. Ihres Internet-Providers in dessen WWW-Informationssystem einbauen. Viele Universitäten haben zum Beispiel auf ihrem WWW-Server so etwas wie eine Liste aller Informationen innerhalb der Universität.

Die Universitäten und Firmen selbst lassen Ihren WWW-Server am besten in einer Liste aller Informationssysteme ihres Landes eintragen, und diese Landeslisten sind ihrerseits in weltweiten Listen und Suchhilfen auffindbar (siehe die Referenzen).

Zusätzlich kann es sinnvoll sein, WWW-Informationen über bestimmte Themen in fachspezifischen Listen und in Suchhilfen einzutragen. Hinweise, wie man solche Eintragungen vornimmt und welche Informationen man dabei angeben muß, findet man meistens in den betreffenden WWW-Listen und Suchhilfen selbst.

Sehr interessante WWW-Informationen kann man außerdem in einschlägigen Mailing-Listen oder Usenet-Newsgruppen bekanntgeben - in weltweiten oder regionalen, allgemeinen oder fachspezifischen - aber nur, wenn die Information für die Mitglieder dieser Gruppen auch wirklich interessant und wichtig ist.

Eine einfache, aber durchaus wirksame Methode ist es, in der "E-Mail-Signature" nicht nur die eigene Mail-Adresse sondern auch den URL der eigenen WWW-Information anzugeben und damit eine nicht als lästig empfundene, aber bei allen fachlichen Kontakten sichtbare "Reklame" für diesen URL zu machen.

Natürlich sollte man in allen diesen Fällen nicht nur den URL sondern auch ein, zwei Stichwörter über den Inhalt der damit erreichbaren Informationen angeben. Dabei sind sachliche Hinweise wie z.B. "Spielpläne für Opernfreunde in Europa" erfolgreicher als ein nichtssagendes "Viele interessante Informationen" oder ein marktschreierisches "Lauter laute Links".

Aktualisieren der Informationen

Bitte, bedenken Sie:

Falsche oder nicht mehr aktuelle Informationen sind schlechter als gar keine Information.
Sie als Autor sind dafür verantwortlich, alle von Ihnen im WWW angelegten und damit weltweit veröffentlichten HTML-Files laufend aktuell zu halten und bei Bedarf zu korrigieren - oder das File, wenn es nicht mehr relevant ist oder Sie es nicht mehr weiter aktualisieren möchten, zu löschen.

Es kann hilfreich sein, die Leser um Mithilfe zu bitten, etwa wie im folgenden Beispiel:

Verantwortlich für den Inhalt dieser Web-Page ist Dr. Hubert Partl im zentralen Informatikdienst der BOKU Wien. Bitte, senden Sie Fragen, Hinweise (z.B. auf nicht mehr aktuelle Informationen, fehlende Informationen oder ungünstige WWW-Links) und Verbesserungsvorschläge (Korrekturen, Ergänzungen, Hinzunahme von interessanten Links) per E-Mail an partl@mail.boku.ac.at

Löschen von HTML-Files

Wenn ein im WWW veröffentlichtes File nicht mehr gültig ist oder nicht mehr aktualisiert wird, muß es am WWW-Server gelöscht werden.

Das Löschen selbst kann einfach mit dem entsprechenden Systembefehl erfolgen (unter Unix z.B. mit rm). Vorher müssen aber alle Hypertext-Links, die noch auf dieses File verweisen, gelöscht bzw. korrigiert werden.

Da Sie nicht wissen können, wo überall im World Wide Web andere Leute Links auf Ihr altes File in deren HTML-Files oder in Bookmarks oder in Suchhilfen angelegt haben, ist es empfehlenswert, das File nicht sofort zu löschen sondern während einer längeren Übergangszeit durch ein kleines HTML-File zu ersetzen, das angibt, warum die Information nicht mehr gültig ist, und ein Hypertext-Link auf die neue, bessere Information enthält, die das alte HTML-File ersetzt. Eventuell läßt sich das auch mit einem "Redirect" in der Konfiguration des Web-Servers, wo das alte HTML-File früher gespeichert war, lösen.


Vorwort . Wegweiser . Inhaltsverzeichnis . Wörterbuch . Referenzen . Copyright
© Hubert Partl, BOKU Wien