Die Hypertext Markup Language (HTML) ist mittlerweile seit über 20 Jahren standardisiert und ist auch nach dieser langen Zeit die Basis für unsere Webanwendungen. Auch wenn die Dokumente durch moderne Frameworks automatisch erzeugt werden, so ist es als Entwickler wichtig, die Grundlagen zu kennen. Dieser Artikel beschreibt die Entwicklung der Beschreibungssprache an deren wesentlichen Eckpunkten.
Version HTML 2.0 – Frühe Version
In den frühen Versionen von HTML stand der Hypertext-Gedanke im Vordergrund. Die Sprache besaß als Anwendung der SGML-Beschreibungssprache nur eine Handvoll von Tags. Der Schwerpunkt lag in der Darstellung von einfachen Textdokumenten, die grundlegend formatiert werden konnten. Die Aufteilung von Bildschirminhalten war nicht vorgesehen. Die wesentlichen Grundbestandteile waren:
- Die heute noch typische Dokumentenstruktur
- Die Dokumentenstruktur <H1>…<H6>, sowie <P> und <BR>
- Formulare
- Listen, Anchor Tags, Images
Version 3.2 – Skripte und Tabellen
Das 1997 entwickelte HTML 3.2 enthielt einige Neuerungen und modernisierte die Sprache grundlegend. Die wesentlichen Neuerungen waren:
- Die Möglichkeit Skripte und Stylesheets einzubinden. JavaScript und CSS waren damals in früher Entwicklung und wurden nur sehr wenig genutzt.
- Die Möglichkeit Java Applets einzubetten.
- Die Unterteilung von Dokumenten durch DIVs.
- Erweiterte Formatierungsmöglichkeiten für Textinhalte.
- Tabellendarstellungen. Tabellen wurden lange Jahre gerne zur Strukturierung von Webseiten genutzt.
Version 4.x – Die umfangreichste Erweiterung des HTML-Standards
HTML 4 sollte 1999 ein Umbruch im Hypertext darstellen. 4-5 Jahre nachdem „Multimedia“ Buzzword Nummer 1 war, war der Anspruch „In addition […] HTML 4 supports more multimedia options, scripting languages, style sheets, better printing facilities, and documents that are more accessible to users with disabilities. HTML 4 also takes great strides towards the internationalization of documents, with the goal of making the Web truly World Wide.“ (w3.org Specification)
Diese Version schuf eine Komplexität, die auch heute noch wenig Frontent-geübte Entwickler überfordert und prägte den Entwicklungsstil einer Generation von Webentwicklern. Es war auch der längste wirklich verwendete angewandte Standard dieser Sprache. Neu war in der Version 4:
- Framesets zur Unterteilung von Bildschirmbereichen in mehrere Dokumente
- Eine Unterteilung in verschiedene Dokumentenversionen
- STRICT – Der Gedanke lag bei der Trennung zwischen Inhalt und Darstellung durch konsequente Nutzung von CSS und HTML.
- TRANSITIONAL – Die wahrscheinlich meistgenutzte Version erlaubte die Vermischung von neuen HTML-Features und alter Notation.
- FRAMESET – Der Name sagt es, für die Verwendung von Framesets.
- Wichtig: Eine ersthafte Verwendung von CSS und der Trennung von Inhalt und Dartellung war nun möglich
- IFRAMEs, die leider heute immer noch verwendet werden.
XHTML – Der Underdog
Recht schnell nach HTML4 kam im Jahr 2000 XHTML, eine nach XML portierte Version 4.x. Sie brachte inhaltlich wenig Neuerungen. Die Besonderheit von XHTML war, dass es XML- kompatibel war. Für den Entwickler bedeutete das:
- Konsequentes Schließen von Tags. Also Bspw. die Verwendung von <br /> statt <br>
- Konsequentes Kleinschreiben von Tags und Attributen.
Obwohl XHTML in der Praxis wenig Relevanz hatte, war es für mich merkwürdigerweise prägend.
Version 5.x – Multimedia & Cleanup
Nachdem die Version 4.x umstrittende Elemente hinzufügte, und wesentliche Features vermissen ließ, räumte HTML 5 2014 in der Struktur auf. Anders war:
- die Entsorgung von ungeliebten Funktionen wie FRAMESETs und diverser Formatierungstags
- Erweiterte semantische Attribute zur Strukturierung von Dokumenteninhalte <header><footer>, etc.
- die native Unterstützung von Audio- und Videowiedergabe. Zuvor musste auf Flash zurückgegriffen werde
- Bessere Formularvalidierung, zuvor musste auf JavaScript zur Formularvalidierung verwendet werden.