Semantik oder die Überzeugungsarbeit des Idealisten

Derzeit entspinnt sich da eine ganz interessante Diskussion zum Thema in Content Management Systemen. Besonders angetan hat es uns Webleuten dabei natürlich das Thema sauberer Code, ganz abgesehen mal vom Design, das gerne mal darunter leidet, wenn man die Features eines Tiny MCE oder anderer voll ausreizt. Ganz nah dran das Thema Semantik. Ich verstehe es nur in Ansätzen.

Einerseits habe ich, aus einer eher wissenschaftlichen Sicht heraus ein Problem mit der letztendlichen Definition des Semantischen am HTML und andererseits frage ich mich, wie viel Prozent der Bevölkerung man die Wichtigkeit (?) dieser komplexen Thematik annähernd plausibel klar machen kann. Ein paar vielleicht provokante Überlegungen.

Auf der Suche nach Semantik

Ich habe seinerzeit Abitur gemacht mit der etwas exotisch anmutenden Kombination Mathematik und Deutsch Leistungskurs. Dort begegnete uns natürlich (spätestens) auch die Semantik. Allgemein findet man beispielsweise bei die Definition

Semantik (aus dem Griechischen σημαίνειν sēmainein „bezeichnen“), auch Bedeutungslehre, nennt man die Theorie oder Wissenschaft von der Bedeutung der (sprachlichen) Zeichen.

u.a.

Formale Semantik beschäftigt sich mit der exakten Bedeutung von künstlichen oder natürlichen Sprachen. Dabei kann sowohl die Bedeutung bestehender Sprachen untersucht als auch die Bedeutung neu geschaffener Sprachen festgelegt werden. In Abgrenzung zur Semantik im allgemeinen Sinn, wie sie vor allem in Philosophie und Linguistik betrieben wird, arbeitet die formale Semantik mit rein formalen, logisch-mathematischen Methoden.

Das ist die richtige Richtung, wenn es um die Semantik von HTML geht. Interessant hier übrigens die klare Forderung eines mathematisch-logischen Ansatzes. Semantik dann auch ein großes Thema während meines Studiums der Allgemeinen Sprachwissenschaft (oder auch Linguistik). Ich erinnere mich noch an interessante Namen wie Richard Montague und Noam Chomsky (lesenswert übrigens!). Ich traue mich hier übrigens mal, nicht weiter als Wikipedia zu schauen, es reicht für den groben Ansatz und zeigt eines: Semantik ist wirklich ein komplexer Bereich.

Ich glaube, die die davon reden, haben alle eine mehr oder weniger umfangreiche Idee von semantischem HTML. Ich hätt das gerne aber noch etwas genauer. Es ist nicht das erste und sicherlich nicht das letzte Mal, dass ich dazu suche. Sich zum Thema HTML und Semantik etwas tiefergehend schlau zu machen, ist jedoch gar nicht so einfach. Versteht mich nicht falsch: man findet dazu eine Menge, aber meistens sind es schlicht Blog Einträge, die mir zu erklären versuchen, was es mit XHTML auf sich hat, nichts, was man nicht schon gewusst hätte. Wieder bei , aber der englischen Version, finde ich dann

There is no official specification called “Semantic HTML”

Das glaube ich nach meinen etwas unbefriedigenden Google Treffern sofort. Also über was reden wir hier überhaupt? (klar, W3C, aber fragt doch mal rum, wahrscheinlich halten viele Leute W3C für einen neuartigen Kloreiniger mit dreifach Power). Es gibt nichts, was hier irgendwie meinem Anspruch nach einer halbwegs wissenschaftlichen Definition genügen würde. Lassen wir das.

Der ganz normale Computer oder auch Internetnutzer

Dem ganz normalen Internetnutzer (und damit dem ganz normalen Websitebetreiber) anhand des Beispiels Buch klar zu machen, dass den Überschriften H1 bis H6 eine hierarchische Struktur zugrundeliegt, das mag meines Erachtens noch ankommen. Man kann es sehr gut gerade mit nummerierten Gliederungen erläutern. Dieses theoretische Verständnis bedeutet jedoch nicht, dass dies auch in der Praxis tatsächlich zur Anwendung käme. Es ist schon nicht mehr plausibel zu machen, dass (nehmen wir zunächst der Einfachheit halber sowas wie Word) nach einer “Überschrift 1″ keine “Überschrift 3″ kommen kann. Dies gelingt nur mit einer dem Dokument zugrunde liegenden Gliederung.

Ich wette, wenn ich heute in eine Durchschnittsuni gehe und dort Studenten befrage, wie viele Gedanken sie sich über die (edit: technischen Frage der) Gliederung ihrer Diplom oder Doktorarbeit gemacht haben, werden mich mindestens ein paar davon sehr erstaunt anschauen.
Die Standardvariante, um einen Text einzurücken heißt nicht etwa Tabulator sondern Leertaste. Das ist die Realität, Leute, - sofern man keinen Schreibmaschinenkurs mitgemacht haben sollte. Und so werden wahrscheinlich auch viele Word Dokumente erstellt. Auch von Akademikern übrigens, denen der Begriff Semantik nun wirklich nicht fremd sein sollte.

Ein Editor, den können Sie bedienen wie Word

So und nun kommen wir zum Thema Semantik und HTML.
Keiner, der mal eine halbwegs vernünftig aussehende, valide HTML Seite erstellt hat, wünscht sich, dass sich der Kunde später mit Farbpalette und Schriftartenauswahl bewaffnet austobt, wenn er selbst damit anfängt, erste Inhalte einzustellen.
Dies lässt sich zunächst - das ist bekannt- grob verhindern, indem man den Editor anpasst, beispielsweise den oft mitgelieferten Tiny MCE. Der Kunde wird das umso mehr verstehen, wenn man gleichzeitig CSS Klassenstile mit sprechenden Namen anbietet.

Ebenso wird der Kunde, mit etwas Überzeugungsarbeit verstehen, dass es keine gute Idee ist, Websites durch Copy und Paste aus Word zu füllen.

Nur die Semantik? Der ganz normale User arbeitet visuell. Da ist es egal, ob eine Liste wirklich eine Liste ist wie sowas

  • Punkt 1
  • Punkt 2
  • Punkt 3

oder ob sie nur aussieht wie eine Liste, ungefähr so

> Punkt 1
> Punkt 2
> Punkt 3

was vielleicht passieren mag, weil dem ganz normalen User bzw. dem ganz normalen Kunden plötzlich die Pfeilchen besser gefallen und er gar nicht auf die Idee kommt, dass man sowas auch über CSS steuern könnte.

Ein fast noch schlimmeres Thema sind Tabellen. Da wird der Optik halber mal schnell eine Leerzeile eingefügt. Da tummeln sich Überschriften und Leerzeichen, damit es schön ausgerichtet ist. Als der für das Design Verantwortliche schlägt man die Hände über dem Kopf zusammen.

All das kann man, mit viel Überzeugungsarbeit und geschickter Editorenanpassung sowie CSS Definitionen in den Griff kriegen. Was aber die semantische Fragestellung hinter dem Ganzen betrifft, so sehe ich kaum eine Chance.

Da lese ich in jenem in den Kommentaren folgendes:

Wer sich gar nicht an semantische Regeln halten möchte, hat meiner Meinung nach (im professionellen Kontext) in einer Webredaktion nichts zu suchen.

Das mag ja durchaus stimmen, ist aber eine ziemlich hoch gegriffene Angelegenheit oder nicht?

Redaktion: Traum oder Wirklichkeit?

Wer sitzt denn nun in der Realität in einer solchen Webredaktion?

Haben die Lektoren, so es sie denn überhaupt gibt, nicht schon genug damit zu tun, die Katastrophen deutscher Sprache, wie sie im Web zu genüge zu finden sind, in den Griff zu bekommen?
Muss jeder Abteilungsleiter einer mittelgroßen Firma heutzutage einen Kurs zu semantischen Web belegt haben, um Texte zu korrigieren, die die Teamassistentin gestern abend noch schnell aufgrund seines Diktats eingetippt hat? Liegt nicht eher hier die Realität?
Oder muss sich heute jeder Website Betreiber einen Profi leisten?
Und ich rede hier nicht von Websitebetreibern, die an anderer Stelle keinen Anspruch an ihren Internetauftritt hätten oder mit der Wald und Wiesen Variante zufrieden wären!

Okay, Leute, vielleicht habe ich ja auch die falschen Kunden? Nein, das stimmt nicht, denn ich werde euch eines besseren belehren! Ja, auch ich habe einen Anspruch und dem versuche ich gerecht zu werden. Auch ich kläre meine Kunden auf und versuche, ihnen die Geschichte vom besseren Web zu erklären. Ich theoretisiere und spare auch nicht mit verkaufsträchtigen Argumenten wie SEO.

Aber den Begriff Semantik, den lasse ich außen vor und ich versuche, nicht mehr als die Basics rüber zu bringen. Ich specke weiterhin Editoren ab. Und ich hoffe, ich sehe bei alledem noch ein bisschen die Menschen hinter meinen Kunden, dabei in der Hoffnung, sie werden mir dankbar sein dafür, dass ich ihnen nichts aufs Auge drücken möchte, was sie nicht verstehen wollen, weil es ihnen vielleicht auch nicht wichtig ist?

Und ich schreibe eine Fortsetzung zum Thema, heute oder morgen. Dabei wird es um den kritisch aufmüpfigen Kunden gehen, über meine Versuche herauszufinden, wie das nun mit der Best Practice um die Nutzung von H1 bi Hx bestellt ist und um die Schwierigkeit, einen restriktiven Editor zu erstellen.

 

Auch was dazu sagen?