Meta-Tags

Inhalt:

Allgemeines
offizielle Meta-Tags
äquivalente Meta-Tags
erweiterte Meta-Tags
diverse Meta-Tags
Dublin-Core-Tags
Ein Meta-Tag-Generator
Überprüfung der Meta-Tags durch einen Suchmaschinen Spider Simulator

zurück

Allgemeines

Allem voran möchte ich erst einmal auf die umfassenden Erläuterungen bei selfhtml (Thema meta-tags) von Stefan Münz hinweisen.

Ruhig gründlich mit Meta-Tags verfahren, führende Suchmaschinen wie fireball.de werten viele dieser Tags aus.

Unbedingt immer aussagekräftige Titel (kein Meta-Tag) vergeben.

Am Anfang sollten die beschreibenden Tags description und keywords stehen, da manche Robots nur eine begrenzte Anzahl der ersten Zeichen einer Site einlesen.

Danach allgemein Browser-hilfreiche Tags:

<META http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<META http-equiv="Language" content="de">

offizielle Meta-Tags

"Offizielle" Meta-Tags besitzen den Aufbau <meta name="Name des Meta-Tags" content="Wert oder Inhalt">.

Meta-Name Beschreibung
Title
(eigenständiges und kein Meta-Tag)
Titel der Webseite (Strongly Recommended), 15 Wörter, Firma, Produkte, Kurzbeschreibung.
Erscheint auch in Bookmark-Listen, daher <70 Zeichen.
<TITLE>A company name; specializing in an industry or product name.
La Fiesta; California's supplier of authentic handmade Mexican straw hats.</TITLE>
Description Beschreibung der Seite, wird beim Suchtreffer angezeigt (155-255 Zeichen, ca. 25 Wörter), auch "abstract".
Beschreiben Sie Ihre Seite, nicht Ihre Firma.
Der Sinn Ihrer Anstrengungen ist es, den Kunden zu Ihrer Webseite zu lotsen. Wenn der Kunde auf Ihrer Seite ist, können Sie Ihre Firma beschreiben. Wenn Sie eine Beschreibung Ihrer Seite erstellen, sagen Sie dem Kunden, warum er Ihre Seite besuchen muß. Der Kunde sucht nach einer Webseite nicht nach einem Jahresbericht.
<meta name="description" content="Dieser Beschreibungstext erscheint im Suchdienst bei Auffinden dieser Datei">
"La Fiesta of San Diego, California sells many authentic hand woven straw sombreros and velvet matador hats from Mexico, Spain and Argentina. La Fiesta has colorful blankets, salsa dishes, clay pots and Latin American cultural items."
Keywords Stich- und Schlüsselwörter für erfolgreiches Gefundenwerden. Wichtig: Es ist nicht entscheidend, ob Sie ein Produkt auch verkaufen. Beschränken Sie sich nicht, in dem Sie denken "Was verkaufe ich?". Fragen Sie sich "Was könnte ein Kunde suchen?". Das hilft Ihnen weiter!

Benutzen Sie den Plural.

Wenn Sie Ihre Liste vollständig haben, denken Sie auch an den Plural Ihrer Schlüsselwörter. Viele Menschen suchen nach 'hotels' und nicht nach 'hotel'. Wenn Ihre Schlüsselwörter im Singular eingetragen sind, wird Ihre Seite bei einer Suche nicht erscheinen und alle Ihre Mühen waren umsonst.  Ihre Seite wird andererseits aber gefunden, wenn nach dem Singular gesucht wird. Eine Suche nach 'hotel' wird Ihr Schlüsselwort 'hotels' finden!

Vermeiden Sie häufige Begriffe oder solche, die mit dem Internet stark zusammenhängen. Die Suchmaschinen ignorieren z.T. zu häufig vorkommende Begriffe. Verschenken Sie dadurch keinen Platz in Ihren meta keywords.

Fassen Sie Schlüsselwörter zu Phrasen zusammen. Dies ist eine großartige Taktik für den Meta Keyword Bereich. Wenn Sie suchen, nehmen Sie doch auch nicht nur einen Begriff. Normalerweise wird nach Phrasen wie 'hotel hamburg alster' gesucht. Wenn in Ihrem Keyword Bereich <META name="keywords" content="hotel hamburg alster,"> die ganze Phrase zwischen den Kommas steht, dann stimmt der Suchbegriff mit Ihrem ganzen Keyword überein, anstatt daß drei Schlüsselwörter passen würden, falls Sie <META name="keywords" content="hotel, hamburg, alster,"> eingetragen hätten. Dies bringt Ihre Seite weiter nach vorne.

Trennung durch Komma und folgendes Leerzeichen. (max. 1000 Zeichen, aber interessant sind die ersten 200 Wörter der Site). Anzahl der Keywords 20 -50. Nehmen Sie nur wenige Schlüsselwörter, dann erhöht sich der Anteil dieser und Ihre Seite wird oben im Suchergebnis erscheinen. Wenn Ihre Liste mit Schlüsselwörtern kurz ist und Sie sicher sind, daß die Interessenten genau nach diesen Begriffen suchen, sollten Sie auch gezielt vorgehen. Wenn nicht, müssen Sie Ihre Schlüsselwörter breit streuen. Normale Groß-Schreibung ist ok, Phrasen ans Ende a'la <Meta, Tags, "Meta Tags">.
Es gibt auch sprachbezogene KeyWords.
<meta name="keywords" content="HTML, Meta-Informationen, Suchprogramme, HTTP-Protokoll">

Author Autor/Webmaster der Seite
<meta name="author" content="Thomas Breitenbuecher">
Owner

Diese Angabe ermöglicht es Spambots bei der Auswertung Ihrer Webseiten an Ihre eMail-Adresse heranzukommen

Besitzer/ Webmaster, teilweise von Browsern als eMail-Adresse benutzt
<meta name="owner" content="hans@im-glueck.de">
Copyright <meta name="copyright" content="Inhaber">
page-topic <meta name="page-topic" content="Medien, Bildung, Wissenschaft">
page-type <meta name="page-type" content="FAQ, Beschreibung, Anleitung">
audience <meta name="audience" content="Schüler, Studenten, Kinder">
Language Sprache (german, french, ...)
<meta name="language" content="german"> oder auch
<meta http-equiv="language" content="ge">
Revisit Zeitraum, in dem der Robot der Suchmaschinen die Webseite aktualisieren soll;
Wert = [integer][days|weeks|months]
<meta name="revisit" content="8 weeks">
revisit-after Zeit, wann der Robot der Suchmaschine wieder besuchen soll. Möglich sind days, months, years
<meta name="revisit-after" content="10 days">
date gibt an, wann die Datei publiziert wurde.
content="1998-04-30T08:49:37+00:00": 1998 ist die Jahreszahl, 04 der Monat (Mai), 30 der Tag, 08 die Stunden, 49 die Minuten und 37 die Sekunden. Die Angabe 00:00 hinter dem Pluszeichen ist die Abweichung der Zeit von der Greenwich-Zeit in Stunden und Minuten, im Beispiel keine Abweichung. Wenn Sie nur das Datum, aber keine Uhrzeit angeben wollen, notieren Sie nur den Teil der Datumsangabe bis vor dem großen T (für Time).
<meta name="date" content="1998-04-30">
Robots Auslesen der Seite durch Suchrobots sowie Übermittlung von Inhalten an Suchmaschinen erlauben oder verbieten:
Content ist die Indizierungsmethode:
  • "all" - Seite und gelinkte Seiten besuchen und indizieren
  • "noindex" - keine Inhalte aus der HTML-Datei an Suchdatenbank übermitteln; auch "none"
  • "index" - Erlaubt einem Suchprogramm ausdrücklich, Inhalte aus der HTML-Datei an Suchdatenbank zu übermitteln.
  • "nofollow" - Inhalte übermitteln, jedoch keine untergeordneten Dateien des Projekts besuchen.
  • "follow" - Inhalte übermitteln und untergeordnete Dateien des Projekts besuchen

default bzw. ohne Angabe ("") ist "all". Auch Suchmaschinen wie "webcrawler" können genannt werden.

Alternativ hierzu können auch differenzierte Angaben in einer eigenen Datei robots.txt gemacht werden.

<meta name="robots" content="all">

IDENTIFIER-URL Webseitenadresse/ URL
Rating Hier steht die Rating, muss eigentlich nicht gesetzt werden. Nur bei Seiten wie SEX, wenn andere Rating notwendig ist.
<meta name=rating content="General">

nach oben

Äquivalente Meta-Tags

Ein "offenes" System, in dem der Name des Tags variabel gehalten wird.

<meta http-equiv="Meta-Name" content="Inhalt zu diesem Meta-Namen">
Meta-Name Beschreibung
expires Verfallsdatum bzw. wann eine Site ungültig wird (ODER ? wann ein Proxy-Server die Datei wieder vom Original-Server laden muß).
content="0" bedeutet, daß die Datei in jedem Falle von der Quelle geladen werden muß.
Anstelle der 0 kann man auch die Anzahl an Sekunden angeben, nach deren Ablauf der WWW-Browser eine Datei, die er im Cache hat, auf jeden Fall wieder vom Server laden soll. content=43200 stellt beispielsweise einen Wert von 12 Stunden ein.
content="Sat, 14 Dec 1998 12:00:00 GMT" entspricht einer exakten Zeitangabe.
Als Wochentagsnamen sind erlaubt Mon (Montag), Tue (Dienstag), Wed (Mittwoch), Thu (Donnerstag), Fri (Freitag), Sat (Samstag) und Sun (Sonntag). Als Monatsnamen sind erlaubt Jan (Januar), Feb (Februar), Mar (März), Apr (April), May (Mai), Jun (Juni), Jul (Juli), Aug (August), Sep (September), Oct (Oktober), Nov (November) und Dec (Dezember).
<meta http-equiv="expires" content="0">
automatische Weiterleitung nach z.Bsp. content="0" Sekunden; Werte von 0 bis 30; Vorsicht beim Gebrauch, da Verdacht auf Spamming. Mit <meta http-equiv="refresh" content="..."> veranlassen Sie den Start einer anderen Datei. Mit content="5; bestimmen Sie die Anzeigedauer der Datei in Sekunden. Die 5 im Beispiel bedeutet also, daß die Datei 5 Sekunden lang angezeigt wird. Danach wird die nächste Datei aufgerufen, die mit url=..." spezifiziert wird. Notieren Sie den gesamten Befehl inclusive der etwas ungewohnten Stellung der Anführungszeichen so wie im Beispiel unten angegeben. Setzen Sie jeweils Ihre gewünschte Anzeigedauer und den Namen der nächsten, aufzurufenden Datei ein. Für die Adressierung der Datei gelten die gleichen Regeln wie bei Verweisen. Bei einem Timeout von 0 wird die angegebene nächste Datei sofort geladen.

Beachten Sie: Dieser HTML-Befehl funktioniert auch ohne HTTP-Protokoll, also lokal auf jedem Rechner.

Verlassen Sie sich nicht darauf, daß dieser Befehl in jedem Browser funktioniert. Wenn Sie etwa eine Weiterleitung zu einer neuen Adresse eingeben, notieren Sie am besten auf der gleichen Seite zur Sicherheit noch einen normalen Verweis zu der neuen Adresse. So finden auch Anwender, bei denen die Meta-Angabe nicht funktioniert, den Weg zu Ihrer neuen Heimat.

<meta http-equiv="refresh" content="5; URL=http://www.teamone.de/selfhtml/">

PICS-Label / rating PICS steht für "Platform for Internet Content Selection". Es handelt sich dabei um ein standardisiertes Schema zum Bezeichnen von Internet-Inhalten. Das Schema wurde ins Leben gerufen, um jugendfeie Internet-Inhalte als solche auszuzeichnen. Es gibt sogenannte PICS-Labels, also Auszeichnungen. Anbieter von WWW-Seiten können ihre WWW-Seiten entweder freiwillig und nach eigenem Ermessen mit einem PICS-Label versehen, oder - und das ist wohl eher Sinn der Sache - sie nehmen einen unabhängigen PICS-Service in Anspruch, der PICS-Zertifikate für Inhalte ausstellt.
Auf Einzelheiten des PICS-Systems wird hier nicht näher eingegangen. Informationen im WWW finden Sie auf der PICS-Seite des W3-Konsortiums. Moderne Browser können PICS-Inhalte erkennen. Dazu lassen sich software-seitig Einstellungen vornehmen, zum Beispiel durch Eltern von surfenden Kindern. So kann der Browser bei Seiten mit PICS-Labeln durch Vergleichen der Konfiguration mit dem Label erkennen, ob der Inhalt angezeigt werden darf oder nicht.
Default-Sprachen und Zeichensätze / Type / content-type Sie können mit Hilfe einer Meta-Angabe ausdrücklich bestimmen, welchen Zeichensatz Sie innerhalb der HTML-Datei verwenden. Für HTML-Ergänzungssprachen wie Style-Sheets und Scripts können Sie bestimmen, welche Sprachen Sie innerhalb der HTML-Datei verwenden. Diese Angaben helfen dem WWW-Browser, die Inhalte der HTML-Datei im Zweifelsfall korrekter zu interpretieren. Vor allem die Angabe zum Zeichensatz ist wichtig, falls Sie innerhalb der HTML-Datei Umlaute usw. nicht maskieren.

Der Befehl zur Angabe eines bestimmen Zeichensatzes muß die Angabe http-equiv="content-type" enthalten sowie das Attribut content=. Hinter content= geben Sie in Anführungszeichen zunächst den Mime-Type an, der für HTML-Dateien immer text/html lautet. Dahinter folgt, durch einen Strichpunkt getrennt, die Angabe des Zeichensatzes. Im obigen Beispiel wird der Zeichensatz iso-8559-1 definiert (das ist der normale Zeichensatz für westeuropäische Sprachen). Mehr zu diesen Themen finden Sie in den Abschnitten Zeichensätze sowie Zeichensätze und Unicodes in HTML.

Die Befehle zum Bestimmen der Default-Scriptsprache und der Default-Stylesprache haben einen einheitlichen Aufbau. Die Angabe zur bevorzugten Scriptsprache leiten Sie mit <meta http-equiv="Content-Script-Type" ein, die Angabe zur bevorzugten Stylesprache mit http-equiv="Content-Style-Type". Bei dem Attribut content= müssen Sie dann den Mime-Type der gewünschten Sprache angeben. Beispiele sind text/css für CSS Style-Sheets und text/javascript für JavaScript.

<meta http-equiv="content-type" content="text/html; charset=iso-8859-1"> OKAY
<meta http-equiv="content-language" content="de"> Sprache des Dateiinhalts (HTTP 1.0 und RFC1766)
<meta http-equiv="Content-Script-Type" content="text/javascript">
<meta http-equiv="Content-Style-Type" content="text/css">

nach oben

Erweiterte Meta-Tags:
Meta-Name Beschreibung
Sprache bei Stichwörtern Für Meta-Angaben zu Stichwörtern (evtl. auch bei Kurzbeschreibung des Inhalts) können mehrere gleichartige Meta-Angaben gemacht und damit zwischen Landessprachen unterschieden werden.

<meta name="keywords" lang="de" content="Ferien, Griechenland, Sonnenschein">
<meta name="keywords" lang="en-us" content="vacation, Greece, sunshine">
<meta name="keywords" lang="en" content="holiday, Greece, sunshine">
<meta name="keywords" lang="fr" content="vacances, Gr&egrave;ce, soleil">

Im Beispiel werden die gleichen Stichwörter in den Sprachen Deutsch, US-Englisch, Britisch-Englisch und Französisch definiert. Dabei wird das Attribut lang= benutzt, um die Sprache anzugeben. Als Angabe ist ein zweistelliges Landeskürzel erlaubt (Ausnahme: en-us), z.B. de für deutsch, en für englisch, fr für französisch, it für italienisch oder es für spanisch. Mehr über die standardisierten Landeskürzel im Internet in der RFC 1766.

Meta-Angaben in externen Profil-Dateien Um ein Profil einzubinden, notieren Sie im einleitenden <head>-Tag das Attribut profile=. Als Angabe notieren Sie dazu in Anführungszeichen die Adresse, wo die Profildatei abgelegt ist. In dem Beispiel wird ein Profil zugrunde gelegt, daß auf der Internet-Adresse http://meine.org/profil.rdf abgelegt ist. Es wird angenommen, daß in dem Profil eine Meta-Angabe mit dem Namen Kategorie definiert wird. Diese Meta-Angabe kann dann innerhalb des Dateikopfes benutzt werden.
<head profile="http://meine.org/profil.rdf">
<meta name="Kategorie" content="A.1.B">
</head>
In diesen Profil-Dateien könnten dann auch eigene Formate für z.Bsp. Uhrzeit hinterlegt werden.

nach oben

diverse Meta-Tags:

Meta-Name Beschreibung
Generator <meta name="generator" content="MS Frontpage 2.0">
<meta name="generator" content="Netscape Composer">
Wird von HTML-Editoren, vor allem von Wysiwyg-Editoren ohne Wissen des Autors eingefügt. Software-Hersteller können so prima das Web durchsuchen und feststellen, wo und wieviel mit ihrer Software gearbeitet wird
Cache <meta http-equiv="ext-cache" content="name=/some/path/index.db; instructions=user instructions">
Anweisung an den Netscape-Browser: nicht den normalen lokalen Browser-Cache benutzen, sondern den angegebenen externen Cache.
Cookie <meta http-equiv="set-cookie" content="cookievalue=xxx;expires=friday, 31-dec-99 23:59:59 gmt; path=/;">
Cookie setzen (Netscape)
Proxy <meta http-equiv="pragma" content="no-cache">
An Proxy-Agenten: Datei bitte nicht auf Proxy-Server speichern!

nach oben

Vorschläge des W3-Konsortiums (Dublin-Core):

Eine internationale Gruppe von Experten, unter dem Namen Dublin Core vereint, hat ein System für Meta-Angaben veröffentlicht. Das System ist einfach zu handhaben und berücksichtigt alle wichtigen Angaben, die zu einem Dokument gemacht werden können. Die Meta-Angaben von Dublin-Core werden auch vom W3-Konsortium begrüßt. Einer Verwendung steht also nichts im Wege.

Die meisten heutigen Suchmaschinen bieten allerdings noch gar keine Suche nach hier beschriebenen Kategorien wie Autor, Herausgeber oder Textsorte an. Das System ist eher an der Zukunft orientiert.

Bei Meta-Angaben, die einem bestimmten öffentlichen System angehören, so wie hier dem System von Dublin Core, wird dem Namen einer Meta-Angabe eine Kurzbezeichnung für den Herausgeber der Meta-Angaben vorangestellt. Bei Dublin Core sind das die Initialen DC. Dahinter folgt, durch einen Punkt getrennt, der Name der Meta-Angabe. Der Zuweisungswert erfolgt in dem Attribut content

Im WWW finden Sie Informationen zu Dublin Core Metadata.

Meta-Name Beschreibung
DC.Title Titel der Webseite, entspricht title-Tag
<meta name="DC.Title" content="SELFHTML/Meta-Angaben">
DC.Creator Webmaster / Besitzer / Urheber
<meta name="DC.Creator" content="Thomas Breitenbuecher">
DC.Publisher Webmaster/ Produzent; gibt an, wer für die Publikation der Datei verantwortlich ist. Das kann der Autor selbst sein, aber auch etwa ein Verlag oder der Nachfahre eines verstorbenen Autors
<meta name="DC.Publisher" content="DMT">
DC.Contributor Mitbesitzer/ zweiter Webmaster, gibt Co-Autoren oder Personen an, die neben dem Hauptautor maßgeblich am Inhalt beteiligt sind, z.B. Grafiker, Musiker, Übersetzer. Falls Sie mehrere Angaben dazu machen, trennen Sie die Namen durch Kommata.
<meta name="DC.Contributor" content="Mein Kunde">
DC.Subject Inhalt der Webseite, behandeltes Thema
<meta name="DC.Subject" content="Meta-Angaben">
DC.Description Kurz-Beschreibung des Seiteninhaltes
<meta name="DC.Description" content="Heute bekannte Meta-Angaben in HTML">
DC.Language  

nach oben