Lexikon Begriffe Logfile-Auswertung

Hits

Als Hit wird der Abruf eines Objektes bezeichnet, einschließlich Grafiken, Scripts, HTML-Seiten, Programme und anderer Dateien.

Zurück

PageViews

Als PageView (auch PageImpression) wird der Abruf einer HMTL-Seite bezeichnet, die auch durch ein serverseitiges Script (z. B. PHP) generiert worden sein kann. Die in der Seite enthaltenen Objekte wie Grafiken werden dem PageView nicht hinzugezählt.

Zurück

Hits, Pages umgeleitet

Bei einer Umleitung wird die Anforderung des Objektes zwar durch den ursprünglichen Server registriert, doch von dem WebServer geliefert, auf den umgeleitet wurde. 'Hits' umfasst alle angeforderten Objekte, 'Pages' nur HTML-Seiten.

Zurück

PageViews Content

Ein Content-PageView ist der Abruf einer Seite mit den Benutzer interessierenden Inhalt.

Zurück

PageViews NoContent

Ein NoContent-PageView ist der Abruf einer Seite mit keinem besonderen Nutzerinteresse wie Werbe-Seiten, wiederkehrende Info- und Hilfsseiten, Navigationsseiten etc.

Zurück

EntryPage, Entrys

Die EntryPage (Einstiegsseite) ist die erste Seite, die ein Reader auf Ihrer Homepage besucht hat. Der Wert Entrys (Einstiege) gibt an, wieviele Reader diese Seite als EntryPage hatten.

Zurück

ExitPage, Exits

Die ExitPage (Ausstiegsseite) ist die letzte Seite, die ein Reader auf Ihrer Homepage besucht hat, bevor er sie verlassen hat. Der Wert Exits (Ausstiege) gibt an, wieviele Reader diese Seite als ExitPage hatten.

Zurück

IP-Adresse

Die IP-Adresse (kurz IP) ist sozusagen die numerische Absender-Adresse eines Servers. Sie ist in vier Bereiche mit jeweils einem Wert von 0-255 durch einen Punkt unterteilt, wobei der höchstwertige Teil links steht. Es werden ganze Adressbereiche an Provider und Netzwerke vergeben. Theoretisch ließen sich mit dem derzeitigen Standard IPv4 knapp 4,3 Mrd. Rechner adressieren. Viele Server im Internet haben eine feste IP-Adresse, aber die meisten Privatnutzer wählen sich in das Internet ein und bekommen bei jeder Einwahl eine andere (dynmamische) IP-Adresse von Ihrem Provider zugeteilt. Jeder Rechner im Internet hat also zu einem bestimmten Zeitpunkt eine eindeutige IP-Adresse, d. h. aber nicht, dass eine halbe Stunde später unter einer bestimmten IP-Adresse derselbe Rechner erreichbar wäre (wenn sich der alte Benutzer aus- und sich ein neuer Benutzer eingewählt hat).

Zurück

Individuelle IPs pro Tag

Hierunter versteht man die Anzahl der IPs unterschiedlicher Server, die an einem Tag zugegriffen haben. Auch wenn eine IP mittlerweile durch den Provider neu vergeben wurde (dynamische IPs), zählt die IP nicht erneut. Dieser Wert ist weit geringer als die Anzahl der tatsächlichen Besucher.

Zurück

Individuelle IPs pro 30 Minuten

Hierbei werden die IPs unterschiedlicher Server in 30 Minuten-Abschnitten gezählt (also von 00:00-00:29, 00:30-00:59, 01:00-01:30 etc.). Innerhalb der jeweiligen 30 Minuten zählt eine IP nur einmal, und für jeden weiteren 30 Minuten-Abschnitt erneut. Dieser Wert ist sehr wahrscheinlich höher als die Anzahl der tatsächlichen Besucher.

Zurück

Visits

Die Größe der Visits ist der Versuch, die tatsächlichen Besucher des WebServers möglichst genau zu schätzen. Die Schwierigkeit liegt darin, dass IPs sehr oft dynamisch sind und eine IP ein paar Minuten später schon einem neuen Besucher zugeteilt worden sein kann. Berechnungsgrundlagen sind hierfür Visits New oder Visits Chain.

Zurück

Visits New 30 Minuten

Hier ist Berechnungsgrundlage für die Visits die Annahme, dass eine IP nach eine gewissen Zeit neu vergeben wurde und inzwischen einem neuen Besucher gehört. Liegt der erste Hits einer IP mehr als 30 Minuten zurück, wird die IP einem neuen Besucher zugeordnet. Für einen realen Besucher, der 1 Stunde auf dem WebServer surft, würden also 2 Visits gezählt. Verlässt ein Besucher den WebServer und seine IP wird einem neuen Besucher zugeteilt, der auch den WebServer besucht innerhalb von 30 Minuten, so würde nur 1 Visit gezählt werden. New Visits treffen annähernd die tatsächlichen Anzahl der Besucher.

Zurück

Visits Chain 15 bzw. 30 Minuten

Hier ist Berechnungsgrundlage für die Visits die Annahme, dass ein Besucher kontinuierlich (in Kette) Objekte vom Server abruft. Wenn eine IP eine gewisse Zeit (15 bzw. 30 Minuten) keine Objekte mehr vom WebServer abruft, wird angenommen, dass er die Homepage verlassen hat. Taucht die IP danach wieder auf, wird die neue IP einem neuem Besucher zugeteilt und ein neuer Visit gezählt. Surft ein Besucher z. B. 2 Stunden über die Homepage und ruft dabei mindestens alle 15 bzw. 30 Minuten ein Objekt auf, so zählt dies als ein Visit. Läßt er sich z. B. beim Lesen einer Seite mehr als 15/30 min. Zeit, so wird ein neuer Visit gezählt. Verlässt ein Besucher die Homepage und kommt ein weiterer, neuer mit der gleichen IP innerhalb von 15/30 min. auf die Homepage, so wird nur 1 Visit gezählt. Für Homepages mit z. B. selbstaktualierenden Werbebanner, die ständig Hits generieren, ist ein kleiner Zeitwert realistisch. Für Homepages mit sehr langen statischen Texten oder mit Java-Programmen, bei denen sehr lange kein Seitenwechsel stattfindet (und keine weiteren Objekte abgerufen/nachgeladen werden), ist ein höhere Zeitwert realistisch. Chain Visits treffen die tatsächlichen Anzahl der Besucher wohl am besten.

Zurück

Reader, Use, ReadPages und UseTime

Ein Reader (zu deutsch: Leser) ist ein Besucher, der mindestens eine Seite Hauptinhalt abgerufen hat (einen PageView Content erzeugt hat). Im Gegensatz zu einem Visit gilt der Besucher nicht als Reader, wenn nur Seiten aus dem Nebeninhalt (PageView NoContent), Grafiken oder sonstige Objekte abgerufen wurden. Reader sind also Besucher, die wirklich etwas auf der Homepage gelesen haben. Der fortlaufende Abruf von Objekten (siehe Hits) einer IP mit einer Pause von nicht mehr als 30 Minuten zwischen den Hits (siehe Visits Chain 30) wird als Use (Benutzung) bezeichnet. Die Zeit vom ersten bis zum letzten Abruf eines Objektes durch den Reader ist die UseTime (Benutzungsdauer), wobei nur die PageViews Content als gelesene Seiten (ReadPages) zählen.
Bei der UseTime zu beachten ist, dass der Aufenthalt auf der letzten Seite eines Besuches nicht mitgerechnet werden kann, weil bzw. wenn keine weitere Objekte durch den Besucher abgerufen werden. Kommt z. B. ein Reader auf Ihre Homepage und liest genau eine Seite, bevor er wieder geht, wird die UseTime unter einer Minute liegen, auch wenn sich der Reader in Wirklichkeit 15 Minuten zum Lesen dieser einen Seite gelassen hat. Um dieser Abweichung zur Realität entgegenzuwirken, können Sie z. B. einen selbstaktualisierenden Keep-Alive-Pixel oder ein selbstwechselndes Frame in Ihre Seiten/Homepage integrieren, welches fortlaufende Hits erzeugt.

Zurück

Pages Per Reader

Dieser Wert sagt aus, wieviele Seiten (PageView Content) ein Reader im Durchschnitt gelesen hat. Ist dieser Wert hoch, kann man davon ausgehen, dass der Inhalt der Homepage für die Benutzer interessant ist und "Lust auf mehr" (weiterzulesen) macht. Liegt der Wert nur um die 1, scheint ein Weiterlesen für die Benutzer uninteressant zu sein.

Zurück

UseTime Per Reader

Dieser Wert gibt an, wie lange im Durchschnitt ein Reader auf der Homepage geblieben ist, bevor er sie wieder verlassen hat. Ist dieser Wert hoch, kann man davon ausgehen, dass sich die Benutzer auf der Homepage wohlfühlen und gerne etwas länger brauchen. Geringe Werte lassen Desinteresse vermuten. Beachten Sie allerdings, dass die Verweildauer der zuletzt besuchten Seite eines Reader u. U. nicht mit einberechnet wird (siehe UseTime bei Reader).

Zurück

UseTime Per Page

Dieser Wert gibt an, wie lange im Durchschnitt ein Reader eine Seite gelesen hat. Besteht Ihre Homepage zum größten Teil aus langen Seiten mit viel Text und ist der Wert gering, dann kann man davon ausgehen, dass die meisten Besucher die Seite nicht zu Ende lesen, weil sie vielleicht der Inhalt wenig interessant ist. Beachten Sie allerdings, dass die Verweildauer der zuletzt besuchten Seite eines Reader u. U. nicht mit einberechnet wird (siehe UseTime bei Reader), was besonders ins Gewicht fällt, wenn die Homepage zumeist Einzelseitenabrufe hat.

Zurück

Servername

Da sich die im Internet verwendeten IP-Adressen für den Menschen schlecht merken lässt, wurde der Domain Name Service (kurz DNS) ins Leben gerufen, eine Art Adressbuch, in dem steht, welche Domain welche IP-Adresse besitzt. Die z. B. in der Adressleiste eingegebene Domain wird beim abschicken an einen DNS-Server weitergeleitet, der diese in eine IP-Adresse übersetzt, die benötigt wird, um den entsprechenden Server ansprechen zu können. Andersherum kann man die DNS-Server auch nach dem Namen eines Servers fragen, dem eine IP-Adresse zugeteilt ist. Die so ermittelten Servernamen geben meist Aufschluss über das Netzwerk und damit über das Unternehmen, in dem der besuchende Rechner steht oder den Provider, den der Besucher benutzt. Es kann aber auch sein, dass der IP-Adresse des Servers kein Domainname zugewiesen ist.

Zurück

Top und andere Level Domains

Domainname sind in Ebenen (durch einen Punkt) unterteilt, wobei der höchstwertige Teil rechts steht. Die aus den im Logfile vorhandenen IP-Adressen umgewandelte Servernamen sind meist in Ihrer Domain bzw. Netzwerk strukturiert. Beispielsweise wäre bei dem Servernamen 'pD9E40CF8.dip.t-dialin.net' die Top Level Domain (kurz TLD) '.net', die Second Level Domain 't-dialin.net' und die Third Level Domain 'dip.t-dialin.net'. Und 'pD9E40CF8' wäre der Name des Rechners, der sich in diesem Netzwerk befindet.
Die TLDs werden durch die ICANN (Internet Corporation for Assigned Names and Numbers) festgelegt. Es gibt generelle TLDs wie .com und .net und welche für bestimmte Benutzergruppen (z. B. .pro für Freiberufler). Zudem hat jeder eigenständige Staat eine eigene TLD zugewiesen bekommen (z. B. .de für Deutschland).
Die Vergabe von 2nd Level Domains (z. B. 'domain.de') übernehmen von der ICANN autorisierte Organisationen (z. B. das DeNIC für .de). Die vergebenen 2nd Level Domains weisen oft von Namen her auf die Unternehmen hin, die sie für Ihre Zwecke beantragt haben.
Ein Unternehmen kann seine 2nd Level Domain selbst noch weiter unterteilen (auch 'Sub-Domains'), indem es weitere Teile durch Punkt getrennt links hinzufügt. Die 3rd Level Domain ist also ein Rechner, (Sub) -Netzwerk oder besonderes Angebot eines Unternehmens unter der 2ndLD.

Zurück

Transmit

Der Transmit sagt aus, wieviele Bytes durch die Objekt-Abrufe (Hits) vom WebServer zu den Besuchern tatsächlich (ggf. komprimiert) übertragen wurden.

Zurück

Transmit unpacked

Der Transmit unpacked gibt in dem Fall, dass die Übertragung komprimiert erfolgte, die Übertragungsgröße in Bytes an, wenn der Transfer unkomprimiert erfolgt wäre.

Zurück

Referrer

Der Referrer (Referenzseite) ist die Seite, die vor der Seite auf dem WebServer aufgerufen wurde, sprich die Seite, von der der Besucher kommt. Bei den erweiterten Logfile-Formaten wird dieser Referrer mitgespeichert. Durch ihn ist es möglich, einen Seitenaufruf zurückzuverfolgen und so z. B. herauszufinden, von wo aus eine Ihrer Seiten verlinkt ist.

Zurück

Suchmaschine

Als Suchmaschine wird eine Site klassifiziert, wenn die übermittelten Referrer-URL ein für Suchmaschinen typisches Muster in den Parametern vorweist. Unter Umständgen werden diese Parameter auch von nicht Nicht-Suchmaschinen benutzt und erscheinen in der Liste, soweit sie noch nicht explizit ausgeschlossen wurden.

Zurück

Suchphrase

Eine Suchphrase ist der aus der übermittelten Referrer-URL einer Suchmaschinen herausgelösten Wörtern, nach dem in der Suchmaschine gesucht wurde und bei dem ein Suchergebnis auf den WebServer führte.

Zurück

Suchbegriff

Eine Suchphrase kann aus mehreren Wörtern bestehen. Ein Wort für sich allein genommen, stellt einen Suchbegriff dar.

Zurück

Zugriffs-Programm

Bei der Anforderung eines Objektes vom WebServer wird das Programm, mit dem zugegriffen wird, mit übertragen. Historisch bedingt steht dabei 'Mozilla' für einen Browser.

Zurück

Browserkennung

Das zugreifende Programm übermittelt hier seine Kennung, normalerweile den Namen des Browsers.

Zurück

Internet Service Provider

Unter einem Internet Service Provider (kurz ISP) versteht man ein Unternehmen, dass Interessenten einen Internetzugang bereitstellt, dies kann über Modem, ISDN, DSL oder Standleitung sein. Viele ISPs geben an Ihre Kunden angepasste Browser heraus, die oft den Namen des ISP's mit übertragen.

Zurück

Browser Add On

Es gibt einige Zusatzprogramme für den Browser (z. B. Popup-Blocker, Suchleisten), die sich meist als zusätzliche Symbolleiste im Browser installieren (AddOn). Einige davon teilen deren Existenz den WebServern mit, die sie besuchen.

Zurück

Browser Sprachkürzel

Das Sprachkürzel ist die Abkürzung der Sprache, die in der Oberfläche des Browsers angezeigt wird und gibt damit Auskunft darüber, welche Sprache der Benutzer spricht. Die Kürzel entsprechen weitgehendst den Kürzeln für Landes-Domainnamen (en=englisch).

Zurück

Abrufergebnis

Im Abrufergebnis wird anhand der Status-Codes klassifiziert, ob ein angefordertes Objekt erfolgreich abgerufen werden konnte.

Erfolgreiche Abrufe: Das Objekt wurde erfolgreich angefordert und geliefert
Fehlerhafte Abrufe: Die Objekt wurde entweder nicht richtig angefordertert, nicht gefunden oder es trat ein Server-Fehler auf. (Status Codes 300, 400-599)
Überflüssige Fehler: Das Objekt wurde nicht gefunden, aber die Anforderung des Objektes war überflüssig (z. B. überprüfende Anfragen des MSIE: favicon.ico, BeanInfo.class, $COMClassObject.class)

Zurück

HTTP-Version

Das dem Austausch von Daten im World Wide Web (WWW) zugrundeliegende Protokoll ist das Hypertext Transfer Protocol (HTTP). Aktuelle Browser benutzen die Version 1.1 des HTTP's, ältere noch die Version 1.0. Die Version 1.1 enthält einige neue Befehle gegenüber der V. 1.0, die an WebServer übertragen werden können.

Zurück

Request-Art

Ein Objekt kann auf unterschiedliche Arten vom WebServer abgerufen werden, so kann z. B. nur der Kopf (Header) abgerufen werden. Die Request-Arten werden wie folgt klassifiziert:

GET-Request: Abruf eines Objektes vom Web-Server
HEAD-Request: Abruf nur des Headers (Kopfes) mit Informationen zu einem Objekt vom Web-Server
POST-Request: Übermittlung von Informationen (z. B. Formulareingaben) an den Web-Server
OPTIONS-Request: Abruf von Informationen über verfügbare Kommunikationsoptionen vom WebServer
Andere Requests: Zusammenfassung der restlichen, selteneren Request-Arten (PUT, DELETE, TRACE, CONNECT)

Zurück

Request-Status Code

Jede Anforderung an den WebServer wird mit einem Status-Code beantwortet, aus dem sich erkennen lässt, ob die Anforderung erfolgreich oder nicht. Die Bedeutungen der Status-Codes ist folgendermaßen:

Status 200: OK - Die Anfrage wurde erfolgreich bearbeitet.
Status 206: Partial Content - Der Server beantwortete die Teil-Anforderung einer Ressource mittels GET.
Status 300: Multiple Choices - Die angeforderte Ressource wurde nicht gefunden und es wurde eine Auswahl von in Frage kommenden Ressourcen geliefert.
Status 301: Moved Permanently - Die angeforderte Ressource wurde permanent an einen anderen Ort verschoben. Es wurde der neue URL geliefert.
Status 302: Moved Temporarily - Die angeforderte Ressource wurde vorübergehend an einen anderen Ort verschoben. Es wurde der neue URL geliefert.
Status 304: Not Modified - Das angeforderte Dokument hatte sich seit der letzten Anforderung nicht geändert. Lieferung des Dokumentes aus dem Cache.
Status 401: Unauthorized - Die Anfrage erforderte eine Authentifizierung des Nutzers, die nicht korrekt erfolgte.
Status 403: Forbidden - Die Ausführung der Anfrage war verboten, unabhängig von einer Authentifizierung.
Status 404: Not Found - Die angeforderte Ressource wurde auf dem Server nicht gefunden (z. B. durch Schreibfehler, unterschiedliche Groß/Kleinschreibung, Löschung/Nicht-Upload des Objektes).
Status 4xx: Nutzerfehler - Andere, seltenere 400'er Fehler-Codes (400, 402, 405-415): Es war nicht möglich, die angeforderte Ressource zu liefern.
Status 5xx: Serverfehler - Alle 500'er Fehler-Codes (500-505): Meist trat ein interner Server-Fehler auf oder der Server war überlastet.

Zurück

Anzahl IPs bei fehlerhaften URLs

Dieser Wert gibt an, wieviele unterschiedliche Besucher (anhand der individuellen IP pro Tag) den fehlerhaften Aufruf des URL versursacht haben. Ist dieser Wert gering, kann die Schwere des Fehlers (anhand der Vorkommnisse) weniger gewichtet werden, weil hier wenige Besucher versucht haben, den fehlerhaften URL mehrmals aufzurufen. Sind Anzahl der Vorkommnisse und Anzahl der IPs hoch, ist der Fehler bedeutsam, weil hier viele Besucher ein Problem haben (z. B. weil ein interner Link falsch geschrieben ist).
Häufig geben Besucher auf gut Glück etwas in der Adresszeile ihres Browsers ein. Einzelne Vorkommnisse oder vielfache Vorkommnisse nur einer IP sind deshalb in der Regel unbedeutsam.

Zurück