fboës - Der Blog

Wie finde ich ähnliche Artikel in einem CMS?

So ziemlicher jeder Artikel, den man in ein CMS einträgt, verfügt über drei Eigenschaften, mit denen sich ähnliche Artikel finden lassen. Bei einer geschickten Verknüpfung dieser drei Eigenschaften bzw. Achsen kann man so als Redakteur dem Leser des Artikels sehr einfach verwandte Artikel anzeigen.

Diese drei Achsen sind:

  1. Inhalt: Welchen Schlagworten bzw. Themen kann dieser Artikel zugeordnet werden?
  2. Zeit: Welcher Zeitraum wird in dem Artikel beschrieben? Alternativ: Wann wurde der Artikel geschrieben.
  3. Ort: Welchen Ort beschreibt der Artikel? Nicht alle Artikel weisen diese Eigenschaft auf.

Über diese drei Achsen kann man Artikel finden bzw. miteinander vernetzen. Es ist also möglich, Artikel zu finden, die in inhaltlicher, zeitlicher oder räumlicher Nähe zueinander liegen. Auch ist es möglich, über diese Eigenschaften den Leser suchen zu gestatten, so dass er z.B. Einträge in einem bestimmten Zeitraum oder in der Nähe eines bestimmten Ortes finden kann.

Übrigens können nicht nur Artikel, sondern auch Bilder und Videos auf diese Weise ausgezeichnet werden.

Besonders spannend werden diese drei Achsen bei besonderen publizistischen Formaten, wie z.B. Nachrichten, Chronologien, Journalen oder Tagebüchern. Hier könnte man z.B. eine zeitliche und/oder räumliche Entwicklung nachvollziehen.

Strukturierte Daten erlauben strukturierte Suchen

Zur Unterstützung oder als Ersatz für Freitextsuchen eignen sich die drei Achsen sowieso. Sie können z.B. als erweiterte Suche den Zugriff auf Inhalte erlauben.

  1. Inhaltlich: Übereinstimmung mit einem oder mehreren Themen. Je mehr Übereinstimmungen, desto relevanter.
  2. Zeitlich:
    1. Suche in einem Zeitraum rund um ein Startdatum. Je näher am Startdatum, desto relevanter.
    2. Suche zwischen einem Start- und einem End-Datum.
  3. Räumlich:
    1. Suche in einem Umkreis rund um eine Start-Koordinate. Je näher an der Start-Koordinate, desto relevanter.
    2. Suche in einer Box, definiert durch zwei Koordinaten.

Gleichzeitig kann die Suche auch als REST-API zum Auffinden von Inhalten von extern wie intern verwendet werden. Dabei kann die API auch unterschiedliche Ausgabeformate (s.u.) zurückgeben.

Praktisch angewendet…

…bedeutet das nur, dass man jeden Artikel mit Tags, einem Datum und Geo-Koordinaten ausstatten muss. Während die ersten beiden Dinge in fast jedem CMS einfach zu bewerkstelligen sind, ist letzteres möglicherweise etwas schwieriger. Im Notfall muss man ein Freitext-Meta-Daten-Feld dafür zweckentfremden, und die Geo-Koordinaten durch ein Online-Tool ermitteln.

Ausgabe für den Leser

Dazu gibt es maschinenlesbare Formate, die je nach Achse einen Zugang ermöglichen:

  1. Inhalt inkl. Zeit & Ort: RSS, ATOM, JSON-RSS, MSN-Tiles
  2. Zeit inkl. Inhalt & Ort: ICS-Kalender
  3. Ort inkl. Inhalt & Zeit: KML, KMZ, GeoJson

Diese Formate erlauben u.a. auch die Verwendung der Daten in einem alternativen Darstellungs-Programm außerhalb des Browsers, wie z.B. Google Earth oder einer Kalender-App.

Zuletzt geändert am

fboës - Der Blog

Zur Übersichtsseite