Blog

Cheat Sheet: Regular Expressions (RegEx) für das Online Marketing

Hier finden Sie eine Übersicht der wichtigsten Ausdrücke

Regular Expressions (RegEx, deutsch “Reguläre Ausdrücke”) dienen dazu, Zeichenketten zu definieren. Im Online Marketing praktisch verwendet werden sie zum Beispiel, um URLs mit bestimmten Merkmalen wie einem gleichen Verzeichnis oder einer bestimmten TLD zu beschreiben. In diesem Beitrag zeigen wir die wichtigsten Anwendungsfälle für den Online Marketing Alltag.

Anwendung von RegEx im Online Marketing

Regular Expressions sparen Zeit und helfen bei Definitionen, zum Beispiel:

  • In der .htaccess müssen nicht alle URLs einzeln weitergeleitet werden, sondern gewisse Muster können einfach in andere Muster weitergeleitet werden.
  • In Google Analytics können Domains und URLs für Filter festgelegt werden.
  • In zahlreichen Tools, zum Beispiel bei A/B Testing-Tools in der Conversion-Optimierung, lassen sich so bestimmte Seitentypen definieren. 

Die wichtigsten Ausdrücke

Ausdruck Beispiel(e) Erklärung
[] [0-9][A-Za-z0-9] Genau eine Ziffer soll vorkommen. (Bindestriche definieren einen Bereich) Ein beliebiger Großbuchstabe oder ein beliebiger Kleinbuchstabe oder eine beliebige Ziffer
.   Ein beliebiges Zeichen
\ www\.domain\.de Metafunktion aufgehoben (der Punkt ist im Beispiel als ein Punkt und kein Platzhalter zu interpretieren)
\s   Ein Whitespace (Steuerzeichen) = Leerzeichen, Zeilenumbruch, Tabulator, etc.
\d   Eine beliebige Ziffer
^ 1. [^0]2. ^www Falls in Klammer [] : Negiert nachfolgende Zeichenauswahl (Beispiel: Alles außer der Zahl 0 darf vorkommen) Sonst: Zeile beginnt mit der Zeichenkette „www“
! !html Negierung: Alles außer die nachfolgenden Zeichen soll berücksichtigt werden
? Domain.de\/? Das direkt davor stehende Zeichen kann vorkommen, muss es aber nicht. (Beispiel: Trailing Slash kann vorhanden sein)
* [a-z]* Der voranstehende Ausdruck darf beliebig oft (auch 0 mal) vorkommen
+ [a-z]+ Der voranstehende Ausdruck muss mindestens einmal vorkommen
$ \?$ Zeile oder String endet mit vorangehendem Zeichen (Beispiel: Eine URL endet mit einem Fragezeichen)
() (\.pdf)$ Gruppiert mehre Zeichen zu einer zusammenhängenden Zeichengruppe, um Teilmuster zu erfassen (Beispiel: PDF-URLs sollen gefunden werden.)
$1   Rückwärtsreferenz auf eine Gruppe bzw. ein Teilmuster. Vor allem für das Suchen und Ersetzen wichtig. $1 bezieht sich auf die erste Klammer / Gruppe.
| (a|A) Agiert als ODER. Nur einer der beiden Zeichen(-ketten) darf vorkommen

Beispiele für Anwendungen

Im Online Marketing lassen sich Regular Expressions häufig einsetzen, um mit vergleichsweise wenig Aufwand umfangreiche Auswertungen und Einstellungen vorzunehmen. Nachfolgend sind Anwendungsbeispiele aufgeführt, um eine Hilfestellung für Einsatzgebiete zu geben.

Filtern in Google Analytics

Ein häufiges Einsatzgebiet von Regular Expressions bei Google Analytics ist der Seitenreport (Alle Seiten). Hier lassen sich beispielsweise mehrere Seiten gleichzeitig anzeigen, die durch die einfachen Filter nicht zu erreichen wären. Wenn Seiten keine gleichen Merkmale haben (Seitenpfad o.ä.), ist es nicht Möglich, diese mit dem "Enthält"-Filter zu erreichen. Durch die Pipe | lassen sich einzelne URLs hintereinander in das Suchfeld eintragen, sodass diese gefiltert ausgegeben werden:

/kompetenzen/lösungen.html|/ueberuns/firmenportrait.html
Der Report wird mit diesem Filter beide URLs anzeigen.

Auch bei Filtern von Datenansichten sind Regular Expressions häufig hilfreich. Bei einer Website, auf die mehrere Domains (.com, .de, Subdomains, ...) geschaltet sind, können Regular Expressions bei der Erstellung eines Hostname-Filters zur Vermeidung von Spam helfen: 

.*domain\..*
Durch diesen Filter werden alle Hostnames zugelassen, die den Domainnamen beinhalten. Durch .* sind alle Zeichenketten vor und nach dem Namen eingeschlossen.

301-Weiterleitungen mit der .htaccess

Möchte man nach beispielsweise einem Relaunch eine nicht sehr einfache URL auf eine neue weiterleiten, so lässt sich dies einfach mit Regular Expressions durchführen:

Redirect 301 ^/jobs/?$ www.domain.de/karriere/
  • Durch das Zirkumflex (^) vor "/jobs/" wird sichergestellt, dass nur die URLs, die mit "/jobs/" beginnen, betroffen sind.
  • Das Fragezeichen bedeutet, dass der zweite Slash (/) optional ist. Auch der Pfad, der "/jobs" lautet, wird weitergeleitet.
  • Das Dollarzeichen schließt die URL nach dem Slash (/) oder dem "s" von "jobs" ab. Dadurch sind keine URLs aus Unterverzeichnissen betroffen.

 

 

 

Nehmen Sie mit uns Kontakt auf. Wir beraten Sie gerne.