Bits'n'Bytes | Einträge für September 2014

Fußnoten von MultiMarkDown zu Wordpress konvertieren (und zurück)

Geschrieben von Thomas Hochstein am Sonntag, 28. September 2014

Wir Juristen lieben Fußnoten … oder verwenden sie jedenfalls mit Vorliebe und in großer Zahl und Länge - eine juristische Arbeit ist nur echt, wenn mindestens ein Drittel, besser die Hälfte der jeweiligen Seite oder mehr von einem Fußnotenapparat in Anspruch genommen wird.

Dieses Feeling will man natürlich auch beim Web-Publishing nicht vermissen; hier kommt Wordpress zu Hilfe, gibt es doch verschiedene Plugins für eine Fußnotenverwaltung, von denen mir bisher footnotes am besten gefällt. Man kann seine Fußnoten einfach im Fließtext an der passenden Stelle ergänzen, entweder in eckigen Klammern: ((...)) oder in Tags wie <fn>...</fn> oder ganz anders. Am einfachsten erscheint mir dabei die erstgenannte Möglichkeit, und da das Plugin umfangreiche Anpassungen auch des CSS direkt in der Konfiguration erlaubt, funktioniert das auch recht gut.

Nun schreibe ich meine Blogbeiträge in der Regel in Markdown, und auch das kann Wordpress natürlich verarbeiten. Was liegt also näher, als Blogbeiträge erst in einem Markdown-Editor vorzubereiten und dann am Ende in Wordpress (oder Serenidpity, natürlich) einzufügen? Umso mehr, als auch Scrivener als ein mögliches Ausgabeformat MultiMarkdown kennt?

Das Problem dabei ist allersings, dass Fußnoten zwar in MultiMarkdown (wenn auch nicht in “purem” Markdown) unterstützt werden, das Format da aber anders aussieht; dort ist nämlich an der Stelle, wo das Fußnotenzeichen im Text stehen soll, nicht etwa - wie bei den Wordpress-Plugins - der gesamte Fußnotentext einzufügen, sondern nur ein Platzhalter in der Form [^x], wobei x für eine beliebige Zeichenfolge steht. Die Fußnoten werden dann - wie im Ausgabeformat ja auch - am Ende des Textes in der Form [^x]: ... eingefügt. Das hat zwar den Nachteil, dass man einen Zähler hochzählen muss und Schwierigkeiten bekommt, wenn man eine Fußnoten “zwischendrin” einfügen will, ist aber besser lesbar - und für die Einfügerei hat man ja Tools wie Scrivener, die das bei der Ausgabe automatisch richtig machen.

Nur: wie bekommt man die Fußnoten im MultiMarkdown-Format dann in Wordpress, oder einen Text aus Wordpress wieder in einem verständlichen Format in den Markdown-Editor? Die ersten beiden Male habe ich das von Hand gemacht … Das geht. Aber es dauert. Und dauert. Und spaßig ist auch anders. Und: wozu gibt es Computer?

Also habe ich nach ein paar Versuchen - und einigen Blicken ins Perl-Kochbuch, das passenderweise ausgerechnet ein Dickhorn-Schaf auf dem Cover hat! - ein kurzes Script zusammengehackt, das erst die vergleichsweise einfache Aufgabe der Konvertierung des Wordpress-Formats ins MultiMarkdown-Format übernommen hat und dann um die Konvertierung in umgekehrter Richtung erweitert wurde, die eigentlich auch gar nicht so richtig komplex ist. Das funktioniert unter Linux wie auch - mit Activestate-Perl - unter Windows und tut seinen Zweck, auch wenn man das Problem sicherlich noch eleganter lösen könnte und es an jeder Fehlerbehandlung (und an Dokumentation bisher auch …) fehlt.

Wer auch vor diesem Konvertierungsproblem steht und wen der noch rohe Zustand des Scripts nicht abschreckt, der kann sich gerne im Git-Repository bedienen.

Struktur im Blog: Kategorien und/oder Tags?

Geschrieben von Thomas Hochstein am Sonntag, 21. September 2014

Die meisten Blogsysteme bieten dem Benutzer zwei Möglichkeiten, seine Inhalte zu strukturieren und zu systematisieren: Kategorien und Tags (Schlagworte). Zumindest die Kategorien können dabei regelmäßig eine Gliederung abbilden, d.h. Unterkategorien enthalten. Üblicherweise können einem Eintrag beliebig viele Tags, zumeist aber auch mehrere bzw. beliebig viele Kategorien zugewiesen werden.

Diese Optionen bieten nun eine Vielzahl von möglichen Wegen zur Strukturierung des eigenen Blogs. So kann man gänzlich auf Kategorien verzichten und die Einträge nur verschlagworten, entweder systematisch mit einem begrenzten Vorrat an Schlagworten, die möglichst häufig verwendet werden, oder als “stream of consciousness” die Kernthemen des jeweiligen Beitrags aufnehmen. Das andere Extrem wäre der Verzicht auf Tags zugunsten von Kategorien, mit denen die einzelnen Themen logisch gruppiert werden, wobei grundsätzlich durchaus überlappende Kategorisierungssysteme möglich sind, bei denen jedem Beitrag zwei oder mehr Kategorien - aus unterschiedlichen Taxonomien - zugewiesen werden. Schließlich ergeben sich vermittelnde Möglichkeiten. Die jeweiligen Vorgehensweise hängt dabei neben dem persönlichen Stil sicherlich auch in nicht geringem Maße von Art und Inhalts des Blogs ab.

Wer in seinem Blog bspw. den ganzen Bereich seines persönlichen und beruflichen Lebens sowie verschiedener Hobbys abbildet, wird Kategorien oft schon deshalb benötigen, um die völlig disjunkten Themenbereiche voneinander zu trennen. Finden sich bspw. Einträge zur Freizeit- und Urlaubsgestaltung - die insbesondere von Bekannten, Freunden und Familie gelesen werden - neben Beiträgen zum Geocaching - die andere Geocacher sehr, lebensältere Onkel und Tanten aber nun gar nicht interessieren - und fachlichen Beiträgen zur beruflichen Tätigkeit, bspw. als Systemadministrator oder Entwickler, und damit zusammenhängenden Freizeitprojekten, bietet es sich an, Kategorien wie Privates, Geocaching und Softwareentwicklung einzurichten und die letztgenannte bspw. noch mit den Unterkategorien Releases und Debian zu versehen. So können die Onkel und Tanten die Kategorie Privates abonnieren und die neuesten Fotos der Großnichten bewundern, Geocacher sich ihren Themenkanal suchen und die mehr am Bereich der Entwicklung interessierten Leser sich entscheiden, ob sie alles - die gesamte Kategorie mit allen Unterkategorien - mitbekommen möchten oder nur Ankündigungen neuer Versionen; zudem lassen sich Beiträge zu bestimmten Projekten - hier im Beispiel “Debian” - gesondert abrufen und auf diese Weise in einem Aggregator (”Planet”) zusammenfassen. Feinere Unterteilungen einzelner Bereiche machen das System dann aber bald unübersichtlich; verschachtelte Unterkategorien lassen irgendwann den Wald in lauter Einzelbäumen untergehen. Ist ein Blog hingegen “monothematisch”, können schon Kategorien auch eine feinere Unterteilung ermöglichen. Wer nur über “Software” schreibt, kann bspw. die Unterkategorien aus dem vorigen Beispiel als Hauptkategorien nehmen und sie für Ausnahmefälle noch um eine Kategorie für anderes oder privates ergänzen.

Wer so mit Kategorien arbeitet, wird irgendwann auch einmal vor dem Problem stehen, dass sich verschiedene divergente Sortierkriterien ergeben. Wollte man im obigen Beispiel den Bereich “Software” bspw. noch in “Webapplikationen” und “Shellscripts” oder nach der verwendeten Programmiersprache unterteilen, ergeben sich Überschneidungen zu den schon vorhandenen Kategorien. Hier würden dann sich überlappende Kategorisierungssysteme greifen, in denen Beiträgen bspw. sowohl die Kategorie “Debian” als auch die Kategorie “Webapplikation” zugewiesen werden, oder man delegiert die feinere Unterteilung an Tags. Das gleiche gilt für bestehende Reihen oder Serien, wie bspw. einen wöchentlichen “Linkdump”, der sich möglicherweise auch thematisch einordnen lässt, oder einen regelmäßige Reihe “Best practices”.

Wie arbeitet ihr in euren Blogs? Nutzt ihr Kategorien oder Tags, oder beides? Wie? Habt ihr euch ein ausgefeiltes System ausgedacht, oder ist das alles “dynamisch gewachsen”?

Über Antworten und Kommentare würde ich mich freuen.

Wie macht man heute Webstatistik?

Geschrieben von Thomas Hochstein am Dienstag, 2. September 2014

Ich erinnere mich noch, wie ich vor vielen Jahren - rund anderthalb Jahrzehnten - das Interesse an damals von mir zum Download bereitgestellten Dateien gemessen habe: Jeden Monat lud ich mir von meinem Webspaceanbieter die dort generierten Logfiles herunter, ließ auf meinem heimischen Rechner ein Auswertungsprogramm laufen und ergänzte liebevoll die Anzahl der jeweiligen Downloads im vergangenen Monat in Klammern hinter dem Namen der Datei. Anfangs fand ich das total spannend, nach einiger Zeit ziemlich nervig, und später bin ich dann auf ein Zählscript umgestiegen (Umleitung des Dateiabrufs über ein PHP-Script, das eine Datenbank fütterte).

Unabhängig davon ist es natürlich weiterhin interessant, wie intensiv die eigene Website von anderen genutzt wird. Insbesondere die Abrufe und Besuche - für diese Metriken gibt es natürlich vielfältige Definitionen - insgesamt, welche Seiten oder Dateien besonders oft aufgerufen werden, welche Suchbegriffe auf die eigenen Seiten führen (auch wenn Google das leider erschwert hat) und - für jede Seite oder Datei - wo diese verlinkt sind (Referrer-Auswertung). Zu diesem Zweck hat man früher [tm] einfach die Logs des Webservers ausgewertet, bspw. mit Webalizer oder AWStats. Heute - eigentlich schon seit vielen Jahren - liest man stattdessen von Google Analytics und Piwik (und den damit verbundenen Datenschutzproblemen).

Weil ich mit der Zeit gehen will, habe ich mir auch einmal Piwik installiert und nutze es bislang im Logdatei-Auswertungs-Modus. Das hat mich allerdings bislang nicht besonders überzeugt; es dauert teilweise gefühlt ewig, bis eine Auswertung vorliegt, und für mich interessante Statistiken - bpsw. die Referrerstatistik: von wo wurden bestimmte Seiten aufgerufen? - habe ich bislang zumindest nicht gefunden. Vielleicht ist das auch einfach der falsche Weg, mit Piwik umzugehen …

Daher die Frage in die Runde und an die geschätzte Leserschaft: Was benutzt der Blogger oder Webpublizist von heute zur Auswertung der Seitenaufrufe? Eher eine Auswertung der Logfiles? Oder eher einen Livedienst wie Google Anlaytics? Was genau benutzt ihr? Wie sind eure Erfahrungen?

Bonusfrage: Wie haltet ihr es mit Datenschutzerwägungen?

Hilfsweise: Welche Newsgroup, welches Forum ist die oder das richtige für solche Fragen?

Über Antworten und Kommentare würde ich mich freuen.