1000-00-02 | Notizen zum 'autojournal'
Notizen zum 'autojournal'
09/2023: (1) HTML/CSS. Verbesserte Aufbereitung von Quellenverweisen.
08/2023: (1) Der HTML-Generator verwendet im Haupttext eines Artikels paragraphs <p>
statt schnöder Zeilenumbrüche <br>
. Das verspricht bessere Lesbarkeit und Strukturierbarkeit der Texte (Absätze, Gedichtverse) und kommt Lebensformen auf Kohlenstoff- aber auch Siliziumbasis entgegen. Ich selbst habe bei dieser Modifikation wieder viel über C und noch mehr über HTML gelernt. Dafür wurden bestimmt ein paar Kindheitserinnerungen gelöscht... (2) Optionaler Filter „Ordinalzahl“ als weiterer Kommandozeilenparameter. Verarbeitet nur Beiträge aus dem angegebenen Jahrgang und reduziert entsprechend die Lesezugriffe auf Text-Quellen und die Schreibzugriffe auf HTML-Zieldateien. Das schont die Flash-Zellen in einer SSD und bringt bei konventioneller HDD einen spürbaren Geschwindigkeitsvorteil. Es wird aber immer eine neue Indexseite und Sitemap erstellt. (3) Implementierung „typografische Anführungszeichen“ (99-66-Regel) in deutschem Text.
07/2023: Kleinere Korrekturen im Programm, einige „Bugs“ behoben. Dieses „C“... macht richtig Spaß!
06/2023: Auto-Generierung einer Sitemap für das Journal. Auf der Verzeichnisebene wird zusätzlich zu index.htm
eine sitemap.xml
mit relativen oder absoluten Links auf sämtliche aktuell vorliegende Artikel des Journals generiert. Für die wünschenswerte absolute Adressierung muss autojournal
die Basis-URL des Journals, also den Namen des HTTP-Servers kennen. Dafür setzt man im oberen Teil der Seitenvorlage eine Kommentarzeile, die Protokoll und URL angibt, z. B.:<!-- http://meine-homepage.de/journal/ -->
05/2023: (1) Schalter für aufsteigende Datumssortierung kommt weg. (2) Paradigmenwechsel: Schluss mit dem Gepfriemel. Eine Indexseite, eine Unterseite pro Artikel. (3) Dedizierte Platzhalter für dezimale Datumskomponenten Jahr, Monat, Tag. Kannste Dir sogar das idiotische US-Format basteln. (4) Kommentarzeilen aus der Seitenvorlage sind in den auto-generierten Zieldateien nicht mehr enthalten.
04/2023: In JPEG-Dateien enthaltener Kommentartext wird automatisch gelesen, um die Attribute img title
und img alt
für eingebettete Bilder sinnhaftig zu befüllen.
Technisch-ideologische Klarstellung: Das JPEG-Kommentarfeld ist Teil der Standardisierung des JPEG-Dateiformats (JFIF) und kann in jeder „JPEG-Datei“ drin sein, muss aber nicht. Das hat ausdrücklich nichts mit EXIF zu tun, jenem Schwachsinn, der erst später eingeführt wurde, um ordnungsfanatischen Fotografen die Eier zu kraulen und Menschen, die versehentlich unbearbeitete Fotos von Digitalkamera oder Smartphone irgendwo hochladen, bloßzustellen.
Es ist bekanntlich besser, alle Bilder, die für's Web oder „Soziale Netzwerke“ bestimmt sind, vor dem Upload nachzubearbeiten und zu verkleinern, damit sie keine verstörenden Details preisgeben und nicht unnötig viel Speicherplatz verschwenden... Doch an die EXIF-Metadaten denken bei der Nachbearbeitung die Wenigsten. So weiß nach dem Upload die ganze Welt bescheid über Aufnahmezeit, Datum, Kameratyp, Kameraeinstellungen und gegebenenfalls auch Geokoordinaten und Seriennummern der verwendeten Geräte oder der verwendeten Software. Alles Informationen, die von Datenkraken und Neulandbullen Cyber-Ermittlern gern zur Profilbildung und letztlich gegen Dich eingesetzt werden.
Nun kann aber jede brauchbare Grafiksoftware, wie IrfanView, XnView, Gimp, und so manches pfiffige Kommandozeilenprogramm (Tipp: 'ExifTool') diese EXIF-Daten verändern oder komplett beseitigen. Letzteres ist im Sinne der Datensparsamkeit sicherlich die vernünftigere Variante. Da die komprimierten Bilddaten bei Manipulationen in den Metadaten normalerweise nicht angefasst werden, bleibt die Bildqualität in vollem Umfang erhalten.
Kein EXIF-Gedöns, aber ein aussagekräftiger JPEG-Kommentar. Bild und Bildbeschreibung in derselben Datei ohne unnötigen Ballast. SO soll es sein.
Unbegreiflich, warum man in einem namhaften CMS erst eine Eingabemaske bemühen muss, um HTML-Text für alt
und title
manuell zu edieren. Schlimmer noch, die für den Web-Export unerwünschten EXIF-Daten werden nicht etwa automatisch entfernt, sondern einfach durchgewunken. Oh, es scheint da ein „Plugin“ zu geben, das die Entfernung dieser verfänglichen Daten besorgen soll. Mit Standardeinstellungen gibt's mal wieder null Sicherheit und jeder Furz muss dazugebucht werden. Das ist wohl dieses „professionelle Arbeiten“, von dem man immer wieder hört...
Bei JPEGs, die kein JFIF-Kommentarfeld enthalten, oder Grafikformaten, die keinen eingebetteten Kommentar unterstützen, nutzt autojournal
weiterhin eine Kombination aus Artikelnamen und Dateinamen.
To-Do: Meta-Daten von TIFF und PNG mal unter die Lupe nehmen.
03/2023: Endlich gibt's Platzhaltersymbole, die im regulären Seitenquelltext (also das, was ich anfangs als „statischen“ Teil der Seitenvorlage bezeichnet habe) vierstellige Zahlenstrings bereitstellen, die den gegenwärtigen, vorherigen und nachfolgenden Jahrgang bezeichnen. Damit lassen sich unter anderem klickbare Verweise auf benachbarte Jahrgangsseiten erstellen.
01/2023: Auf jeder Jahrgangsseite steht ein Teilverzeichnis mit direkten Verweisen auf Artikel innerhalb derselben Seite (intra page links). Darüber hinaus wird nur noch genau eine Indexseite mit einem Vollverzeichnis erzeugt, das Links zu allen vorhandenen Artikeln bereitstellt. Besucher, die per Suchmasschinentreffer auf einer Jahrgangsseite landen, können innerhalb derselben Seite übersichtlich navigieren, ohne weiteren Traffic zu verursachen, oder auch schnell zur Übersichtsseite mit den anderen tollen Artikeln springen. Suchmaschinen erkennen das Navigationsmenü auf einer Seite als „Table of Contents“ und erfassen die Seiten-Struktur systematischer.
12/2022: Mein anfängliches Konzept sah noch keine Veränderungen am HTML außerhalb der für autojournal
markierten Abschnitte vor. Nun, da habe ich mich eines Besseren belehren lassen. Bei Seiten mit unterschiedlichem Inhalt sollte sich mindestens der <title>-Tag im Kopfbereich unterscheiden, damit der Benutzer im Browser unterschiedlich benannte Titel und Tabs sieht und Suchmaschinen keine gleichlautenden Seitentitel abstrafen.
Die Dateiendung der Seitenvorlage kann entweder ".htm"
oder ".html"
lauten. Die Vorgabe wird erkannt und konsistent für alle automatisch erzeugten Seiten übernommen.
Seit einiger Zeit wertet Wenn Seitenvorlage und Beispielcode dem jeweiligen Standard entsprechen, werden die automatisch generierten Seiten ebenfalls syntaktisch korrekt sein.autojournal
die DOCTYPE-Deklaration in der Seitenvorlage aus und erzeugt einige Strukturelemente gezielt in HTML4 bzw. HTML5.