Inhaltsverzeichnis

monolith

CLI tool for saving complete web pages as a single HTML file

Monolith ist ein Befehlszeilentool, das Webseiten als einzelne HTML-Datei speichert und alle Assets wie CSS, Bilder und JavaScript direkt in eine Datei einbettet. Dadurch entsteht eine exakte Offlinekopie der Seite, ohne dass eine Netzwerkverbindung erforderlich ist.

Zu den Kernfunktionen von Monolith gehören das Bündeln von Assets in Daten-URLs, der Ausschluss von Assets wie Skripten, Bildern oder Videos, die Unterstützung von Cookies und die Möglichkeit, einzuschränken, von welchen Domänen Assets abgerufen werden. Es führt kein JavaScript aus, ermöglicht aber die Vorverarbeitung dynamischer Inhalte mit Tools wie Chromium.

Für Forscher, Datensammler oder alle, die Webseiten genau so erfassen müssen, wie sie online erscheinen, ist Monolith eine großartige Ergänzung Ihres Toolsets. Ziehen Sie es in Betracht, wenn Sie Webseiten für die Offline-Verwendung archivieren oder als Snapshot speichern müssen, wobei das Erscheinungsbild erhalten bleiben soll, ohne dass Assets der Originalseite verloren gehen.

Installation

Arch Linux

Installiere das monolith Paket.

Verwendung

siehe monolith –help oder hier

Beispiel (Statische Seite)

monolith -avIo beispiel.htm https://www.suletuxe.de/

Beispiel (Dynamische Seite)

Brave Browser als Präprozessor

brave --headless --window-size=1920,1080 --run-all-compositor-stages-before-draw --virtual-time-budget=9000 --incognito --dump-dom https://archlinux.org 2>/dev/null | monolith -avfIb https://archlinux.org -o index.htm -
Option (Kurz) Option (Lang) Beschreibung
-a –no-audio Entfernt Audio Quellen
-v –no-video Entfernt Video Quellen
-f –no-frames Entfernt frames und iframes
-I –isolate Schneidet das Dokument vom Internet ab
-b –base-url Setzt eine eigene Basis Domain
-o –output Leitet die Ausgabe in eine Datei um

Siehe auch