ArchiveBox

archivebox

Archivierung von Webseiten

Voraussetzung (Meine Konfiguration)

  • Proxmox
  • LXC Ubuntu 22.04-3
  • Docker
  • Docker-Compose
  • Portainer

Was ist ArchiveBox?

Da ich gerade beruflich viel im Netz recherchiere um Informationen zu sammeln, hat sich über die Jahre eine schon fast unüberschaubare Anzahl an Lesezeichen in meinem Browser angesammelt. Diese kann man durchaus sortieren, in dem man Ordner und Unterordner usw. anlegt. Irgendwann landet man bei Browsererweiterungen, um diese weiter zu kategorisieren. Das sieht dann zwar ganz ordentlich aus, aber in dem Sammelsurium die richtige Webseite, mit genau den Informationen zu finden die man gerade braucht, bleibt Zeit aufwendig und Nerven raubend. Hat man dann die Webseite gefunden die man vor Monaten oder Jahren besucht hatte, existiert diese unter Umständen gar nicht mehr oder die gesuchten Informationen sind verschwunden.

Manchmal will man auch einen Snapshot von einer Webseite erstellen, wenn es unter Umständen um rechtliche Beweise geht.

Hier hilft ArchiveBox weiter. Diese läuft direkt im Browser und kann z. B als Browsertab permanent angeheftet werden. Somit hat man immer einen schnellen Zugriff. Will man nun eine Webseite archivieren, reicht es die URL Adresse in die ArchiveBox ein zu fügen. Archivbox erstellt nun ein aktuelles Abbild der Webseite in verschiedenen Formaten:

Chrome SingleFile
Chrome PDF
Chrome Screenshot
Wget HTML
Archiv.org
Original
Headers
Chrome HTML
Readability
Mercury
Media
Git

Die Webseite lässt sich über #hashtags kategorisieren. Somit lassen sich alle Webseiten über Suchbegriffe durchsuchen und übersichtlich darstellen.

Installation über Portainer

In Portainer gehen wir in das Menü Settings.

Dort fügen wir unter App Templates folgende URL ein:

				https://raw.githubusercontent.com/pi-hosted/pi-hosted/master/template/portainer-v2-amd64.json
			

Dann gehen wir in das Menü –> App Templates und geben im Suchfeld ArchiveBox ein und wählen dieses aus.

Die Standardeinstellungen können soweit übernommen werden.

Port mapping:

Port 8002

Ist dieser bereits durch einen anderen Container belegt, dann nach belieben ändern, ansonsten so lassen.

Volumen mapping:

Man kann das so lassen.
Hat man jedoch eine eigene Docker Ordnerstruktur, kann man diese hier anpassen.

Meine Docker Installation befindet sich unter:

				/var/lib/docker

Also ändere ich den host auf: 

/var/lib/docker/volumes/archivbox
			

Ist das erledigt, klicken wir auf Deploy the container.

ArchiveBox ist erreichbar unter: http://deine-ip:8002

Nun müssen wir noch einen Admin User anlegen:

Über Portainer:

Im Menü Containers auf –> archivbox und in den Container Details wählen wir >_ Console:

Wir logen uns als archivebox in den Container ein:

Dort geben wir folgenden Befehl ein und folgen den Anweisungen für die Erstellung eines Administrator:

				archivebox manage createsuperuser
			

Benutzername:
E-Mailadresse:
Passwort:

Alternativ direkt über SSH im Terminal

Logt euch auf eurem Server per SSH ein.

Dann müssen wir herausfinden wie unser Container heißt:

				docker ps
			

Dann logen wir uns in den Container ein:

(im LXC Container gibt es nur root, daher funktioniert es zumindest bei mir nur über Portainer.)

				docker exec -it -u archivebox /bin/bash
			

Und führen hier den Befehl aus:

				archivebox manage createsuperuser
			

Benutzername:
E-Mailadresse:
Passwort:

Quellen

Schreibe einen Kommentar