SEO-Tool selbst gebaut: Open Source statt Cloud-Abo

Autor: Thomas Gattinger

Inhalt

Software, die bei der Suchmaschinenoptimierung unterstützen soll, gibt es wie Sand am Meer. Die SEO-Anbieter dieser Welt haben vermutlich längst alles entwickelt, was man braucht, um eine Website fit für Suchmaschinen zu machen. Warum also ein neues Tool programmieren?

Es ist ein Experiment: eigene, KI-gestützte Softwareentwicklung gegen SaaS. Open Source gegen Cloud-Abo. Ein Versuch, die Zusammenarbeit von Mensch und Maschine an einem realen Projekt auszureizen. Eine erste Version (v0.1.0) liegt inzwischen als Open Source auf Codeberg und lässt sich auf dem eigenen Rechner ausführen.

Die Idee

Mein Projekt PlentyONE-Daten sichern: ERP-Backup lokal nutzbar machen hat gezeigt, dass sich mit KI-Unterstützung Software-Lösungen bauen lassen, die reale Probleme im E-Commerce lösen und dabei echte Kosten sparen: Das SaaS-ERP-Abo ließ sich früher kündigen, weil die Daten über eine lokale Datenbank zugänglich blieben.

Kurz nach Abschluss dieses Projekts rückte die nächste SaaS-Software in den Fokus: mein Seobility-Abo. Die Frage war dieselbe wie beim ERP — weiter monatlich bezahlen, oder genau die Funktionen, die ich täglich brauche, in einem eigenen Tool nachbauen?

Einige Stunden Brainstorming mit Claude später stand die Software-Architektur. Von dort war der Weg zur lauffähigen Software nicht mehr weit.

Onpage-Optimierung neu gedacht: was LLMs können und was nicht

Eine wichtige Erkenntnis aus der KI-gestützten SEO-Arbeit an Eventlights.shop: LLMs (Large Language Models) sind stark darin, Texte zu schreiben, Inhalte zu analysieren und Verbesserungen vorzuschlagen. Aber sie sind erstaunlich schlecht darin, Websites systematisch auszulesen — also zu crawlen.

Man kann einen KI-Assistenten bitten, eine einzelne HTML-Seite einzulesen und zu analysieren. Mit etwas Glück sind es fünf bis zehn Seiten. Ab da ist Scheitern vorprogrammiert: Der Token-Verbrauch steigt zu stark, der Kontext läuft über, brauchbare Ergebnisse sind nicht mehr zu erwarten.

Genau hier setzt das Tool an: Websites systematisch crawlen, technische Parameter prüfen — und die Ergebnisse strukturiert ablegen, sodass ein LLM damit gezielt weiterarbeiten kann. Die fehleranfällige Fleißarbeit übernimmt der Crawler, die inhaltliche Bewertung bleibt dort, wo sie hingehört: bei Mensch und KI gemeinsam.

Was das Tool prüft

Der Crawler arbeitet sich von der Startseite aus durch die interne Verlinkung und prüft jede gefundene Seite gegen rund 80 Einzelregeln. Sie verteilen sich auf gut ein Dutzend Themenblöcke:

  • HTTP-Status & Erreichbarkeit — Weiterleitungen, 4xx-/5xx-Fehler, Abruf-Fehler, Soft-404
  • Indexierbarkeit & Crawler-Steuerung — noindex/nofollow, Canonical-Probleme, robots.txt, Abgleich mit der Sitemap
  • Meta & Snippet — Title- und Description-Länge, Open Graph, Viewport, Zeichensatz
  • Seitenstruktur & Semantik — H1-Logik, Überschriften-Hierarchie, strukturierte Daten (JSON-LD)
  • Bilder — fehlende, leere oder zu lange Alt-Texte, fehlende Bildmaße, veraltete Formate
  • Links — defekte interne Links, externe Links auf Fehlerseiten, verwaiste und zu tief vergrabene Seiten
  • URL-Hygiene — überlange URLs, Session-IDs, Großbuchstaben, dynamische Parameter
  • Eingebundene Ressourcen — Mixed Content, unkomprimierte Dateien, fehlende Cache-Header
  • Internationalisierung — hreflang-Konsistenz (Rücklinks, x-default, ungültige Sprachcodes)
  • Performance — Antwortzeit, Komprimierung, HTML-Größe
  • Sicherheit — HTTPS, HSTS, fehlende Security-Header

SEO-Tool Report
Crawl-Report nach einem Testlauf auf eventlights.shop: Die wichtigsten Probleme auf einen Blick, mit Schweregrad und Seitenanzahl.
SEO-Tool Kategorien
Alle Befunde nach Kategorie: Das Tool gruppiert die Ergebnisse in Themenblöcke wie Sicherheit, Technik & Performance oder Bilder, damit man gezielt arbeiten kann.

Jeder Befund ist nach Schweregrad eingestuft — Fehler, Warnung oder Hinweis — und kommt mit einer Klartext-Erklärung: was geprüft wurde, warum es relevant ist und wie man es behebt.

SEO-Tool Detailseite
Detail-Report zu einer URL, alle Befunde werden mit einer kurzen Erklärung angezeigt.

Bewusst weggelassen habe ich die schwachen Heuristiken aus den 2010er-Jahren — Keyword-Dichte, Termfrequenz und ähnliche Rechenspiele. Sie helfen heute kaum noch jemandem und täuschen eine Präzision vor, die es nicht gibt.

Wie es gebaut ist

Das Tool ist absichtlich schlank gehalten: Python im Hintergrund, eine leichtgewichtige Weboberfläche im Browser, alle Daten in einer lokalen SQLite-Datei. Es braucht keine Cloud, keine Registrierung, keinen externen Dienst. Wie man es einrichtet und startet, ist kurz in der README auf Codeberg beschrieben.

Nach dem Start öffnet sich die Oberfläche automatisch im Browser. Man trägt eine Start-URL ein, setzt ein Seitenlimit — und der Crawl läuft los. Ein Höflichkeits-Limit sorgt dafür, dass der Crawl Server nicht überlastet.

SEO-Tool Start
Die Startseite des Tools: URL eingeben, Seitenlimit setzen, Crawl starten — fertig. Alle Daten bleiben lokal auf dem eigenen Rechner.

Unter der Haube läuft Python 3.12 mit FastAPI und einer kleinen, lokal ausgelieferten Weboberfläche. Den Crawl-Fortschritt zeigt das Tool live an — leichtgewichtig über HTMX, ohne ein schweres JavaScript-Frontend.

Open Source, frei verfügbar

Ein wesentliches Problem vorhandener kommerzieller Lösungen: Sie sind teuer. Die meisten sind als SaaS-/Cloud-Lösungen konzipiert und werden mit immer neuen Funktionen überladen, um die laufenden Kosten zu rechtfertigen. Die Oberflächen werden moderner und damit oft schwerfälliger. Die Daten liegen auf fremden Servern — und sind dort viel zu oft auch „eingesperrt“.

Ganz anders bei Open Source: Jemand baut Software für den eigenen Bedarf, teilt sie mit anderen, und wer möchte, kann sie verbessern. Oft kommt dabei etwas Großartiges heraus — weite Teile des Internets laufen mit freier Software.

Ich habe selbst enorm von Open Source profitiert und möchte etwas zurückgeben: Das SEO-Tool steht auf Codeberg unter der freien AGPL-3-Lizenz. Mitarbeit ist ausdrücklich willkommen.

Meine SEO-Philosophie

Die technischen Aspekte einer Seite müssen passen. Sie muss schnell sein, Links müssen funktionieren, diverse Parameter müssen korrekt eingestellt sein, bestimmte Texte sollten die richtige Länge haben. Das ist alles relativ simpel — und genau hier hilft das Tool, auch umfangreiche Seiten unter Kontrolle zu halten.

Und dann zählt vor allem eines: sehr guter Content. Die Inhalte müssen nützlich sein. Für Menschen, für Suchmaschinen, für KI-Crawler und Agenten. Keine Tricks, kein „für Suchmaschinen optimieren“ oder „für KI optimieren“ — die Inhalte müssen einfach nützlich sein. Gut lesbar für Menschen, gut nutzbar für Maschinen.

Guter Content muss strategisch geplant und sorgfältig erstellt werden. Mensch und KI-Assistent können dabei symbiotisch zusammenarbeiten, um hohe Qualität zu produzieren. KI sollte genutzt werden, um Qualität zu steigern und Inhalte überhaupt erst zu ermöglichen — nicht primär, um Kosten zu drücken und Texte am Fließband auszuwerfen.

Was das Tool bewusst nicht macht

Das SEO-Tool ist auf den Onpage-Bereich konzentriert, also auf alles, was sich auf der eigenen Seite abspielt. Offpage-Funktionen wie Keyword-Rankings, Backlinks oder Konkurrenz-Beobachtung sind nicht geplant.

Der Crawler ist für klassische, server-gerenderte HTML-Seiten ausgelegt, bei denen alle notwendigen Daten bereits beim Aufruf in der HTML-Datei stehen. Eine Ausführung von JavaScript durch einen Headless-Browser ist nicht vorgesehen — ebenso wenig die Analyse von Web-Apps, deren HTML im Wesentlichen dynamisch im Browser entsteht.

So kannst du es nutzen

Die Scripts sind als Open Source unter der AGPL 3 frei auf Codeberg verfügbar. Zum Betrieb braucht es nur Python, das für Windows, macOS und Linux kostenlos erhältlich ist. Damit lässt sich das Tool lokal am Arbeitsrechner oder auch auf einem eigenen Server starten.

Mittelfristig plane ich, eine gehostete Version auf meinem Server frei zugänglich zu machen, sobald das Tool die nötige Reife hat. Das ist aber Zukunftsmusik — im Moment geht es um die lokale, quelloffene Version, die jetzt schon läuft.

Es ist eine erste Version, und sie wird aktiv weiterentwickelt. Über Rückmeldungen, Fehlerberichte oder Beiträge auf Codeberg freue ich mich.


Steckst du in einer ähnlichen Situation — ein Cloud-Abo, das du hinterfragst, oder eine Website, deren technisches SEO und Content du auf Vordermann bringen willst? Dann melde dich gerne für einen Beratungstermin.

Über mich

Ich unterstütze Unternehmen bei E-Commerce-Projekten – Shops, Marktplätze, Schnittstellen, Content und digitales Marketing. Hier schreibe ich über Themen aus der täglichen Arbeit.

Partner des Gütezeichens

Inhalt