Projekt-Status

AI Company System

Ein Multi-Agent-LLM-System, das wie ein echtes Unternehmen funktioniert – mit spezialisierten KI-Rollen, die Projekte autonom abarbeiten.

Gesamtfortschritt
Stufe 1 / 4
Das Konzept

Was ist das AI Company System?

🏢 Die Idee in einem Satz

Statt einer einzigen „Super-KI" wird ein ganzes digitales Unternehmen aus spezialisierten LLM-Agenten nachgebaut – mit CEO, Projektmanager, Workern, Kritikern und mehr – die wie echte Mitarbeiter zusammenarbeiten.

❓ Warum funktioniert das?

LLMs haben ein begrenztes Kontextfenster – sie können nicht alles auf einmal. Genau wie echte Mitarbeiter. Deshalb funktioniert Arbeitsteilung.

LLMs sind mit menschlicher Sprache trainiert – deshalb funktionieren auch menschliche Hierarchien und Strukturen bei ihnen. Klare Rollen, klare Verantwortung, klare Übergaben.

Qualität durch Checks & Balances – ein Kritiker-LLM findet Fehler, ein Pragmatiker filtert Übertreibungen, ein Integrations-Tester prüft das Zusammenspiel.

🎯 Das Ziel (finales System)

Ein vollautomatisches System mit 9 spezialisierten LLM-Rollen, einem Software-Orchestrator (kein Mensch), zentraler Projektakte, Error-Recovery und paralleler Aufgabenbearbeitung. Der Mensch gibt nur noch die Idee – der Rest läuft automatisch.

Rollen-Status

9 Rollen – 3 umgesetzt, 6 fehlen noch

Das finale System hat 9 spezialisierte Rollen. Das MVP konzentriert sich auf die 3 wichtigsten. Der Mensch übernimmt die restlichen 6 Rollen manuell.

📐
Planner
✓ Umgesetzt
⚙️
Worker
✓ Umgesetzt
🔍
Reviewer
✓ Umgesetzt
👔
CEO
Du (manuell)
📋
Projektmanager
Du (manuell)
⚖️
Schätzer
Du (manuell)
🎯
Pragmatiker
Fehlt
🧩
Integrations-Tester
Fehlt
📚
Researcher
Fehlt
Vergleich

Was wurde vereinfacht?

Das MVP wurde bewusst so vereinfacht, dass man das System sofort nutzen kann – ohne eigene Software entwickeln zu müssen. So lernt man erst die Engpässe kennen, bevor man automatisiert.

✅ Jetzt umgesetzt (MVP)
Orchestrator = Du
Du kopierst Aufgaben ins Terminal, startest Agents manuell, prüfst Ergebnisse selbst
3 LLM-Rollen
Planner, Worker, Reviewer – mit fertigen System-Prompts
Git = Sicherheitsnetz
Vor jedem Worker committen, bei Fehler zurückrollen
JSON-Dateien als State
plan.json, status.json, current-phase.json – manuell gepflegt
1 Reviewer = Critic + Pragmatist
Eine Rolle macht beides: kritisieren und filtern
Einfache Fehlerbehandlung
Max. 2 Versuche, dann als „blocked" markieren
🎯 Finales System (Ziel)
Software-Orchestrator
Python/n8n routet Nachrichten, startet Agents, aktualisiert State automatisch
9 spezialisierte Rollen
CEO, Planner, PM, Schätzer, Worker, Critic, Pragmatist, Integrator, Researcher
Automatische Parallelisierung
Orchestrator startet mehrere Worker gleichzeitig via API
Zentrale Projektakte
Auto-updated JSON/DB mit Status, Entscheidungen, Logs, Token-Tracking
3-stufiges Review
Critic → Pragmatist → Integrations-Tester (jeweils eigenes LLM)
Error-Recovery-Matrix
Retry-Logik, Eskalation an CEO, automatisches Task-Splitting bei Scheitern
Fertige Artefakte

Was konkret schon existiert

Folgende Dateien und Strukturen sind entwickelt und in der Testphase.

System-Prompts (fertig, getestet)

planner.md System-Prompt: Erstellt den vollständigen Projektplan aus einer Idee
worker.md System-Prompt: Führt einzelne Aufgabenpakete exakt aus
reviewer.md System-Prompt: Prüft Ergebnisse kritisch, listet Fehler auf

Projekt-Templates (fertig)

CLAUDE.md.fastapi Projekt-Template für Python/FastAPI-Projekte
CLAUDE.md.template Generisches Template (beliebiger Tech-Stack)
setup-project.sh Shell-Script: Erstellt komplette Projektstruktur + Git Init

Workflow-Dokumentation (fertig)

GUIDE.md Komplette Schritt-für-Schritt-Anleitung
QUICKREF.md Spickzettel mit den wichtigsten Befehlen
bookmark-api-plan.json Beispiel-Projektplan (Bookmark-API) zum Testen des Workflows

State-Management (fertig, manuell)

plan.json Projektplan mit Phasen, Aufgaben, Abhängigkeiten
status.json Aufgaben-Fortschritt (offen → in_arbeit → done/blocked)
current-phase.json Welche Phase gerade aktiv ist
Roadmap

Von hier zum fertigen System – 4 Stufen

Jede Stufe baut auf der vorherigen auf. Keine Stufe überspringen – jede liefert wichtige Erkenntnisse für die nächste.

Stufe 1: Alles manuell Jetzt – In der Testphase

Du bist der Orchestrator. Du kopierst Aufgaben, startest Agents im Terminal, prüfst Ergebnisse selbst, pflegst den Status manuell. Ziel: Verstehen, wo die Engpässe und wiederkehrenden Muster sind.

  • 3 Rollen mit System-Prompts (Planner, Worker, Reviewer)
  • Projekt-Templates + Setup-Script
  • JSON-basiertes State-Management
  • Git als Sicherheitsnetz und Undo-Button
  • Anleitung + Quickref für den manuellen Workflow
  • Beispiel-Projekt (Bookmark-API) zum Testen
2
Stufe 2: Shell-Scripts für Repetitives Nach 2–3 abgeschlossenen Projekten

Alles, was du immer wieder gleich machst, wird zu einem Script. Du bleibst der Orchestrator, aber die Schritte werden schneller.

  • auto-worker.sh – Git-Commit + Worker-Start + Changelog in einem Befehl
  • auto-review.sh – Review-Start + Ergebnis in reviews/ speichern
  • status-update.sh – Task-Status automatisch in status.json setzen
  • next-tasks.sh – Zeigt an, welche Tasks als nächstes starten können (keine Abhängigkeiten mehr offen)
  • Pragmatiker als 4. Rolle hinzufügen (filtert Reviewer-Kritik)
  • Automatisches Logging aller Agent-Calls in log.jsonl
3
Stufe 3: n8n / Python als Orchestrator Wenn die Muster klar sind

Der Mensch wird durch Software ersetzt. Ein n8n-Workflow oder Python-Script steuert den gesamten Ablauf: API-Calls, Routing, State-Updates, Parallelisierung.

  • Orchestrator-Service – Steuert den kompletten Agent-Pipeline-Flow
  • LLM-API-Integration – Anthropic API direkt aufrufen statt Claude Code Terminal
  • Parallele Worker – Mehrere Worker gleichzeitig via asyncio/Promise.all
  • Alle 9 Rollen – CEO, PM, Schätzer, Critic, Pragmatist, Integrator, Researcher hinzufügen
  • Zentrale Projektakte – Auto-updated nach jedem Schritt (JSON oder PostgreSQL)
  • Kontextfenster-Management – Nur relevante State-Ausschnitte an jeden Agent
  • Error-Recovery – Retry-Matrix mit max. Loops, Eskalation, Task-Splitting
  • Token-Tracking & Kosten – Pro Agent-Call loggen: Tokens rein/raus, Dauer, Kosten
  • Telegram-Bot – Statusmeldungen: Phase fertig, Fehler, Projekt abgeschlossen
4
Stufe 4: Vollautomatisch Langfristig

Der Mensch gibt nur noch die Projektidee. Das System plant, schätzt, verteilt, arbeitet, prüft, korrigiert und liefert das fertige Ergebnis. Mensch hat nur noch Freigabe-Rolle.

  • Idee → Ergebnis – Ein API-Call oder Telegram-Nachricht startet alles
  • RAG-System – Wissensdatenbanken (Gesetze, Docs, Best Practices) für den Researcher
  • Selbst-Optimierung – System lernt aus vergangenen Projekten (optimale Paketgrößen, Prompt-Verbesserungen)
  • Multi-Projekt – Mehrere Projekte gleichzeitig abarbeiten
  • Dashboard – Web-UI mit Live-Status aller Projekte, Phasen, Kosten
  • Human-in-the-Loop nur noch bei Eskalationen und finaler Freigabe

„Nicht eine Super-KI bauen, sondern ein digitales Unternehmen nachbauen – mit klaren Rollen, klaren Verantwortlichkeiten und klaren Übergaben."