AI Company System – Status & Roadmap

Das Konzept

Was ist das AI Company System?

🏢 Die Idee in einem Satz

Statt einer einzigen „Super-KI" wird ein ganzes digitales Unternehmen aus spezialisierten LLM-Agenten nachgebaut – mit CEO, Projektmanager, Workern, Kritikern und mehr – die wie echte Mitarbeiter zusammenarbeiten.

❓ Warum funktioniert das?

LLMs haben ein begrenztes Kontextfenster – sie können nicht alles auf einmal. Genau wie echte Mitarbeiter. Deshalb funktioniert Arbeitsteilung.

LLMs sind mit menschlicher Sprache trainiert – deshalb funktionieren auch menschliche Hierarchien und Strukturen bei ihnen. Klare Rollen, klare Verantwortung, klare Übergaben.

Qualität durch Checks & Balances – ein Kritiker-LLM findet Fehler, ein Pragmatiker filtert Übertreibungen, ein Integrations-Tester prüft das Zusammenspiel.

🎯 Das Ziel (finales System)

Ein vollautomatisches System mit 9 spezialisierten LLM-Rollen, einem Software-Orchestrator (kein Mensch), zentraler Projektakte, Error-Recovery und paralleler Aufgabenbearbeitung. Der Mensch gibt nur noch die Idee – der Rest läuft automatisch.

Rollen-Status

9 Rollen – 3 umgesetzt, 6 fehlen noch

Das finale System hat 9 spezialisierte Rollen. Das MVP konzentriert sich auf die 3 wichtigsten. Der Mensch übernimmt die restlichen 6 Rollen manuell.

📐

Planner

✓ Umgesetzt

⚙️

Worker

✓ Umgesetzt

🔍

Reviewer

✓ Umgesetzt

👔

CEO

Du (manuell)

📋

Projektmanager

Du (manuell)

⚖️

Schätzer

Du (manuell)

🎯

Pragmatiker

Fehlt

🧩

Integrations-Tester

Fehlt

📚

Researcher

Fehlt

Vergleich

Was wurde vereinfacht?

Das MVP wurde bewusst so vereinfacht, dass man das System sofort nutzen kann – ohne eigene Software entwickeln zu müssen. So lernt man erst die Engpässe kennen, bevor man automatisiert.

✅ Jetzt umgesetzt (MVP)

Orchestrator = Du

Du kopierst Aufgaben ins Terminal, startest Agents manuell, prüfst Ergebnisse selbst

3 LLM-Rollen

Planner, Worker, Reviewer – mit fertigen System-Prompts

Git = Sicherheitsnetz

Vor jedem Worker committen, bei Fehler zurückrollen

JSON-Dateien als State

plan.json, status.json, current-phase.json – manuell gepflegt

1 Reviewer = Critic + Pragmatist

Eine Rolle macht beides: kritisieren und filtern

Einfache Fehlerbehandlung

Max. 2 Versuche, dann als „blocked" markieren

🎯 Finales System (Ziel)

Software-Orchestrator

Python/n8n routet Nachrichten, startet Agents, aktualisiert State automatisch

9 spezialisierte Rollen

CEO, Planner, PM, Schätzer, Worker, Critic, Pragmatist, Integrator, Researcher

Automatische Parallelisierung

Orchestrator startet mehrere Worker gleichzeitig via API

Zentrale Projektakte

Auto-updated JSON/DB mit Status, Entscheidungen, Logs, Token-Tracking

3-stufiges Review

Critic → Pragmatist → Integrations-Tester (jeweils eigenes LLM)

Error-Recovery-Matrix

Retry-Logik, Eskalation an CEO, automatisches Task-Splitting bei Scheitern

Fertige Artefakte

Was konkret schon existiert

Folgende Dateien und Strukturen sind entwickelt und in der Testphase.

System-Prompts (fertig, getestet)

✓ planner.md System-Prompt: Erstellt den vollständigen Projektplan aus einer Idee

✓ worker.md System-Prompt: Führt einzelne Aufgabenpakete exakt aus

✓ reviewer.md System-Prompt: Prüft Ergebnisse kritisch, listet Fehler auf

Projekt-Templates (fertig)

✓ CLAUDE.md.fastapi Projekt-Template für Python/FastAPI-Projekte

✓ CLAUDE.md.template Generisches Template (beliebiger Tech-Stack)

✓ setup-project.sh Shell-Script: Erstellt komplette Projektstruktur + Git Init

Workflow-Dokumentation (fertig)

✓ GUIDE.md Komplette Schritt-für-Schritt-Anleitung

✓ QUICKREF.md Spickzettel mit den wichtigsten Befehlen

✓ bookmark-api-plan.json Beispiel-Projektplan (Bookmark-API) zum Testen des Workflows

State-Management (fertig, manuell)

✓ plan.json Projektplan mit Phasen, Aufgaben, Abhängigkeiten

✓ status.json Aufgaben-Fortschritt (offen → in_arbeit → done/blocked)

✓ current-phase.json Welche Phase gerade aktiv ist

Roadmap

Von hier zum fertigen System – 4 Stufen

Jede Stufe baut auf der vorherigen auf. Keine Stufe überspringen – jede liefert wichtige Erkenntnisse für die nächste.

✓

Stufe 1: Alles manuell Jetzt – In der Testphase

Du bist der Orchestrator. Du kopierst Aufgaben, startest Agents im Terminal, prüfst Ergebnisse selbst, pflegst den Status manuell. Ziel: Verstehen, wo die Engpässe und wiederkehrenden Muster sind.

3 Rollen mit System-Prompts (Planner, Worker, Reviewer)
Projekt-Templates + Setup-Script
JSON-basiertes State-Management
Git als Sicherheitsnetz und Undo-Button
Anleitung + Quickref für den manuellen Workflow
Beispiel-Projekt (Bookmark-API) zum Testen

2

Stufe 2: Shell-Scripts für Repetitives Nach 2–3 abgeschlossenen Projekten

Alles, was du immer wieder gleich machst, wird zu einem Script. Du bleibst der Orchestrator, aber die Schritte werden schneller.

auto-worker.sh – Git-Commit + Worker-Start + Changelog in einem Befehl
auto-review.sh – Review-Start + Ergebnis in reviews/ speichern
status-update.sh – Task-Status automatisch in status.json setzen
next-tasks.sh – Zeigt an, welche Tasks als nächstes starten können (keine Abhängigkeiten mehr offen)
Pragmatiker als 4. Rolle hinzufügen (filtert Reviewer-Kritik)
Automatisches Logging aller Agent-Calls in log.jsonl

3

Stufe 3: n8n / Python als Orchestrator Wenn die Muster klar sind

Der Mensch wird durch Software ersetzt. Ein n8n-Workflow oder Python-Script steuert den gesamten Ablauf: API-Calls, Routing, State-Updates, Parallelisierung.

Orchestrator-Service – Steuert den kompletten Agent-Pipeline-Flow
LLM-API-Integration – Anthropic API direkt aufrufen statt Claude Code Terminal
Parallele Worker – Mehrere Worker gleichzeitig via asyncio/Promise.all
Alle 9 Rollen – CEO, PM, Schätzer, Critic, Pragmatist, Integrator, Researcher hinzufügen
Zentrale Projektakte – Auto-updated nach jedem Schritt (JSON oder PostgreSQL)
Kontextfenster-Management – Nur relevante State-Ausschnitte an jeden Agent
Error-Recovery – Retry-Matrix mit max. Loops, Eskalation, Task-Splitting
Token-Tracking & Kosten – Pro Agent-Call loggen: Tokens rein/raus, Dauer, Kosten
Telegram-Bot – Statusmeldungen: Phase fertig, Fehler, Projekt abgeschlossen

4

Stufe 4: Vollautomatisch Langfristig

Der Mensch gibt nur noch die Projektidee. Das System plant, schätzt, verteilt, arbeitet, prüft, korrigiert und liefert das fertige Ergebnis. Mensch hat nur noch Freigabe-Rolle.

Idee → Ergebnis – Ein API-Call oder Telegram-Nachricht startet alles
RAG-System – Wissensdatenbanken (Gesetze, Docs, Best Practices) für den Researcher
Selbst-Optimierung – System lernt aus vergangenen Projekten (optimale Paketgrößen, Prompt-Verbesserungen)
Multi-Projekt – Mehrere Projekte gleichzeitig abarbeiten
Dashboard – Web-UI mit Live-Status aller Projekte, Phasen, Kosten
Human-in-the-Loop nur noch bei Eskalationen und finaler Freigabe

„Nicht eine Super-KI bauen, sondern ein digitales Unternehmen nachbauen – mit klaren Rollen, klaren Verantwortlichkeiten und klaren Übergaben."