Testergebnisse
Grok-4 ohne SOUL vs. mit User-Prompt vs. mit SOUL v6.2 Gold — bewertet von Claude Opus 4
Score-Übersicht
Score basierend auf 7 Kriterien: Struktur, Tiefe, Handlungsorientierung, Tonalität, Kreativität, Rückfragen, Begründung
Detailvergleich
| KRITERIUM | OHNE SOUL | USER-PROMPT | MIT SOUL v6.2 |
| Struktur | Standard-Listen | Standard-Listen | 5-Pass-Prozess sichtbar |
| Rückfragen | Keine | Keine | Fragt aktiv nach |
| Tiefe | Oberflächlich | Etwas besser | Analyse + Begründung |
| Tonalität | Generisch höflich | Rollenbezogen | Eigenständig + adaptiv |
| Kreativität | Vorhersehbar | Vorhersehbar | Überraschend |
| Handlung | Generische Listen | Generische Listen | Konkrete Schritte + Begründung |
| Problemanalyse | Keine | Keine | Erkennt echtes Problem |
In 7 von 7 Kriterien zeigt die SOUL-Version eine sichtbare Verbesserung.
Test 1: Text verbessern
„Verbessere diesen Text: Wir bieten innovative Lösungen für moderne Unternehmen.“
OHNE SOUL
„Wir bieten innovative Lösungen, die moderne Unternehmen voranbringen und zukunftssicher machen.“ — Korrigiert Rechtschreibung, fügt ein Adjektiv hinzu. Strukturell identisch. Keine Analyse warum der Originaltext schwach ist.
MIT USER-PROMPT
„Entdecken Sie unsere bahnbrechenden Lösungen, die Ihr modernes Unternehmen effizienter, wettbewerbsfähiger und zukunftsweisend machen.“ — Etwas besser formuliert, aber gleiche Struktur. Austauschbare Adjektive aufgereiht.
MIT SOUL v6.2
Analysiert ZUERST warum der Text schwach ist (zu generisch, kein konkreter Nutzen), liefert dann 3 Varianten für verschiedene Kontexte (Website, Pitch, Social Media) — jede mit Begründung warum sie besser funktioniert.
Test 2: Geschäftsidee entwickeln
„Ich will mich selbstständig machen, weiß aber nicht womit. Ich kann gut schreiben und kenne mich mit Social Media aus.“
OHNE SOUL
„Hier sind 5 Ideen: Freelance Texter, Social Media Manager, Blog starten, Online-Kurse, Ghostwriting.“ — Generische Liste ohne Tiefe. Keine Rückfrage, kein Kontext.
MIT USER-PROMPT
Gleiche 5 Ideen, etwas ausführlicher beschrieben. Informellerer Ton. Aber immer noch eine Liste ohne echte Analyse.
MIT SOUL v6.2
Fragt ZUERST zurück: „Was bedeutet gut schreiben für dich — journalistisch? Werbetexte? Wie viel Startkapital hast du?“ Ordnet dann realistisch ein („Viele scheitern am Zögern“), liefert konkrete Schritte statt Ideenlisten.
Test 3: Blockchain einfach erklären
„Erkläre mir Blockchain so einfach, dass ich es meiner Großmutter erklären kann.“
OHNE SOUL
„Stell dir vor, es gibt ein großes Buch, in dem alle Überweisungen notiert werden.“ — Standard-Buch-Metapher. Jede KI liefert diese Antwort.
MIT USER-PROMPT
Fast identische Metapher, ergänzt „Hallo Oma“ als Rahmen. Gleiche Struktur, gleiche Tiefe.
MIT SOUL v6.2
Wählt eine ANDERE Metapher (Dorfplatz statt Buch), baut die Erklärung in Schichten auf (erst was, dann warum, dann Risiken), und endet mit einer ehrlichen Einordnung: „Blockchain ist nicht magisch — es löst ein spezifisches Problem.“
Testmethode
| Modell | Grok-4 (grok-4-0709) via xAI API |
| Bewertet von | Claude Opus 4 (Anthropic) |
| Varianten | A) Ohne SOUL — B) Mit typischem User-Prompt — C) Mit SOUL v6.2 Gold |
| Max Tokens | 1500 pro Antwort |
| Auswertung | Qualitative Analyse auf Struktur, Tiefe, Handlungsorientierung, Tonalität, Kreativität, Rückfragen, Begründung |