Perplexity Pro im Praxistest – Die KI-Modelle im Überblick: GPT-5.4, Claude, Gemini, Nemotron, KIMI & Sonar

Perplexity Pro im Praxistest · Teil 3 von 9

Perplexity Pro bietet aktuell (5/2026) mehrere KI-Modelle in einer Oberfläche: GPT-5.4, Claude Sonnet 4.6, Gemini 3.1 Pro, Nemotron 3 Super, KIMI K 2.6 und Sonar 2. Jedes hat klare Stärken – und jedes gibt es in einer „Thinking”-Variante für komplexere Aufgaben. Dieser Beitrag zeigt, wann welches Modell die richtige Wahl ist.


Transparenz

Text und Bild(er) mit KI-Unterstützung erarbeitet.


Perplexity Pro gibt Zugang zu Modellen mehrerer Anbieter innerhalb einer einzigen Oberfläche. Die Auswahl erfolgt über das Modell-Auswahlmenü oben links im Chatfenster. Alle nachfolgend beschriebenen Modelle sind im Pro-Plan (Stand April 2026, Deutschland) verfügbar, sofern nicht anders gekennzeichnet.

Was bedeutet „Thinking”?

Alle Modelle gibt es in einer Standardvariante und – wo angegeben – in einer „Thinking”-Variante. Thinking-Modelle arbeiten nicht schneller, sondern gründlicher: Sie durchlaufen vor der Antwort eine sichtbare Überlegungsphase, in der das Modell Zwischenschritte, Annahmen und Unsicherheiten notiert. Das kostet mehr Zeit und Credits, liefert aber bei komplexen, mehrstufigen Aufgaben deutlich zuverlässigere Ergebnisse. Für einfache Recherchefragen ist die Standardvariante die bessere Wahl.

GPT-5.4 / GPT-5.4 Thinking

GPT-5.4 ist OpenAIs aktuelles Allround-Flaggschiff, veröffentlicht am 4./5. März 2026.[19] Es ist das erste Modell der GPT-5-Serie mit nativen Computer-Use-Fähigkeiten – es kann also nicht nur Texte analysieren und schreiben, sondern auch eigenständig Bildschirminhalte interpretieren und Aktionen ausführen. Das Kontextfenster umfasst 1 Million Token, was das Verarbeiten sehr langer Dokumente, ganzer Codebasen oder umfangreicher Recherche-Dossiers ermöglicht.[19]

Kurz erklärt: Computer Use

Computer Use bezeichnet die Fähigkeit eines KI-Modells, eine grafische Benutzeroberfläche selbstständig zu bedienen – so wie ein Mensch vor dem Bildschirm. Das Modell „sieht” den Bildschirminhalt als Bild, erkennt Schaltflächen, Felder und Menüs und führt daraufhin Aktionen aus: Klicken, Tippen, Scrollen, Formulare ausfüllen. Es reagiert nicht auf vorprogrammierte Befehle, sondern interpretiert die Oberfläche situativ. Aktuelle Modelle erreichen in kontrollierten Tests Genauigkeitswerte zwischen 60 und 80 Prozent – menschliche Aufsicht bleibt bei kritischen Aufgaben unverzichtbar.

Verglichen mit GPT-5.2 verbraucht GPT-5.4 bei gleichen Aufgaben deutlich weniger Token – die Antworten sind knapper, schneller und kostengünstiger.[19] GPT-5.4 Thinking zeigt vor der Antwort einen transparenten Planungsschritt und eignet sich besonders für „Nadel-im-Heuhaufen”-Anfragen: Aufgaben, bei denen sehr spezifische Informationen aus großen Dokumentenmengen extrahiert werden müssen.[17]

Claude Sonnet 4.6 / Claude Sonnet 4.6 Thinking

Claude Sonnet 4.6 wurde im Februar 2026 von Anthropic veröffentlicht und ist das weltweit am häufigsten genutzte Modell der mittleren Leistungsklasse – es ist Standardmodell auf claude.ai, treibt GitHub Copilot an und ist Anthropics empfohlene Wahl für die meisten produktiven Einsätze.[20] Das Modell verarbeitet sowohl Text als auch Bilder und liefert Antworten in Text, Grafiken und Audio via Text-to-Speech.[20]

Sonnet hat Stärken in Mathematik sowie bei naturwissenschaftlichen und technischen Fragestellungen und beherrscht Longform-Reasoning und mehrstufige Aufgaben.[21] Claude Sonnet 4.6 Thinking ist die Wahl für Aufgaben, bei denen Schritt-für-Schritt-Nachvollziehbarkeit wichtig ist: rechtliche Analysen, wissenschaftliche Argumentationsketten oder Entscheidungen, die später begründet werden müssen.

Gemini 3.1 Pro / Gemini 3.1 Pro Thinking

Gemini 3.1 Pro erschien am 18. Februar 2026 und bringt gegenüber Gemini 3 Pro eine doppelt so hohe Reasoning-Leistung mit. Das Besondere ist seine native Multimodalität: Das Modell verarbeitet Text, Bilder, Audio, Video und Code als gleichwertige Eingaben – nicht als nachträglich zusammengesetzte Teilsysteme, sondern als integrierte Architektur.[23][24] Für Videoverständnis ist es auf bis zu 10 Frames pro Sekunde optimiert.

Gemini 3.1 Pro Thinking bietet konfigurierbare Reasoning-Tiefe: Die Thinking-Intensität lässt sich anpassen, was ein gutes Gleichgewicht zwischen Antwortgeschwindigkeit und Überlegungstiefe ermöglicht.[24] Das ist nützlich bei gemischten Workflows aus einfachen Abfragen und komplexen Analysen.

Nemotron 3 Super / Nemotron 3 Super Thinking

Nemotron 3 Super ist NVIDIAs erstes Modell aus der Nemotron-3-Familie, veröffentlicht am 11. März 2026, und ein Open-Weights-Modell in Perplexitys Pro-Portfolio.[25] „Open Weights” bedeutet: Die trainierten Modellparameter sind öffentlich zugänglich, jede Organisation kann das Modell auf eigener Infrastruktur betreiben – ein relevanter Aspekt für datenschutzsensible Anwendungen. Perplexity ist Gründungsmitglied der NVIDIA Nemotron Coalition, über die das Modell direkt in die Plattform integriert wurde.[7]

Für Multi-Agenten-Workflows – also Aufgaben, bei denen mehrere KI-Modelle zusammenarbeiten und lange Konversationsverläufe gehalten werden müssen – ist Nemotron 3 Super gezielt optimiert.[25] Das Kontextfenster beträgt 1 Million Token.

Kimi K2.6 / Kimi K2.6 Thinking

Kimi K2.6 ist das aktuelle Flaggschiff von Moonshot AI, veröffentlicht am 20. April 2026, und ein weiteres Open-Source-Modell im Perplexity-Pro-Portfolio.[K1] Es basiert auf einer Mixture-of-Experts-Architektur mit bis zu 1 Billion Parametern und einem Kontextfenster von 256.000 Token. Die native Multimodalität umfasst Text- und Bildeingaben – ähnlich wie Gemini, jedoch mit einem klaren Schwerpunkt auf agentic Coding und autonomer Ausführung.[K2]

Das herausragende Merkmal von K2.6 ist die sogenannte Agent-Swarm-Architektur: Das Modell kann horizontal auf bis zu 300 parallele Sub-Agenten skalieren, die koordiniert bis zu 4.000 Schritte ausführen – von der Aufgabenzerlegung über die Codeausführung bis zur Lieferung fertiger Anwendungen in einem einzigen autonomen Durchlauf.[K2] Für komplexe End-to-End-Coding-Projekte, UI/UX-Generierung aus einfachen Prompts und autonome Hintergrundagenten ist K2.6 die stärkste Wahl im Pro-Portfolio.

Kimi K2.6 Thinking ergänzt die Standard-Variante um eine explizite Überlegungsphase mit sichtbaren Reasoning-Tokens – besonders nützlich bei mehrstufigen Planungsaufgaben und komplexen Debugging-Prozessen, bei denen die Nachvollziehbarkeit der Zwischenschritte wichtig ist.[K1]
s. auch KIMI2.5, KIMI 2.6

Sonar 2

Sonar 2 ist Perplexitys eigenes, auf Web-Retrieval spezialisiertes Modell – und strukturell das Herzstück der Plattform. Die neue Version wurde am 26. April 2026 für alle Pro-Nutzenden freigeschaltet und löst das bisherige Sonar (basierend auf Llama 3.3 70B) ab.[S1] Sonar 2 wurde speziell für hochgeschwindigkeits-webbasierte Recherche und faktengenaues Antworten weiterentwickelt – und läuft weiterhin auf der Cerebras-Infrastruktur mit bis zu 1.200 Token pro Sekunde für nahezu sofortige Antwortgenerierung.[S2]

Sonar 2 ist die richtige Wahl für alle Anfragen, bei denen Aktualität, Quellentiefe und Antwortgeschwindigkeit im Vordergrund stehen: tagesaktuelle Ereignisse, Produktrecherchen, Literaturdatenbanken, schnelle Faktenprüfungen. Pro-Nutzende können Sonar 2 als Standardmodell in den Einstellungen festlegen. Für komplexe Reasoning-Aufgaben, agentic Workflows oder kreative Textarbeit sind die Drittanbieter-Modelle die stärkere Wahl.[S2]

„Best”-Modus

Der „Best”-Modus ist die Standardeinstellung in Perplexity – wer kein Modell aktiv auswählt, arbeitet damit.[29] Das System analysiert die eingehende Anfrage und wählt automatisch das geeignetste Modell aus dem verfügbaren Pool: Für schnelle Webrecherchen greift es auf Sonar zurück, für komplexere Aufgaben auf eines der stärkeren Frontier-Modelle des Pro-Plans.

Der „Best”-Modus nimmt die Entscheidungsarbeit ab – ein Vorteil für alle, die nicht bei jeder Anfrage eine Modellwahl treffen wollen. Die Kehrseite: Wer wiederholt dieselbe Art von Aufgaben erledigt – etwa tägliche Literaturrecherchen oder regelmäßiges Coding – profitiert davon, das jeweils stärkste Modell einmalig zu identifizieren und danach direkt auszuwählen statt dem Auto-Modus zu vertrauen.[29]

Wann welches Modell? (Stand April 2026)

AufgabeEmpfehlung
Schnelle Webrecherche, FaktenprüfungSonar 2
Coding, agentic Workflows, UI-GenerierungKimi K2.6 / Claude Sonnet 4.6
Autonome mehrstufige Aufgaben, Agent SwarmKimi K2.6 (bis 300 Sub-Agenten)
Bild-, Video-, DiagrammanalyseGemini 3.1 Pro
Allround + Computer UseGPT-5.4
Sehr lange Dokumente (>100 Seiten)Nemotron 3 Super (1M Kontext)
Nachvollziehbares Schritt-für-Schritt-ReasoningThinking-Variante des jeweiligen Modells
Gemischter Alltagsgebrauch„Best”-Modus

Quellen: [3][7][17][19][20][21][23][24][25][29][K1][K2][S1][S2] · Stand Mai 2026


Quellen & Belege

[3] rankstudio.net: Das LLM von Perplexity – Sonar & PPLX; Perplexity API-Dokumentation (rankstudio.net / docs.perplexity.ai, Okt. 2025 / März 2026)

[7] Perplexity Computer – Plattformankündigung & NVIDIA Nemotron Coalition (perplexity.ai/blog, März 2026)

[17] Perplexity Startup-Programm – GPT-5.4 Thinking-Praxiserfahrung (perplexity.ai/startups, abgerufen April 2026)

[19] OpenAI – GPT-5.4 Ankündigung & technische Spezifikationen (openai.com/blog, März 2026)

[20] Anthropic – Claude Sonnet 4.6 Modellkarte & Produktionsempfehlung (anthropic.com/claude, Februar 2026)

[21] Anthropic – Claude Sonnet 4.6 Benchmark-Übersicht (anthropic.com/research, Februar 2026)

[23] Google DeepMind – Gemini 3.1 Pro Modellkarte & Multimodalitätsdokumentation (deepmind.google, Februar 2026)

[24] Google DeepMind – Gemini 3.1 Pro Thinking: konfigurierbare Reasoning-Tiefe (deepmind.google/blog, Februar 2026)

[25] NVIDIA – Nemotron 3 Super Ankündigung & Open-Weights-Dokumentation (nvidia.com/blog, März 2026)

[29] Perplexity – „Best”-Modus Dokumentation & automatische Modellwahl (perplexity.ai/help, abgerufen April 2026)

[K1] Moonshot AI – Kimi K2.6 Technischer Blog & Modellkarte (kimi.com/blog/kimi-k2-6 / platform.kimi.ai/docs/models, April 2026)

[K2] Microsoft Azure AI Foundry – Introducing Kimi K2.6: Agent Swarm & Agentic Architecture (techcommunity.microsoft.com, April 2026)

[S1] Perplexity – Sonar 2 Launch auf der Web-Plattform (x.com/testingcatalog, 26. April 2026)

[S2] Perplexity – Meet New Sonar: Cerebras-Infrastruktur, 1.200 Token/Sekunde (perplexity.ai/hub/blog/meet-new-sonar, März 2026)

Informiert bleiben.

Bleiben Sie mit unserem Newsletter auf dem Laufenden.

Mit der Anmeldung zum Newsletter stimmen Sie der Verarbeitung Ihrer Daten entsprechend der Datenschutzerklärung zu.