- Funktionen
- Pricing

Das Wichtigste auf einen Blick: Hochleistungsfähiges RAG erfordert mehr als nur ein Einbettungsmodell; es erfordert eine Datenbank, die Vektorähnlichkeiten in großem Maßstab verarbeiten kann. Durch die Konsolidierung auf Upsuns verwaltetem PostgreSQL mit pgvector eliminierst du die „Egress Tax“ und erhältst eine Datenbank, die sich an deinen agentenbasierten Bedarf anpasst.
TL;DR: Der Entwurf für die RAG-Infrastruktur
|
Viele Teams beginnen ihre RAG-Reise damit, eine eigenständige Vektordatenbank an ihren bestehenden Stack anzuhängen.
Im Jahr 2026 gilt dies als einer der Hauptgründe für die „DevOps-Steuer“. Jedes Mal, wenn dein KI-Agent Daten zwischen deiner Primärdatenbank und einem Vektorspeicher eines Drittanbieters verschiebt, zahlst du dafür mit Latenz, Egress-Kosten und „Kontextdrift“.
Die Lösung ist Konsolidierung. Durch die Verwendung von PostgreSQL mit der pgvector-Erweiterung auf Upsun befinden sich deine Embeddings in derselben Tabelle wie deine Anwendungsdaten. Eine Backup-Strategie. Ein Sicherheitsmodell. Eine einzige Quelle der Wahrheit.
Das Wichtigste auf einen Blick: Bei Workloads mit weniger als 5 Millionen Vektoren ermöglichen HNSW-Indizes (Hierarchical Navigable Small World) auf einer richtig dimensionierten Upsun-Instanz Abfragen im einstelligen Millisekundenbereich.
Um eine produktionsreife Performance zu erzielen, ist die Konfiguration deines Vektorindex entscheidend. Auf Upsun hast du den vertikalen Spielraum, deine Datenbank für hochdimensionale Suchen zu optimieren:
Das Wichtigste auf einen Blick: RAG-Pipelines sind bekanntlich sehr „bursty“. Mit Upsun kannst du deine Datenbankressourcen unabhängig und präzise skalieren, sodass deine Vektorsuche auch bei Indexierungsspitzen eine hohe Performance bietet, ohne dass du für ungenutzte Rechenleistung zu viel bezahlst.
Ein plötzlicher Ansturm von Nutzeranfragen oder ein umfangreicher Dokumenten-Reindexierungsjob kann die Datenbanklast sofort in die Höhe treiben. Herkömmliche verwaltete Primitive zwingen dich oft in starre Instanzstufen, bei denen du für hohe CPU-Leistung bezahlst, nur um den für die Vektorindexierung erforderlichen Arbeitsspeicher zu erhalten.
Präzise Skalierung in der Praxis:
Heute kannst du die Upsun-CLI oder -Konsole nutzen, um deine PostgreSQL-Instanz in Sekundenschnelle vertikal zu skalieren. Da die Plattform eine unabhängige Zuweisung von vCPU und RAM ermöglicht, kannst du genau den Speicher-Overhead bereitstellen, der für die rechenintensive HNSW-Indizierung erforderlich ist, ohne den Rest deines Stacks überdimensionieren zu müssen. So stellst du sicher, dass deine Selbstkorrekturschleifen und Suchanfragen unabhängig vom Datenvolumen reaktionsschnell bleiben.
Wichtigste Erkenntnis: Du solltest niemals einen neuen HNSW-Index oder eine Schemamigration in der Produktivumgebung testen. Die Byte-Level-Klone von Upsun bieten die einzige sichere Testumgebung für RAG.
Wie in „Die Datenkontextlücke: Warum Agenten auf fragmentierten Stacks versagen“ erläutert, ist das größte Risiko für eine RAG-Pipeline die „Reality Gap“.
vector_cosine_ops“ bereitstellst, erstellt Upsun eine datenvollständige Vorschau. Dabei handelt es sich um einen 1:1-Klon deiner Produktionsdaten.Lass nicht zu, dass eine fragmentierte Infrastruktur der Grund für das Scheitern deiner KI ist. Durch die Konsolidierung deiner Vektor- und relationalen Daten auf einer Plattform, die auf Umgebungsparität ausgelegt ist, gewinnst du das Innovationsbudget zurück, das sonst für die Infrastruktur verschwendet wird.
Mache deine Datenstrategie zukunftssicher:
Verstößt das Klonen von Produktionsdaten nicht gegen Datenschutzbestimmungen wie die DSGVO?
Das wäre der Fall, wenn du sie blind klonen würdest. Mit Upsun kannst du Sanitization-Hooks in deiner Deployment-Pipeline definieren. Sobald ein Branch erstellt wird, wird ein Klon auf Byte-Ebene erstellt, und ein Sanitization-Skript (z. B. zum Maskieren von E-Mails oder Entfernen von personenbezogenen Daten) wird automatisch ausgeführt, bevor Entwickler oder KI-Agenten Zugriff erhalten. Du erhältst die Struktur und den Umfang der Produktionsdaten ohne Compliance-Risiko.
Explodieren unsere Speicherkosten, wenn wir für jeden Branch eine 500-GB-Datenbank klonen?
Nein. Upsun nutzt Copy-on-Write-Technologie. Wenn du eine Umgebung klonst, duplizierst du nicht physisch 500 GB an Daten. Du erstellst einen „virtuellen“ Zeiger auf die bestehenden Datenblöcke. Du zahlst nur für die Änderungen (Diffs), die innerhalb dieses spezifischen Zweigs vorgenommen wurden. Das macht „Data-Complete Previews“ selbst für riesige Datensätze wirtschaftlich rentabel.
Verlangsamt der Einsatz eines KI-Agenten auf einem Klon unsere Live-Produktionsseite in der Produktivumgebung?
Überhaupt nicht. Da der Klon eine logisch isolierte Umgebung mit eigenen dedizierten Ressourcen ist, kann der KI-Agent rechenintensive Abfragen ausführen, Vektorspeicher neu indizieren oder komplexe Migrationen durchführen, ohne auch nur einen einzigen CPU-Zyklus deiner Produktivumgebung zu beanspruchen.
Wie unterscheidet sich das von einer herkömmlichen „Staging“-Datenbank?
Traditionelles Staging ist eine „gemeinsam genutzte“ Ressource, die schnell zu einem Friedhof veralteter Daten und widersprüchlicher Migrationen wird. Upsun bietet Ephemeral Parity: Jeder einzelne Git-Zweig erhält seinen eigenen, einzigartigen, aktuellen Klon. Wenn du den Zweig löschst, verschwindet die Umgebung (und ihre Daten), wodurch sichergestellt wird, dass sich keine „Schattendaten“ ausbreiten.
Können KI-Agenten die Infrastruktur tatsächlich verstehen?
Ja, über den Upsun MCP Server. Anstatt API-Aufrufe zu skripten, kann dein Agent Umgebungen erstellen, Dienste hinzufügen und Bereitstellungen überwachen – und zwar mithilfe von Befehlen in natürlicher Sprache, die auf dem aktuellen Status deines Upsun-Projekts basieren, anstatt auf Vermutungen darüber, wie deine Infrastruktur aufgebaut ist.