Die AcademicCloud: Datenschutzkonforme KI und Forschungstools für Hochschulangehörige -

Auch für Gasthörende

Unter bestimmten Voraussetzungen haben Studierende, auch Gasthörende, vollständigen oder teilweisen Zugang zu einem bemerkenswert breiten Portfolio digitaler Werkzeuge – darunter KI-Dienste, die sich funktional mit kommerziellen Angeboten messen lassen, aber ohne Datenweitergabe an US-amerikanische Konzerne auskommen. Dieser Beitrag stellt die wichtigsten Dienste der Academic Cloud vor und erklärt, was hinter der Plattform steckt.

Transparenz

Text und Bild(er) mit KI-Unterstützung erarbeitet.

Wer steckt dahinter?

Die AcademicCloud ist das Ergebnis einer Kooperation dreier öffentlicher Institutionen:

GWDG (Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen) – betreibt die technische Infrastruktur mit Rechenzentren in Göttingen
LANIT (Landesinitiative n-21 / Hochschul-IT-Netzwerk) – übernimmt die organisatorische Koordination
MWK (Niedersächsisches Ministerium für Wissenschaft und Kultur) – stellt die Grundfinanzierung

Alle Daten werden in universitären Rechenzentren in Niedersachsen gespeichert, in Übereinstimmung mit deutschen Datenschutz- und Datensicherheitsrichtlinien, ohne Profilbildung und ohne Datenweitergabe an kommerzielle Anbieter.

Nur für Niedersachsen?

Die Kernfinanzierung trägt das Land Niedersachsen für die teilnehmenden niedersächsischen Hochschulen. Einrichtungen außerhalb Niedersachsens – also etwa die Universität zu Köln – können die AcademicCloud jedoch auf Anfrage nutzen. Gasthörende der Uni Köln können sich über ihren Uni-Account anmelden und haben dann Zugang zu vielen Angeboten der AcademicCloud.

Wie der Login konkret funktioniert, erkläre ich hier.

Dauerfinanziert?

Die KI-Dienste (Chat AI, Voice AI, Image AI, CoCo AI, Protein AI) sind über das Förderprojekt KISSKI (KI-Servicezentrum für sensible und kritische Infrastrukturen) finanziert und auf dieser Grundlage bis zum 30. Juni 2026 abgesichert. Wie es danach weitergeht, ist Stand April 2026 offen – wer die Dienste intensiv nutzen möchte, sollte das im Blick behalten.

Das Portfolio der AcademicCloud

Nach dem Login in die AcademicCloud findet man ein Angebot vieler Dienste. Oben rechts lassen sich die „freigeschalteten Dienste” herausfiltern. Nicht alles ist für jeden verfügbar.

KI-Tools: lokal gehostet und datenschutzkonform

Mit dem blau/violetten AI-Logo sind KI-Tools gekennzeichnet. Alle diese Tools zeichnen sich dadurch aus, dass sie lokal gehostet werden und einen hohen Grad an Datenschutzkonformität gewährleisten.

Chat AI – Mehrere Sprachmodelle, eine Oberfläche

Chat AI bündelt den Zugang zu mehreren großen Sprachmodellen (Large Language Models, LLMs) – sowohl intern betriebenen als auch externen – über eine einheitliche Weboberfläche. Eingaben sind per Text, Audioaufnahme oder Datei-Upload möglich, die Nutzungsdaten bleiben innerhalb der GWDG-Infrastruktur.

Der Aufbau ähnelt bekannten KI-Chatoberflächen: unten ein Eingabefeld für die Anfrage, links Werkzeugeinstellungen, oben die Modellauswahl. Entscheidend ist diese Leiste oben – sie bestimmt, welches Modell die Anfrage verarbeitet, und die Auswahl ist erheblich.

> Kurz erklärt: LLM und MoE Ein Large Language Model (LLM, „großes Sprachmodell”) ist ein KI-System, das auf riesigen Textmengen trainiert wurde und menschliche Sprache erzeugt und versteht. Ein MoE-Modell (Mixture of Experts, „Gemisch von Experten”) ist eine spezielle Architektur, bei der nicht alle Modellparameter für jede Anfrage aktiv sind – nur ein Teil der „Experten” wird aktiviert. Das macht es schneller und effizienter, ohne auf Gesamtgröße verzichten zu müssen.

Die verfügbaren Modelle im Überblick

Chat AI unterscheidet grundlegend zwei Kategorien: Modelle, die auf der GWDG-Infrastruktur in Göttingen selbst betrieben werden, und solche, die extern bei US-amerikanischen Anbietern (OpenAI, Anthropic) laufen. Der Datenschutzunterschied ist erheblich: Bei intern gehosteten Modellen werden Prompts und Gesprächsinhalte grundsätzlich nicht gespeichert. Bei den externen OpenAI- und Anthropic-Modellen werden Daten an externe Server weitergeleitet.

Intern gehostete Open-Weight-Modelle

Diese Modelle laufen vollständig auf der HPC-Infrastruktur (High Performance Computing) der GWDG in Göttingen. „Open Weight” bedeutet, dass die Modellgewichte öffentlich zugänglich sind – die Architektur ist also nachvollziehbar, anders als bei proprietären Modellen wie GPT oder Claude.[1]

[1] https://docs.hpc.gwdg.de/services/ai-services/chat-ai/models/index.html

ChatAI Modelle – Intern gehostet

Modell	Herkunft	Stärken	Hinweise
Europäische & Open-Source-Modelle
Apertus 70B Instruct	🇨🇭Swiss AI	Vollständig Open Source, über 1.800 Sprachen, DSGVO-konform	Europ. Vorzeigeprojekt
Teuken 7B Instruct	🇩🇪OpenGPT-X	Alle 24 EU-Sprachen, europäische Werte	BMWK-gefördert
Devstral 2 123B Instruct	🇫🇷Mistral	Coding, agentenbasierte Aufgaben	256K Kontext
Mistral Large 3 675B	🇫🇷Mistral	Hervorragende Allroundleistung, Vision, viele Sprachen (MoE)	256K Kontext
US-amerikanische Open-Weight-Modelle
Llama 3.1 8B Instruct	🇺🇸Meta	Schnell, gut für allgemeine Konversation	Einsteigermodell
Llama 3.3 70B Instruct	🇺🇸Meta	Gute Gesamtleistung, kreatives Schreiben, Übersetzungen	Vergleichbar mit GPT-4
Gemma 3 27B Instruct	🇺🇸Google	Vision (Bildverständnis), starke Allroundleistung	Basis der Gemini-Forschung
MedGemma 27B Instruct	🇺🇸Google	Medizinisches Fachwissen, Röntgen- und Dermatologiebilder	⚕ Nur medizinische Anwendungsfälle
GPT OSS 120B	🇺🇸OpenAI	Sehr gute Gesamtleistung, schnell	Open-Weight-Veröffentlichung (Aug. 2025)
E5 Mistral 7B Instruct	🇺🇸intfloat / Mistral	Embeddings (Textähnlichkeit, Vektorsuche)	Nur per API
Asiatische Open-Weight-Modelle
DeepSeek R1 Distill Llama 70B	🇨🇳DeepSeek	Gute Gesamtleistung, schneller als R1	⚠ Politische Zensur bei China-sensiblen Themen bekannt
InternVL 3.5 30B A3B	🇨🇳OpenGVLab	Vision, leicht und schnell (MoE)	OCR, Dokumentenverständnis
GLM-4.7	🇸🇬Z.ai	Coding, Werkzeugnutzung, mathematisches Schlussfolgern	200K Kontext
Qwen 3.5 397B A17B	🇨🇳Alibaba	Eines der stärksten Open-Weight-Modelle, Vision (MoE)	256K Kontext
Qwen 3.5 122B A10B	🇨🇳Alibaba	Vision, stark in Reasoning und Coding (MoE)	256K Kontext
Qwen 3.5 27B / 35B A3B	🇨🇳Alibaba	Vision, gute Gesamtleistung	Effizientere Alternativen
Qwen 3 Omni 30B	🇨🇳Alibaba	Multimodal (Text, Bild, Audio, Video)	119 Text- & 19 Gesprächssprachen
Qwen 3 Coder 30B	🇨🇳Alibaba	Spezialisiert auf Code-Aufgaben	–

Quelle: GWDG HPC-Dokumentation · Stand: April 2026 · MoE = Mixture of Experts

> Obacht: DeepSeek-Modelle Die DeepSeek-Modelle liefern gute Ergebnisse für viele Aufgaben. Die GWDG-Dokumentation weist jedoch explizit darauf hin, dass bei politisch sensiblen Themen – insbesondere solchen, die für die chinesische Regierung heikel sind – mit zensierten oder verzerrten Antworten zu rechnen ist. Für sachliche Rechercheaufgaben, Textentwürfe oder Programmierung ist das in der Regel kein Problem. Für Fragen zu Menschenrechten, Tibet, Taiwan oder ähnlichen Themen sollte man ein anderes Modell wählen.

> Obacht: OpenAI-Modelle über externe Schnittstelle Selbst wenn GPT-5.x über die AcademicCloud-Oberfläche genutzt wird, laufen diese Modelle auf OpenAI-Servern in den USA. Chat AI leitet die Anfragen lediglich weiter. Microsoft kann Konversationen bis zu 30 Tagen zur Missbrauchsprüfung speichern – allerdings werden sie nicht für Modelltraining genutzt.

Welches Modell für welchen Zweck? Als Orientierung: Für allgemeine Texte, Recherche und Übersetzungen leistet Llama 3.3 70B oder Gemma 3 27B gute Arbeit und bietet maximalen Datenschutz. Wer Bilder analysieren möchte, wählt ein Vision-fähiges Modell wie Gemma 3, InternVL oder ein Qwen 3.5-Modell. Für Programmieraufgaben empfiehlt sich Devstral 2 oder Qwen 3 Coder. Wer das stärkste Modell ohne Datenschutzkompromiss sucht, greift zu Mistral Large 3 675B oder Qwen 3.5 397B.

Image AI – Bilder generieren, ohne Spuren zu hinterlassen

Image AI verbindet zwei leistungsfähige Ansätze:

Mit dem FLUX.1-Modell (entwickelt von Black Forest Labs, einem deutschen KI-Unternehmen aus Freiburg) lassen sich Bilder aus Textbeschreibungen erzeugen (Text-zu-Bild, engl. text-to-image). FLUX.1 gilt als eines der leistungsfähigsten Open-Source-Bildgenerierungsmodelle überhaupt und wird auch kommerziell eingesetzt – hier läuft es auf der eigenen HPC-Infrastruktur der GWDG.

Mit dem Qwen-VL-Modell (von Alibaba Cloud, der Qwen-Modellfamilie) können vorhandene Bilder gezielt bearbeitet werden (image-to-image): Objekte entfernen, Stile übertragen, Elemente ergänzen.

Da der Dienst vollständig auf GWDG-Hardware läuft, werden weder Eingaben noch generierte Bilder an externe Server übertragen. Die Oberfläche ist browserbasiert – ein lokales Software-Setup ist nicht erforderlich.

Voice AI – Transkription und Übersetzung auf Knopfdruck

Audio- oder Videodateien hochladen, automatisch in Text umwandeln oder ins Englische übersetzen: Voice AI deckt damit eine Alltagsanforderung ab, die in Forschung, Lehre und Selbststudium regelmäßig auftaucht. Die Ausgabe erfolgt wahlweise als Textdatei oder als Untertitel-Datei (.srt oder .vtt) mit Zeitstempeln – direkt verwendbar für Barrierefreiheit, Nachbearbeitung oder Archivierung. Der Dienst unterstützt eine breite Auswahl an Sprachen.

Für Spezialisten: CoCo AI und Protein AI

Für Programmierende bietet CoCo AI eine KI-gestützte Code-Vervollständigung für gängige Entwicklungsumgebungen wie VS Code oder JetBrains, setzt aber einen SAIA-API-Schlüssel voraus. Protein AI adressiert Forschende in den Biowissenschaften: Auf Basis der Modelle AlphaFold2 und Boltz werden Proteinstrukturen via HPC vorhergesagt – ein hochspezialisierter Dienst, der ebenfalls über KISSKI finanziert ist.

Forschungstools: Literatur durchleuchten, Daten dauerhaft sichern

COMING SOON: ORKG Ask – Antwortsuche in 80 Millionen Publikationen

Wer eine Forschungsfrage stellt, bekommt von ORKG Ask keine einfache Zusammenfassung, sondern eine strukturierte Antwort: Der KI-Assistent durchsucht einen Korpus von knapp 80 Millionen Open-Access-Publikationen und liefert neben einer Kurzzusammenfassung eine tabellarische Übersicht der relevantesten Veröffentlichungen mit Quellenangaben. Besonders für systematische Literaturrecherchen ist das ein erheblicher Gewinn gegenüber klassischen Datenbanksuchen. Sowohl der Dienst selbst als auch alle verwendeten Drittkomponenten sind vollständig Open Source – Transparenz und Reproduzierbarkeit sind damit strukturell verankert, nicht nur versprochen.

Das Tool ist für Kölner Gasthörende noch nicht verfügbar – aber es lohnt sich, es im Blick zu behalten.

COMING SOON: Open Research Knowledge Graph (ORKG) – Forschung strukturiert denken

Der Open Research Knowledge Graph geht über die Recherche hinaus: Er ermöglicht es, Forschungsergebnisse strukturiert zu beschreiben, zu vergleichen und in lebenden Übersichtsartikeln (ORKG Reviews) kollaborativ weiterzuentwickeln. Gehostet von der TIB – Leibniz-Informationszentrum Technik und Naturwissenschaften in Hannover, bietet ORKG einen dynamischen Ansatz zur Forschungsdokumentation, der sich bewusst von statischen PDF-Publikationen absetzt. Wer Forschungsergebnisse nicht nur veröffentlichen, sondern vergleichbar und zitierbar machen will, findet hier ein Werkzeug, das genau dafür gebaut wurde.

GroData – Forschungsdaten dauerhaft und referenzierbar ablegen

Forschungsdaten, die in einer Schublade bleiben, sind wissenschaftlich wertlos. GroData (Göttingen Research Online Data) löst dieses Problem: Der Dienst ermöglicht das Ablegen, Beschreiben und Veröffentlichen von Forschungsdaten mit vollständiger Metadatenvergabe sowie der Zuweisung von DOIs (Digital Object Identifiers – dauerhaft zitierbare Identifikatoren für digitale Objekte) und anderen persistenten Identifikatoren (PIDs). Betrieben von der Göttingen eResearch Alliance auf Basis der Open-Source-Software Dataverse, ist GroData besonders für Forschende mit Göttingen-Affiliation zugänglich – eine Anfrage lohnt sich aber auch für externe Einrichtungen.

Produktivitäts- und Kommunikationsdienste

Die AcademicCloud umfasst darüber hinaus ein vollständiges Set an Produktivitätsdiensten: Dateiverwaltung und kollaboratives Arbeiten via Nextcloud und ownCloud, E-Mail und Groupware mit OX-Mail (Open-Xchange), verschlüsselter Messenger- und Videodienst Matrix, das Vernetzungs- und Community-Tool Hub sowie das Veranstaltungsmanagement mit Indico. Diese Dienste stehen an der Universität zu Köln in vergleichbarer Form zur Verfügung – ein eigenständiger Beitrag dazu folgt.

Handlungsempfehlung

Die KI-Dienste der AcademicCloud sind aktuell nutzbar, gut ausgebaut und datenschutzkonform. Wer einen gültigen Hochschulaccount hat, kann sie ohne weitere Hürden testen – und sollte das tun, solange die KISSKI-Finanzierung läuft.

Im Browser: academiccloud.de aufrufen

Anmelden mit der Uni-Mail-Adresse: …..@smail.uni-koeln.de
Es öffnet sich das bekannte Shibboleth-Fenster

hier anmelden: Mit Benutzername (Uni-Mail ohne “@smail.uni-koeln.de”) und dem Passwort dazu

Und nun einfach mal alles durchklicken; es ist spannend! Versprochen.