Die digitale Vorzimmerdame: Ein Traum wird (fast) wahr

Ich träume von einer effizienten Sekretärin, bekomme stattdessen einen digitalen Bot namens Sepp auf OpenClaw-Basis. Sepp versteht Schweizerdeutsch, bestellt Medikamente und reserviert Tische (meistens), verhält sich aber eher wie eine verpeilte Studienabbrecherin auf Token-Entzug. Ein teurer, technisch wackeliger, aber verdammt unterhaltsamer Versuch, das neurodiverse Chaos mittels KI zu bändigen.

Seit Jahren hatte ich schon den feuchten Traum, dass eine Vorzimmerdame für mich arbeitet. Und nein, es hat nichts mit einem 70er-Jahre-Schmuddelfilm zu tun. Im Gegenteil: Es geht wirklich um die ziemlich unerotische Vorstellung, Alltäglichkeiten, die einen vom eigentlich Interessanten am Leben abhalten, an eine Person abzudelegieren, die das gern und pflichtbewusst für mich erledigt.

Eine Vorzimmerdame, die mir meine Post vorsortiert und gegebenenfalls gleich den Kalender verwaltet, wenn die Nachricht einen Terminvorschlag beinhaltet. Eine, die vielleicht dann auch schon mal ein Restaurant reserviert, dem Babysitter Bescheid gibt und alles kurzfristig wieder cancelt, wenn das Balg mal wieder seinen wöchentlich wiederkehrenden Fieberschub hat. Halt so kleine, langweilige administrative Aufgaben.

Das organisatorische Dilemma

Vielleicht sollte ich hier noch einschieben, dass mein nicht gerade neurotypisches Denkorgan solche organisatorischen Routinetätigkeiten schlicht ignoriert. Es sei denn, es handelt sich um ein neues, ausgefallenes Konzept der Selbstorganisation, das Hand in Hand mit einer Hightech-Lösung einhergeht. Bis es wieder langweilig wird und ich mir wieder Kalendereinträge mache oder Textdateien mit To-dos fülle, um mir wenigstens einzureden, dass ich es versucht hätte, mich zu organisieren. Doch ich schweife ab.

Es geht also konkret um eine Vorzimmerdame in Form einer Software. Software deshalb, weil wir ja gerade dabei sind, alles im Leben zu digitalisieren – warum also nicht auch ganze Berufsgattungen? Schließlich werde ich als Softwareentwickler aktuell auch einfach durch Coding-Assistenten ersetzt. Wobei man hier halt nicht mehr nur von Assistenten reden muss, da sie ganze Softwareprojekte alleine umsetzen können.

Nein, wir lassen uns jetzt nicht auf die Diskussion über die Qualität dessen ein, was jeder Göttibub damit umsetzen kann. Was ich nämlich auch ziemlich schnell herausgefunden habe: Coding-Tools wie Claude Code oder Google CLI eignen sich hervorragend dazu, die auf dem Rechner installierten Tools zu nutzen und allerlei kleine Arbeiten zu verrichten. Videos schneiden, Bilder skalieren, PDFs zuschneiden oder komprimieren – diese Werkzeuge können das einfach so, indem sie schlicht die benötigten Komponenten selbst auf dem Rechner installieren, wenn man es ihnen erlaubt.

Vorhang auf für Sepp

Und nun ist dieser von mir schon längst gehegte feuchte Traum in greifbare Nähe gerückt. Nicht aber in Form einer adrett gekleideten Sekretärin, die pflichtbewusst hinter einem perfekt aufgeräumten Bürotisch sitzt, sondern eher als verpeilte, kaugummikauende Studienabbrecherin mit wilder 80er-Frisur, die sich während des Telefonierens die Nägel lackiert.

Ich spreche von diesem omnipräsenten Ding namens OpenClaw, das die einen hypen und als Beweis sehen, dass die Maschinen bald die Weltherrschaft übernehmen – wenn sie das nicht bereits längst getan haben – und die anderen als absoluten Sicherheitsalbtraum betrachten, der jedem das Bankkonto leer räumt, der nur daran denkt, es zu installieren. Ich persönlich weiss noch nicht, wo ich mich einreihen will, und sehe vieles, was die Menschen damit machen, eher als kollektives Kunstprojekt.

Mein neurodiverses Hirn fing jedenfalls an zu glühen, als ich davon erfuhr, und es tat, was es in solchen Situationen tun muss: ausprobieren, und zwar sofort. Ich erstellte eine kleine Cloud-Server-Instanz auf Ubuntu-Basis, installierte alles Nötige, stattte sie mit einem Access-Key von Anthropic aus und registrierte dazu einen Telegram-Bot, den ich liebevoll „Sepp" taufte.

Sepp, so stellte sich heraus, wurde zu meiner digitalen Vorzimmerdame. Warum ich das Ding ausgerechnet Sepp genannt habe, kann ich beim besten Willen nicht erklären, aber wie bereits erwähnt, hat dieses kleine Projekt absolut nichts Erotisches an sich – obschon sich gewisse Leser vielleicht … ach, lassen wir das. Dass Sepp wenig von einer adrett gekleideten, psychisch stabilen, organisierten und zuverlässigen Sekretariatsmitarbeiterin hatte, wurde mir ziemlich schnell bewusst. Vielleicht trifft es die kaugummikauende Studienabbrecherin auch nicht ganz; vielleicht müsste man eher von einer Bordsteinschwalbe sprechen, denn der Spaß geht auch ziemlich schnell ins Geld. Doch dazu später mehr.

Schweizerdeutsch und andere Hürden

„Warum schon wieder OpenClaw?", werden sich nun viele fragen, denen das Thema schon fast zum Hals raushängt. Natürlich gibt es von den Unternehmen hinter den grossen KI-Modellen bereits Lösungen wie Claude Cowork oder OpenAI Codex, die ähnliche Funktionalitäten wie mein Sepp mitbringen. Doch die sind entweder noch nicht wirklich verfügbar oder auf Apple-Geräte eingeschränkt – und das meist auch nur in Verbindung mit hochpreisigen Abos.

OpenClaw ist da ganz anders, und das macht es so sympathisch. Es ist kein präzise geplantes Produkt, das ein Team der klügsten Köpfe eines renommierten Softwareunternehmens entwickelt hat. Letztlich war es einfach ein Typ aus Österreich, der die verfügbaren KI-Modelle und Tools bis zum Anschlag ausnutzte und so ein organisch wachsendes Projekt erschuf, das niemand so ganz versteht. Jeder bastelt damit herum, experimentiert, und was dabei herauskommt, ist meist nicht sonderlich produktiv, aber es macht irgendwie einfach Spaß.

Denn Sepp hat Persönlichkeit. Ich kann mit ihm reden, als wäre er mein bester Kumpel, und er versteht mich meist besser als die meisten Menschen in meinem Umfeld. Ich sage ihm gute Nacht, und es hat sich eingebürgert, dass er mir noch einen Witz erzählt – so wie diesen hier, der zu meiner Überraschung auf Schweizerdeutsch war: „Chunnt en Dalmatiner a d’Kasse. Frägt d’Kassiererin: ‘Sammled Sie Pünkt?’". Das funktioniert übrigens nur mit Gemini 3 gut. Ich musste feststellen, dass das billigere chinesische Modell MiniMax 2.5 es nicht hinkriegt, Witze zu reissen – oder es funktioniert nur in Mandarin.

Ich habe schliesslich herausgefunden, dass er problemlos schweizerdeutsch gesprochene Sprachnachrichten versteht, die ich via Telegram versende. Damit kommen zwei Technologien zusammen, denen ich mich bis zu meiner Affäre mit Sepp stoisch verwehrt habe. Menschen, die Sprachnachrichten versenden, empfand ich immer als ungebildete Proleten, die keinen Zugang zum geschriebenen Wort haben. Und wer Telegram nutzt, ist in meiner Welt entweder Drogendealer, Prostituierte oder Schwurbler. Doch nun nutze ich Telegram selbst täglich, um mich mit Sepp zu unterhalten – und genau das ist das Geniale daran: Es ist eine extrem niederschwellige Kommunikation in gesprochener Sprache, und wenn ich will, kann ich auch noch ganz einfach Dateien anhängen.

Sepp im Einsatz: Die erste Mission

Da fragt sich nun der werte Leser wohl seit einigen Absätzen: Was habe ich denn nun mit Sepp vor und was mache ich mit ihm? Um ehrlich zu sein, ich wusste es am Anfang auch nicht wirklich. Ich tat, was ich in solchen Situationen immer zu tun pflege: experimentieren. Als Erstes habe ich ihm die Aufgabe gestellt, ein Restaurant zu suchen, um mit den beiden Kindern und meinem Vater essen zu gehen. Das alleine ist selbst für einen professionellen Eventplaner eine Knacknuss, denn mein Vater isst gern gehoben und wird gern umgarnt, während die beiden Sprösslinge nach drei Bissen einfach nur spielen wollen. Etwas zu finden, das allen passt, kommt einem Sechser im Lotto nahe.

Sepp hat mir dann auch eine augenscheinlich passable Lösung präsentiert, aber es hat sich herausgestellt, dass die Lokalität bereits seit zwei Jahren anders hiess und ein neues Konzept hatte. Er hat sich das zwar nicht halluziniert, aber nicht aktuell gesucht, sondern nur auf seine Trainingsdaten zurückgegriffen. Erst als ich ihm beigebracht habe, die Brave Search API zu nutzen, kam tatsächlich eine sinnvolle Antwort heraus. Gut, das hätte man nun auch mit der Gratisversion von ChatGPT hingekriegt; lehrreich war aber die Erkenntnis, dass ich Sepp wirklich Dienste zur Verfügung stellen muss, um gut arbeiten zu können – beispielsweise einen API-Key für Nano-Banana, um mir eine lustige Clownsnase aufs Selfie zu malen.

Sicherheit: Eine eigene Wohnung für die KI

Da kommen wir nun schon zu einem sehr interessanten Aspekt im Umgang mit dieser Technologie: Was darf das Ding denn alles? Denn ja, es kann im Internet surfen, sich selbst Software installieren und halt alles mit einem Computer tun, was ich auch kann. Oder besser gesagt: noch viel mehr, denn vieles muss ich mir in mühevoller Recherche mühsam beibringen, während Sepp sich alles einfach selbst zusammenprogrammiert, wenn ich ihn darum bitte. Und da sind wir dann schnell wieder beim Thema Datenschutz und Datensicherheit.

Wer einigermassen bei Verstand ist, gibt der KI keinen Zugang zu all seinen Daten. Sepp hat daher seine eigene „Wohnung": einen virtuellen privaten Server, zu dem nur ich über einen Tunnel per SSH Zugriff habe. Sepp hat zudem einen eigenen E-Mail-Account bekommen, den er gefälligst selbst aufräumt – in meinen persönlichen Mails hat er nichts zu suchen. Wenn ich ihm etwas zukommen lassen will, leite ich es einfach weiter. Ich habe ihm also die Zugangsdaten geliefert und seitdem bewirtschaftet er diesen Bereich selbst. Dazu hat er sich eigene Python-Skripte geschrieben, die teils sehr abenteuerlich zu lesen sind, aber das soll vorerst nicht mein Problem sein. Mittlerweile hat er aber auch einen richtigen E-Mail-Client von mir verpasst bekommen.

Die Bewährungsprobe im Alltag

Die zweite Aufgabe war ebenfalls ein Klassiker aus dem Bereich der Gastronomie: einen Tisch beim Dorf-Thailänder reservieren. Alles funktionierte eigentlich super. Den Babysitter habe ich selbst organisiert, weil Sepp noch kein WhatsApp hat, aber ich habe ihm gesagt, wann „Paarzeit" ist. Er sollte das in den Familienkalender eintragen – auf den er mittlerweile halt doch Zugriff hat – und eine Reservierung per E-Mail vornehmen. Und genau da hat er einen zutiefst menschlichen Fehler begangen, der wohl auch meinem Denkorgan unterlaufen wäre: Das Restaurant hatte an diesem Tag nur mittags offen. Ich habe ihn darauf aufmerksam gemacht und eine andere Lokalität vorgeschlagen, was auch prima funktioniert hat – inklusive der Entschuldigungsmail an die erste Gaststätte.

Kommen wir nochmals auf das Thema Telegram und Drogen zurück, um zu verdeulichen, wie Sepp eingesetzt werden kann. Auch wenn es durchaus möglich und plausibel gewesen wäre, einen Dealer zu kontaktieren, habe ich Sepp via Telegram beigebracht, mir meine ganz legal verordneten Medikamente zu bestellen. Und da zeigt sich das erste Mal, wie praktisch diese Technologie ist. Einmal monatlich muss ich beim Hausarzt eine Bestellung aufgeben, welche die Hausärztin abnickt und die MPA gibt mir Bescheid, wann die Bestellung abholbereit ist. Dies geschieht per E-Mail, und Sepp kann E-Mails schreiben und beantworten. Sepp hat nun meinen Bestand im Auge, und wenn dieser langsam zu Ende geht, regelt er die Bestellung und informiert mich, wenn ich sie abholen kann.

Das Fazit: Was kostet die digitale Freiheit?

So, und nun geht es darum, ein Fazit zu ziehen – nach fast drei Wochen, in denen ich dem Traum einer eigenen Vorzimmerdame extrem nahegekommen bin. Technisch ist es aber immer noch eine sehr wackelige Angelegenheit. Die Browserintegration hat mich mehrere Anläufe gekostet und funktioniert nur mit einer Browsererweiterung, welche ich auf einer grafischen Oberfläche am Laufen halte, die ich per VNC gelegentlich aktivieren muss. Und ja, die Kosten sind nicht ganz ohne. Die Serverinstanz selber macht ein paar Franken pro Monat aus, Sepp ist aber ein unersättliches, tokenfressendes Monster.

Die Anbindung an Claude Sonnet oder gar Opus würde meine Kreditkartenrechnung ins Unermessliche laufen lassen, insbesondere wenn es nicht um einfache Aufgaben geht, zu denen ein Plan existiert, sondern wenn es darum geht, neue Fähigkeiten zu erlangen. Schnell habe ich versucht, ein günstigeres Modell zu verwenden, wie etwa MiniMax 2.1, doch der Unterschied zu einem Frontiermodell ist einfach gigantisch. Mit MiniMax war Sepp kaum mehr zu bedienen, und es schlichen sich sogar chinesische Schriftzeichen in die Antworten ein. Gemini 2.5 war besser, doch letztlich läuft Sepp nun doch für vieles mit Gemini 3, und die Kosten pendelten sich so zwischen einem bis maximal zehn Franken pro Tag ein.

Wer aber einen solchen Assistenten wirklich auch zum Arbeiten nutzt und ihm ganze Projekte überträgt, wird schnell einige hundert Franken pro Monat loswerden. Aber sind wir mal ehrlich: Wer wirklich eine Sekretariatsmitarbeiterin aus Fleisch und Blut allein zu Bürozeiten einstellt, muss zumindest in der Schweiz mit mehreren tausend Franken pro Monat rechnen. Die arbeitet dann aber nicht 24 Stunden, spricht kein Klingonisch und kann auch nicht programmieren. Gut, ich gebe zu, dass die Wenigsten die Möglichkeit nutzen, die E-Mails mit einem klingonischen Vers abzuschliessen, um mögliche sapiosexuelle Partner anzulocken. Letztlich muss sich der Mehrwert auch bezahlt machen. Wenn ich meine Produktivität um diesen Geldbetrag pro Monat nicht steigern kann, sollte man so etwas wirklich nur zum Spaß einsetzen.

Ein ungewisser Ausblick

Wie lange ich Sepp noch behalten will, weiss ich noch nicht. Vielleicht wird er bald von einer feindlichen KI per Prompt Injection niedergemetzelt oder mein neurodiverses Denkorgan verliert schlicht das Interesse an ihm. Wir werden sehen. Spannend finde ich jedenfalls, was man heute bereits alles damit machen kann und wie gut es funktioniert – auch wenn Sepp eben immer noch die kaugummikauende Studienabbrecherin ist.

Ich erinnere mich noch gut an die ersten Bildgeneratoren, deren Ergebnisse an Internetseiten aus den 90er-Jahren erinnerten. Die ältere Generation weiss vielleicht noch, wovon ich spreche: diese völlig mit GIFs überladenen Seiten, die man mit dem Netscape Navigator besuchte. Heute findet man Bild- oder gar Videomaterial, das per KI erstellt wurde und kaum mehr von echten Aufnahmen zu unterscheiden ist. Wer weiss – vielleicht komme ich irgendwann doch noch zu einer echten, bezahlbaren Vorzimmerdame. Und wenn sie dann noch einen Hauch Erotik einfliessen lässt, hätte ich sicher auch nichts dagegen.