• Skip to primary navigation
  • Skip to main content
  • Skip to primary sidebar

  • Getting Things Done™ (GTD)
    • Wie funktioniert Getting Things Done (GTD)?
    • GTD analog: Papiersystem
    • GTD digital: Software
    • GTD-Q Analyse
  • unverbindl. Erstgespräch
  • GTD Coaching
  • Kundenstimmen
  • Produktivität
    • Delegieren hilft, mehr zu erreichen!
    • Effizientere Meetings
    • Effizientere Web- bzw. Telefonkonferenzen
    • Das Natürliche Planungsmodell (NPM)
    • Lebensplanung & Ziele
  • Blog
    • GTD Hacks
    • Produktivität
    • Outlook
    • MS Teams
    • Besprechungstipps
    • Datenschutz
  • Podcast
  • Suche

Automatisierung mit KI: Agenten & MCP – Podcast-Transkription

21. September 2025 By Tobias Mueller-Zielke Leave a Comment

In dieser Folge unseres Podcasts (kein) Nerd Talk sprechen Moritz und ich über neue Möglichkeiten, Arbeit mit KI-Sprachmodellen zu automatisieren. Wir schauen uns insbesondere den neuen Agentenmodus von ChatGPT und das sogenannte Model Context Protocol von Anthropic, dem Hersteller der KI Claude an.

Mit MCP macht die KI kostenlos die Arbeit am Computer für Dich! Bild: Google Gemini
Mit Agenten und MCP macht die KI die Arbeit am Computer für Dich! Bild: Google Gemini

Transkription der Zusammenfassung

Diese Transcription wurde mit TurboScribe.ai erstellt, dem Lieblings-Transkriptionsservice von Tobias.

[Tobias]
Wir haben heute besprochen, dass man Dinge automatisieren kann mit KI, und zwar auf verschiedene Varianten. Angefangen hat da Moritz.

[Moritz]
Genau, da haben wir uns mal den neuen Agenten-Modus angeschaut, der jetzt gerade auch bei Chat-GPT ziemlich präsent ist. Da sind wir in dem Zuge nochmal gesprungen auf etwas, was es länger gibt, nämlich die GPTs und die normalen Chat-Verläufe. Und dann ging es weiter in eine etwas nerdige Richtung mit den MCPs, wo der Tobias drüber berichtet hat.

[Tobias]
Genau. Und das ist eben eine nahezu kostenlose Möglichkeit, Programme auf eurem Rechner fernzusteuern durch eine KI, was natürlich die Möglichkeit gibt, dass man einfach mit einer lokalen Umgebung arbeitet. Also, ich habe ein paar Beispiele gebracht.

Ein anderes Beispiel wäre, ich kann so natürlich meine KI auch auf den Browser loslassen, muss ihr aber meine Passwörter nicht geben, indem ich mich einfach vorher bei allen Accounts, die die KI für ihre Arbeit braucht, schon einlogge. In dem Moment kann die arbeiten und braucht nicht meine Daten zu haben, bis sie sich auf sowas einloggt. Alles davon, denke ich, ist es absolut wert, mal auszuprobieren. MCP, Model Context Protocol, nur für die, die auch ein bisschen Nerd-Gene in sich haben, da muss man schon fummeln.

Show Notes

  • Unsere ⁠Podcast-Seite⁠ mit Links zu den Transkriptionen der Episoden zum schnelleren Nachschauen von spannenden Stellen.
  • Tobias‘ Artikel über GPTs inkl. Links zu seinen GPTs bei ChatGPT. Die analoge Funktion bei Google Gemini heißt Gems.
  • Medium-Artikel zu Tobias‘ Obsidian-Automatisierung in der Publikation MCP Server.
  • Youtube-Video über MCP von der Nerd-Computerzeitschrift c’t, über das Tobias auf die Technologie gestoßen ist.
  • MCP SuperAssistant Chrome Extension. Mit dieser Erweiterung für Chromium-Browser soll man MCP laut dem Video der c’t auch mit ChatGPT und Google Gemini nutzen können. Bei mir hat es bei mehreren Versuchen nicht geklappt.
  • Website mit Überblick über MCP-Server (trotzdem immer selbst prüfen!)

Transkription des eigentlichen Gesprächs

Diese Transcription wurde mit TurboScribe.ai erstellt, dem Lieblings-Transkriptionsservice von Tobias.

[Moritz]
Hallo Tobias, heute ist es mal wieder soweit für ein Nerdtalk. Ich freue mich auf jeden Fall, mich mit dir mal wieder ausgiebig austauschen zu können. Wie ist die Lage bei dir?

[Tobias]
Ja, wunderbar. Ich freue mich, dass es auch mal wieder klappt. Wir beide haben ja ein bisschen mit fortgeschrittenen KI-Tools getestet, was man so machen kann.

Und du hast mir geschrieben, du hast jetzt einiges mit Agenten gemacht. Als ich das letzte Mal Agenten ausprobiert habe, ging da noch nicht viel. Das wird so ein halbes Jahr her sein.

Deswegen bin ich gespannt. Was geht da inzwischen?

[Moritz]
Ja, wie wir alle wissen, tut sich in der Welt der künstlichen Intelligenz extrem viel. Und was gestern noch ziemlich neu und heiß war, ist morgen schon wieder fast veraltet. Und ein Thema, was aktuell auch in den sozialen Medien ziemlich gehypt wird, ist das Thema Agentenmodus.

Der je nach Modell, was man nutzt, zum Teil auch anders bezeichnet wird. Aber jetzt ganz konkret bei ChatGPT gibt es jetzt die Funktion Agentenmodus. Und das sollen letztendlich kleine Helfer sein, die einem auch größere Arbeitspakete oder Arbeitsschritte abnehmen können.

Hört sich erstmal sehr spannend an und da hat der Tobias auch gleich eine Frage.

[Tobias]
Ja, geht mir nur darum, ist wahrscheinlich wieder nur im Plus-Account. Also man muss Geld einwerfen, damit man den Agenten hat.

[Moritz]
Das ist eine gute Frage. Da ich schon seit weit über dem Jahr den Plus-Account habe und seitdem ich mich gekündigt habe, weiß ich halt nicht, was nicht im Plus-Account ist. Deswegen ist ja wahrscheinlich, wenn du sagst, er wird bei dir nicht angezeigt, dann scheint das aktuell etwas zu sein, was nur in Plus ausgerollt ist.

Auf jeden Fall ist es jetzt, wir haben gerade Mitte August, so im Zuge des Modells, des Fünfer-Modells bei ChatGPT jetzt rausgekommen. Und ich hatte jetzt ein paar Mal davon gehört, bisschen was davon gelesen und hatte jetzt vor kurzem auch ein Use Case, wo ich gesagt habe, Mensch, das kann ich hier mal ganz gut ausprobieren. Und es ging darum, dass ich vor circa zwei Jahren einen Handy-Vertrag bei Freenet abgeschlossen habe.

Die haben ein ganz gutes Angebot gehabt, wo man im Telekom-Netz 25 Gigabyte für 9,99 Euro nutzen konnte. War damals ein unschlagbares Angebot. Wenn man es nicht kündigen würde, würde es direkt hochschießen, jetzt über den nächsten Monat auf 39,90 Euro.

Deswegen habe ich mir natürlich in meinem System einen Vermehr gemacht und weiß aber auch, manchmal ist es ja ganz sinnvoll, erst mal anzurufen und zu sagen, könnt ihr mir ein besseres Angebot machen. Und in der Vergangenheit habe ich erlebt, dass es oft passiert.

[Tobias]
Klappt bei mir meistens auch.

[Moritz]
Bei Freenet war es nicht der Fall. Bevor ich gekündigt habe, sind sie überhaupt nicht entgegengekommen. Da haben sie gesagt, naja, der Standard eines Neuabschlusses wäre 16,99 Euro und das ist das Einzige, was sie mir anbieten können.

Dann habe ich gekündigt. Dann haben sie mich versucht, von der Kündigung wegzubewegen und haben gesagt, sie können mir 14,99 Euro anbieten. Da habe ich gesagt, wenn ihr den Vertrag so fortführen würdet, wie ich ihn jetzt habe, würde ich dabei bleiben.

Aber da bin ich nicht bereit, weil es gibt doch eine ganze Menge Anbieter. Und jetzt kommen wir genau zum Übergang zum Agenten. Denn in der Vergangenheit hätte ich mich jetzt hingesetzt und hätte eine Google-Recherche gemacht.

Und das dauert in der Regel dann auch mal eine Stunde oder auch ein paar Stunden, je nachdem, wie ernst man es meint, nach dem Pareto-Prinzip geht oder wirklich die letzten 20% rausholen will. Auf jeden Fall etwas, was Zeit kostet und beim Thema, was man nicht so spannend findet, auch eher nervig ist. Da dachte ich, Mensch, da könnte der Agentenmodus doch mal ins Spiel kommen.

Und habe bei ChatGPT ganz normal das Chatfinster geöffnet. Dann kann man Agentenmodus anklicken und dann habe ich die Situation geschildert. Ich habe einen Handyvertrag.

Der hat folgende Konditionen. 9,99 Euro bei 25 Gigabyte im Telekom-Netz mit eSIM. Damit bin ich sehr zufrieden.

Und ich möchte bitte, dass du mal prüfst, ob es ein gleiches oder besseres Angebot gibt. Und dann habe ich den Agenten arbeiten lassen. Und das ist das Erste, was beim Agentenmodus ein bisschen ungewohnt ist.

Normalerweise stellt man bei ChatGPT eine Anfrage und die ist dann nach einer Sekunde oder maximal nach 30 Sekunden beendet. Und der Agent, der braucht ein bisschen Zeit.

[Tobias]
Der muss arbeiten.

[Moritz]
Genau. Der hat dann ungefähr eine halbe Stunde vor sich hingearbeitet. Ich habe dann parallel andere Dinge gemacht.

Und nach einer halben Stunde ist er dann fertig. Das kann auch im Hintergrund passieren. Also ChatGPT muss gar nicht mehr geöffnet bleiben.

Und ich war wirklich positiv überrascht. Er hat mir dann direkt drei Angebote ausgewiesen, die alle drei gleich oder besser waren. Und jetzt habe ich am Ende aufgrund dieser Recherche ein neues Angebot, wo ich zum gleichen Preis, 9,99 Euro, im Telekom-Netz mit eSIM nicht nur 25 Gigabyte habe, sondern 30 Gigabyte.

Das war für mich so ein kleiner, netter Use Case. Und das geht da so ein bisschen in die Richtung, wo wir schon mal gesprochen haben. Grundsätzlich in der Arbeit mit KI versuche ich, bei Themen, die gerade anstehen, immer mal innezuhalten und mich zu fragen, kann mir auch KI dabei helfen?

Und das war so ein konkretes Beispiel. Ich bin sicher, mein Lieblingsnerd hat auch eine ganze Reihe von Beispielen, die mir jetzt schon durch den Kopf gehen, wo man den Agenten auch einsetzen könnte.

[Tobias]
Auf jeden Fall. Mich würde noch interessieren, du hast glaube ich nicht nur OpenAI, also ChatGPT getestet, sondern auch noch die Microsoft-Geschmacksvariante, oder? Wo waren da die Unterschiede?

[Moritz]
Ich habe es tatsächlich noch nicht getestet. Ich habe nur erst mal geguckt, wo die Unterschiede liegen. Weil bei ChatGPT habe ich in der Vergangenheit ja schon eine ganze Reihe GPTs angelegt.

Das sind so kleine Programme, die für spezifische Herausforderungen, Probleme helfen. Und das ist etwas, was in meinen Augen auch schnell zur Verwirrung führt, dass je nach Modell, was man nutzt, das gleiche etwas anders heißt. Bei ChatGPT haben wir GPTs und den Agentenmodus.

Bei Microsoft Copilot haben wir dann halt Agenten, die eigentlich GPTs sind. Und auch eine Möglichkeit, einen Agentenmodus zu starten, wo ich jetzt aber nicht genau weiß, wie der jetzt benannt wird.

[Tobias]
Ja, genau. Ich hatte mal irgendwie diese GPTs für die Zuhörer, was macht so ein GPT? Im Endeffekt ist das nicht viel mehr, als dass man das, was man normalerweise ins Prompt schreibt, in eine Hintergrundanleitung für die KI schreibt.

Das heißt immer, wenn die KI mit diesem Prompt gestartet wird, da klicke ich dann einfach drauf, kann dem Ding einen Namen geben, dann weiß das schon automatisch, was man macht. Das ist mein Lieblings-Use-Case für meinen Blog. Mag ich überhaupt nicht, mir so Texte zu überlegen, wie ich es auf LinkedIn teile.

Also so irgendwie 150 bis 200 Zeichen und mit Emojis und Haste nicht gesehen, damit halt der Algorithmus einen hochpuscht. Und da habe ich mir einfach so einen GPT gebaut. Und jedes Mal, wenn ich jetzt einen neuen Blogartikel schreibe, packe ich den in einen PDF, lade das PDF in diesen GPT hoch, klicke senden und dann kommt dann mein Post für LinkedIn raus.

Bisschen muss man immer nachfallen, aber ist perfekt. Das sind solche GPTs oder dann Microsoft-Agenten, wo es darum geht, einfach was, was man immer wieder macht, einfacher vom User-Interface zu machen.

[Moritz]
Ja, das ist ein schönes Beispiel, vielen Dank. Dafür, um das noch ein bisschen zu erweitern, so ein GPT kann ein ganz normaler Prompt sein, also wirklich etwas sehr Kurzes, den man regelmäßig nutzt. Es kann aber noch befüttert werden.

Das man sagt, normalerweise, wenn man eine Anfrage stellt, wird der relativ tief in dem ganzen LLM, Large Language Modell von Chat-GPT gesucht. Wenn ich das aber nicht möchte, wenn ich eigentlich sage, ich habe schon einen Raum, in dem die relevanten Informationen drin sind, das kann ein Benutzerhandbuch sein oder das kann für einen Sport ein gewisses Regelbuch sein, dann kann ich ein GPT bauen, der sich dann wirklich nur auf dieses Benutzerhandbuch oder auf diese Regeln bezieht. Und dadurch kriegt man in der Regel deutlich bessere, deutlich konkretere Antworten, auch mit weniger Fantasieren.

Dafür finde ich es sehr angenehm. Deswegen habe ich vor einiger Zeit auch schon mal ein Golf-Regel-GPT gebaut, wo dann die aktuellen Golf-Regeln und die Auslegungen zu den Regeln sind. Das sind ziemlich viele.

Golf-Regeln sind so knapp 25, aber wenn es um die Auslegung geht, das ist, glaube ich, mittlerweile weit über 1.000, da kann es auf dem Golfplatz schnell zu Diskussionen kommen. Und bevor man das Regelbuch zückt, zücke ich jetzt einfach mein Handy, öffne diesen GPT, spreche meine Situation ein und dann kriege ich direkt eine Rückmeldung, wie ich mich verhalten habe und wo es im Regelbuch steht bzw. welche Decision das ist.

Und das ist ein netter Use-Case, genauso wie meine LinkedIn-Beiträge. Da habe ich auch gesagt, ich habe in der Vergangenheit Beiträge gehabt, die gut gelaufen sind, die auch meinen Stil haben und habe diese Beiträge im GPT hinterlegt. Und in diesem Stil, wenn ich jetzt ein neues Thema habe, werden zu diesem Thema halt auch neue Beiträge aufbereitet.

[Tobias]
Ja, sowas will ich auch noch machen mit Blog-Artikeln, dass ich da quasi auch Entwürfe schon vorab in meiner Sprache machen lassen kann. Aber da muss ich mir erst mal die Daten ziehen. Finde ich noch einen kleinen Gegenentwurf zum Golfen.

Ja, Moritz und ich, wir haben ja ganz unterschiedliche Hobbys als Kern unserer Hobbys. Moritz ist tendenziell immer sportlich unterwegs. Bei mir hat es meistens was mit Bildschirm zu tun.

Und ich habe etwas Ähnliches gemacht. Ich habe mir auch so eine Datenbank hochgeladen. Und zwar habe ich einfach nachgeschaut, wie kann ich denn bei allen Video- und Computerspieleanbietern, bei denen ich einen Account und eine Bibliothek an Spielen habe, wie kann ich diese Daten exportieren.

Habe die dann aus allen Quellen, die ich da benutze, hochgeladen in so einen GPT. Und immer, wenn ich jetzt ein gewisses Genre spielen will oder sicher gehen will, habe ich das Spiel schon bei einem Sale, kann ich einfach diesen GPT fragen. Und fragen, ja, welche Fassung habe ich denn da schon?

Und macht das Sinn? Und wie lange geht das Spiel? Ja, also es wird alles quasi miteinander verknüpft.

Aber halt auf meine persönliche Bibliothek, die ich halt gelegentlich abonniere, aktualisieren muss. Der Hintergrund ist für die Gamer unter euch, wer es noch nicht weiß, bei Epic Games gibt es jede Woche ein bis zwei anständige bis sehr gute Spiele umsonst. Genauso bei Amazon Prime Gaming.

Da gibt es im Monat immer so fünf bis zehn. Und da verliert man einfach relativ schnell den Überblick, wenn man die einfach nur durchklickt und in der Bibliothek hat. Und aus genau dem Grund habe ich mir das gebaut.

[Moritz]
Sehr cool. Also so gesehen auch ein zweites Gedächtnis, was aber so einen sehr speziellen Bereich im Gehirn abdeckt.

[Tobias]
Vor allem halt über mehrere Datenbanken hinweg. Also es ist halt blöd, wenn du immer gucken musst, habe ich es bei Steam, habe ich es bei Epic, habe ich es bei Good Old Games, habe ich es bei Sony, habe ich es bei … und so weiter und so fort.

[Moritz]
Ich glaube, das ist so eine Vorstufe von dem, was uns zukünftig blüht im positiven Sinne, dass wir wirklich alles, was wir irgendwann mal geschrieben haben, gemacht haben, erarbeitet haben, alles in einem System liegen haben und dann nicht mehr die Angst haben müssen, irgendwas zu vergessen, sondern relativ schnell die Sachen finden. Das ist in deinem GPT, den du gerade geschildert hast, konkret fürs Gaming, für Spiele. Aber sozusagen die zukünftige Stufe wird das halt global sein, für eigentlich alle Themen.

[Tobias]
Ja, genau, genau. Und da würde ich jetzt auch mal direkt abbiegen zu dem Thema, das ich mitgebracht habe. Oder hast du noch was zu ergänzen?

[Moritz]
Vielleicht noch eine letzte Ergänzung zu ergänzen, wofür es sich auch als Use Case gut eignet, was, denke ich mal, fast jeden betrifft, ist die Reiseplanung. Das habe ich auch schon ausprobiert, dass man sagen kann, ich möchte gerne in dem und dem Zeitraum in eine Region, wo die und die Sprache gesprochen wird, wo die und die Temperaturen sind, wo meine Flugzeit maximal so und so lange ist, wo die Sicherheitslage auch so ist, wie ich mir das wünsche, und ich möchte maximal so und so viel Geld ausgeben. Und dann hat man einen Agenten, der im Hintergrund arbeitet und dann auch nach einer halben Stunde genau sagt, welche Reiseziele für dich in Frage kommen, von wo du abfliegen kannst, wie teuer die Flüge sind, wie toll die Lebenserhaltungskosten sind, etc.

Das habe ich auch schon ausprobiert, war auch nicht schlecht. Und um das Thema Agenten und GPTs nochmal abzuschließen, gehen wir jetzt nochmal in eine etwas nerdigere Richtung. Denn der…

[Tobias]
Halt, halt, halt, jetzt habe ich noch was. Okay. So nicht.

Bei mir ist jetzt gerade bei Reisen eingefallen, auch ein Use Case. Sicher sind ein paar von den Zuhörern nicht so viel auf KI unterwegs wie wir. Was ich da echt wirklich gut finde inzwischen, ist einfach alte Chats, die man hat, oder einen Chat mit einem KI-Bot, die hat man ja alle in so einem Verzeichnis, in so einer History mit drin, die einfach bei einzelnen Themen immer weiter zu pflegen.

Zum Beispiel hatte ich da einen administrativen Vorgang, der zieht sich jetzt sicher schon drei Monate, wo dann immer wieder Schreiben hin und her gehen. Da mache ich natürlich datenschutzkonform, packe ich da eben den Text rein, ohne Namen, und lasse mir dann eine Antwort formulieren. Dann kommt irgendwie ein Brief von der Gegenseite, dann schreibe ich wieder hier, das denke ich, und formuliere das mal durch.

Das klappt mit Google Gemini wahnsinnig gut. Das benutze ich gerade aktuell meistens, weil ich es einfach letztes Jahr im Herbst mit dem neuen Pixel 9 damals für ein Jahr umsonst mitbekommen habe. Deswegen habe ich da quasi meine Standard-KI.

Inzwischen ist sie auch wirklich schon seit einem halben Jahr sicher, so gut wie alle anderen. Und nur wenn ich dann irgendeinen Feature brauche, zum Beispiel die Sache mit dem Blockumwandeln, klappt mit OpenAI aktuell noch besser als mit Gemini, dann hole ich mir halt immer für einen Monat mal wieder ein Abo zwischendurch, wo ich es gerade brauche. Und ja, hast du sicher auch schon gemacht sowas, nehme ich an, oder?

[Moritz]
Also da kommen wir wirklich sozusagen wieder von einem Thema ins nächste Thema. Das ist so mein tägliches Doing, was du gerade beschreibst. Egal, welche KI man nutzt, in der Regel ist es ja oft Chat-basiert, und dann hat man eine Art Bibliothek, die meistens auf der linken Seite ist, wo sich dann die Chats irgendwie von neu zu alt durchgehen.

Und egal, woran ich arbeite, doch in welchen Projekten ich bin, nutze ich regelmäßig halt auch KI als Unterstützung, und diesen Chat kann ich halt auch immer kopieren. Dann geht man auf die drei Punkte, dann kann man den teilen, und dann habe ich einen Link. Das heißt, ich kann auch immer wieder zurückverfolgen, wann und wo habe ich denn daran gearbeitet.

Zum Teil brauche ich das gar nicht, weil zum Beispiel bei Chat-GPT hat man auch eine Suchfunktion. Und dann muss ich halt nur ein paar Stichpunkte eingeben, und dann wird der richtige Chat gefunden. Aber wie bei dir, meine Chats sind selten abgeschlossen, sondern sind halt wirklich Leben.

[Tobias]
Wie nach Thema halt, ne?

[Moritz]
Genau, also wenn die Themen irrelevant sind oder Sachen, die ich einfach mal so zwischendurch frage, dann lösche ich die Chats auch regelmäßig, um einfach für mich auch Übersichtler zu halten. Und man kann auch eine Stufe weitergehen, zumindest bei Chat-GPT, da kann man auch Projektordner anlegen. Das heißt, wenn man da einen speziellen Kunden hat oder etwas hat, was sich dann wiederholt, da kann man dann mehrere dieser Chats in diesen einen Projektordner legen und hat dann halt auch sozusagen die Grundlagen an einem Ort, wo es dann ein bisschen übersichtlicher ist und ein bisschen mehr gesammelt wird.

[Tobias]
An der Stelle noch kurz die Info, für die, die es nicht mitbekommen haben. Angenommen, ihr teilt eure Chat-GPT-Chats über den Teilen-Knopf mit anderen Menschen, dann ist vor kurzem rausgekommen, sind die öffentlich. Dann werden die indiziert von OpenAI und von Google und sind theoretisch auffindbar.

Wenn ihr das googelt oder eine KI fragt, wird ihr euch erklären, wie man es abdreht. Aber mir geht es darum, dass ihr darauf sensibilisiert seid. Also sensible Dinge solltet ihr lieber nicht teilen oder wenn, dann relativ zeitnah die Teilung wieder rausnehmen.

[Moritz]
Und ich glaube, das war auch ein Gerichtsurteil, was jetzt in dem Jahr stattgefunden hat in Amerika, dass OpenAI darauf, ich weiß nicht, verklagt wurde oder zumindest verdonnert wurde in die Richtung, weil man einfach sagt, wenn ein Schindluder getrieben wird, irgendjemand etwas ganz Schlimmes macht mit der KI, dass man dann die Möglichkeit hat, zurückzufolgen, wie es dazu gekommen ist.

[Tobias]
Ja, ich bin mir nicht sicher, was da war, aber ich weiß auch, da ist irgendwas. Aber nur die große Gefahr jetzt für die Zuhörer wäre, wenn ihr irgendwie eine Diskussion zu irgendwelchen medizinischen Themen, wo eh KI nicht unbedingt die beste Idee ist, führt und teilt, dann sind die eben potenziell öffentlich verfügbar. Gut, dann bieg ich noch schnell ganz hart, ganz nerdig ab.

Und zwar kann man eben mit Agenten automatisieren, wie Moritz das erklärt hat. Man kann aber seit Ende 2024 auch ein bisschen nerdiger automatisieren. Und das magische Wort dazu oder das magische Kürzel heißt MCP und steht für Model Context Protocol.

Ist ein Open Source Standard, der von Anthropic, das ist der Hersteller von Claude, auch eine der großen KIs, veröffentlicht wurde. Und was man damit machen kann, ist richtig, richtig cool, meiner Meinung nach, wenn es funktioniert. Es ist aktuell noch nicht in einem Stadium, wo ich es jedem normalo empfehlen würde, zu nutzen.

Es sei denn, er hat eine gewisse Geduld und Affinität für nerdige Anwendungsfälle, weil man muss da teilweise Helferprogramme laufen lassen, sogenannte MCP Server. Und was das ermöglicht, ist, dass man dann eine beliebige Anwendung, zum Beispiel Excel, durch eine KI steuern lassen kann. Am besten funktioniert das aktuell mit Claude.

Die haben es erfunden und damit habe ich auch am meisten Erfolg gehabt beim Experimentieren. Theoretisch gibt es Anwendungen, die eine Brücke zu den anderen KIs bauen, also zu JetGPT und zu Gemini. Bei mir hat das nie richtig gut funktioniert, auch obwohl ich mal eine Viertelstunde hier und da reingepackt habe, um es auszuprobieren.

Was ich jetzt aber mit Claude machen kann, weil es da gut funktioniert, ist, ich kann, sofern es einen sogenannten MCP Server für die jeweilige Software gibt, die fernsteuern. Und immer, wenn die KI auf so eine Schnittstelle zugreift, muss ich das beim ersten Mal auch genehmigen. Das heißt, ein bisschen ist auch sichergestellt, dass die KI da kein Schindluder treibt.

Dennoch, ganz, ganz dicker Disclaimer. Wenn ihr irgendeinen MCP Server aus dem Netz runterladet, kann es sein, dass der was anderes macht, als was draufsteht. Also überlegt euch, ob es das wert ist.

Schaut nach irgendwelchen Quellen, Reviews und so weiter, um sicherzugehen, dass da kein Quatsch passiert.

[Moritz]
Okay, also hört sich auf jeden Fall spannend an. Und wie du schon gesagt hast, ein bisschen nerdig. Deswegen müssen wir jetzt mal gucken, wie wir es auch für die Normalos und mich genau begreifbar machen.

Ich habe einen Use Case. Genau, aber ich frage schon mal in die erste Richtung. Du hast gerade von MCP Server gesprochen.

Du hast gesagt, ein MCP ist etwas, was Anthropic, also im Bereich der Claude-KI, mitentwickelt wurde.

[Tobias]
Das ist der Kommunikationsstandard.

[Moritz]
Das ist der Kommunikationsstandard. Und dann kann ich zum Beispiel über Claude auch sagen, ich kann damit andere Programme wie Excels mitsteuern.

[Tobias]
Genau. Und inzwischen sind sie auch so weit, dass man es relativ anwenderfreundlich einfach als Erweiterung manche Dinge aktivieren kann. Zum Beispiel kann ich da anklicken, direkt bei den Erweiterungen von Claude.

Hier greife ich auf mein Dateisystem zu. Dann kann ich zum Beispiel sagen, sortiere mir meine Dateien links rum oder rechts rum, wenn man es so will. Man kann auf Windows zugreifen.

Auf jedes Programm, das unterstützt wird, entweder durch Anthropic Claude oder durch eine Hilfssoftware.

[Moritz]
Okay, das heißt sozusagen, kann ich mir das vorstellen wie APIs, sozusagen Schnittstellen, die entwickelt werden?

[Tobias]
Ist so ähnlich wie eine API, ja.

[Moritz]
Also es kann also sein, dass Anthropic sagt, wir können nicht alles auf einmal machen, aber es gibt bestimmte Programme, die sehr viel, sehr gerne genutzt werden. Deswegen konstruieren wir diese Schnittstellen. Es kann aber auch sein, dass es sozusagen Zwischenhändler gibt, die sagen, Mensch, da gibt es etwas, was viele Leute gebrauchen könnten, aber sie wurden auch hier entwickelt, und das bieten wir jetzt an.

Und da siehst du wahrscheinlich auch so ein bisschen die Gefahr, dass sich dieser Zwischenhändler, der sich hier zwischensetzt, nicht immer das Beste im Schilde führen muss.

[Tobias]
Genau. Und es kommt aber natürlich dann auch auf das Tool an. Der Beispielfall, den ich mitgebracht habe, da habe ich gerade heute damit experimentiert.

Wir sind ja beide große Fans von Readwise, beziehungsweise Readwise Reader. Das, ganz kurz zusammengefasst, ist einfach eine Software, die verwaltet die Markierungen, die man in digitalen Büchern hat oder von klassischen Büchern importiert. Und der Reader ist so etwas wie früher, ja, halt so ein Tool, wo man Webseiten hinschicken kann, und dann kann man sie ohne Werbung lesen und Markierungen machen und so was.

Das ist der Readwise Reader. Und was ich jetzt überlegt habe, ist, ein Freund von mir hat mir erzählt, Moritz weiß das auch, dass man die Daten in Obsidian exportieren kann. Obsidian ist eine relativ gehypte Software, Open Source komplett, bei der es darum geht, Notizen zu sammeln, insbesondere auch, wenn es darum geht, so etwas wie einen Zettelkasten zu bauen, wo man sich so strukturiert, dass man später einfach ein Buch zu einem Thema, das einen bewegt, schreiben kann.

Und dann habe ich gedacht, da habe ich mal einen guten Use Case. Denn ich bin allgemein immer zu faul, wenn ich einen Artikel gelesen habe und archiviere, beziehungsweise eine Markierung gemacht habe, diesen Artikel sauber zu vertagen. Also irgendwie dann KI als Tag hinzuzufügen oder Produktivität oder was mich halt interessiert daran.

Dann habe ich gedacht, warum lasse ich das nicht einfach Claude machen? Also bin ich wie folgt rangegangen. Ich habe geguckt, gibt es denn für Obsidian einen MCP Server?

Und den gibt es. Der ist sogar quasi eingebaut. Da muss man ein Community Plugin installieren.

Gibt es natürlich auch einen Artikel dazu bei mir. Das aktiviert eine API oder stellt eine API bereit. Und an diese API dockt sich dann Claude quasi direkt an.

Also da ist schon automatisch das drin, was Claude braucht, um zuzugreifen. Das heißt, in diesem Fall braucht man nicht mehr irgendein Hilfsprogramm, sondern sobald in Obsidian dieses Plugin läuft, kann ich von Claude mit einer minimalen Konfiguration auch drauf zugreifen. Und dann habe ich eben gesagt, schnappt ihr mal meine ganzen Markierungen und schaut mal, worum es da jeweils geht.

Und entfernt erstmal alle alten Tags, weil da waren halt irgendwelche Tags drin, die Readwise schon rein macht. Und dann analysieren wir alle Artikel, was sind meine 10 häufigsten Themen, die vorkommen in all diesen Daten. Was da herauskam, hat sehr, sehr gut gepasst.

Also Produktivität natürlich und eine persönliche Entwicklung und solche Dinge. Und dann habe ich gesagt, so und jetzt vertag bitte alle 600 irgendwas Einträge mit einem bis drei dieser Tags, nicht mit mehr, weil sonst wird es ein Wildwuchs. Und dann grenzt da ein paar Probleme hin.

Das eine Problem ist, wenn Claude auf ganz viel Datei hinzugreifen will, dann läufst du über die Begrenzung raus und es dauert natürlich lange. Deswegen, was hat Claude gemacht und hier kommt wieder das nördige Problem. Nicht jeder hat die Programmiersprache Python auf seinem Rechner, denn die braucht man.

Da hat dann nämlich die KI einfach schnell ein Python Skript geschrieben, einmal um die alten Tags zu entfangen und einmal um die neuen hinzuzufügen. Und was ich jetzt eben immer machen kann, wenn ich merke, jetzt habe ich wieder ein halbes Jahr nicht aktualisiert ist, dann kann ich sagen, so hier, vergleich mal mit der alten Datenbank. Da, wo schon die richtigen Tags drin sind, die lässt du in Ruhe und bei den anderen neuen Einträgen, da fügst du bitte die, die diese zehn Standard Tags, die ich festgelegt habe, ein und müsste somit einen schönen Überblick kriegen.

[Moritz]
Vielen Dank für das Beispiel. Und das ist halt auch, finde ich ganz gut, dass es aktuell ja wirklich noch viele KIs gibt, die man nutzen kann, die auch in der kostenlosen Version wirklich sehr mächtig sind. Ich nutze hin und wieder auch Claude für bestimmte Use Cases und bin da bisher noch nicht an die Grenzen gestoßen.

Und auch bei anderen Geschichten, wie Google Gemini oder so, hat man wirklich sehr, sehr viele Möglichkeiten, auch in der kostenlosen Version.

[Tobias]
Bei Claude bin ich aktuell im bezahlten Modus. Ich glaube, das geht nur im bezahlten. Und bin trotzdem an die Limits rangekommen.

[Moritz]
Das könnte dann sozusagen einer der Use Cases sein, wenn du MCPs nutzen möchtest, dann musst du wahrscheinlich im bezahlten reingehen. Und das, was du geschildert hast, in der etwas abgespeckten Version, hatte ich bei meinem Obsidian als Plugin irgendwie schon mal mit eingefügt, dass ich einfach gesagt habe, es gibt eine Schildstelle zwischen Obsidian und zwischen Readwise und dass alles, was halt an Notizen, ob aus Podcasts, aus Artikeln oder Büchern von mir irgendwann mal markiert wurde, wird automatisch jeden Tag mit meinem Obsidian synchronisiert. Da habe ich jetzt nicht darüber hinaus noch eine KI oder ein MCP gebraucht. Das war schon so eine der Standardanwendungen, die auch so gehen.

Aber wenn man dann schon mehr machen will, dann ist da wahrscheinlich genau das, was der Tobias gerade beschrieben hat, schon ein cooles Mittel. Und jetzt, wo du darüber gesprochen hast, musste ich auch an ein Gespräch denken, was ich diese Woche hatte. Ich war bei einem mittelständischen Unternehmen, habe da mit dem Geschäftsführer, dem HR-Leiter und mit dem IT-Leiter zusammengesessen und wir haben uns Gedanken darüber gemacht, wie wird denn KI bisher bei denen im Unternehmen genutzt und was kann man noch machen?

Und ich war ziemlich positiv erstaunt, dass sowohl der Geschäftsführer als auch die beiden Leiter, die dabei waren, jeder für sich schon regelmäßig und viel KI nutzt, auch unterschiedliche Modelle. Aber es gibt halt im Unternehmen noch keine klare Governance und keiner weiß so richtig, was kann man eigentlich nutzen? Jeder zu seine kleinen Bereiche, für die er es schon anwenden kann.

Und die sind dann auch schon so gefühlt herausgespudelt von vielen Ideen, was man denn alles machen könnte im Unternehmen. Also gerade so Berichtswesen und wiederholende Tätigkeiten, wo sie sich viel Unterstützung erhoffen würden und ich könnte mir vorstellen, genau da könnten MCPs sehr gut ins Spiel kommen, wenn man sagt, da habe ich die Schnittstellen eventuell zu SAP oder zu anderen Systemen.

[Tobias]
Genau, also gibt es auch aus der Vergangenheit, sage ich mal, hat man sowas mit sogenannten Robotic Process Automation Tools gemacht, die eben das machen, was jetzt so ein MCP kann, ist auch ein Grund, warum ich so toll finde, weil es halt fast nichts kostet. Also die Menschen, die eben diese Server schreiben, die wollen nichts dafür, es ist ein offenes Protokoll. Claude ist auch sehr bezahlbar, dass im Vergleich dazu waren die früheren APA-Anbieter deutlich teurer.

APA? RPA, Robotic Process Automation. Sorry.

Genau, und das finde ich super, super cool einfach, weil es wirklich, für mich ist das der nächste Schritt der Automatisierung, eben zu wissen, okay, ich kann eine KI auch an öde Sachen, wie jetzt hier die Tags optimieren, von einer riesen Datenmenge dran laufen lassen. Ja, also das finde ich richtig, richtig gut.

[Moritz]
Und ich glaube, das ist grundsätzlich auch schon länger möglich, aber deutlich umständlicher, weil jetzt kannst du ja sagen, ich kann das halt direkt über Claude, wir haben halt diese MCP-Server machen, ansonsten muss ich halt eine ganze Reihe verschiedener Programme miteinander kombinieren.

[Tobias]
Ja, oder halt was Teures und APA-Anbieter wählen.

[Moritz]
Ich denke, jetzt gerade kennst du ja auch den Holger Gelhausen aus unserem Netzwerk, der auch sehr viel macht und der auch in den sozialen Netzwerken auch sehr, sehr viele Dinge teilt, wie er halt sozusagen selber Programme geschrieben hat und verschiedene Systeme hat, die miteinander kommunizieren, was dann mehr oder weniger nicht so normal und tauglich ist, aber ich finde, sehr genau abdeckt, was zukünftig möglich sein wird. Und da ist jetzt mit der MCP wahrscheinlich schon ein Schritt in die Richtung, wo das einem leichter gemacht wird.

Allerdings bisher wirklich nur mit Claude, sondern in anderen KIs.

[Tobias]
Ich hab’s nicht zum Laufen gekriegt. Chat-GPT hab ich nicht ausprobiert, Gemini ging nicht, obwohl es eigentlich gehen müsste mit so einer Erweiterung für Chrome, die ich auch noch dann natürlich in die Show Notes packe. Und das ist einfach den Aufwand nicht wert.

Was kostet so ein Claude-Abonne-20 im Monat, wenn mir das eine Stunde Arbeit spart? Hat sich schon gelohnt. Und dann lohnt sich’s nicht, eine Viertel- halbe Stunde dran rumzufummeln, bis ich’s mit einer anderen KI, die ich eventuell umsonst krieg, dann zum Laufen krieg.

Aber ich glaube, wir müssen in den Lifesaver, sonst spengen wir langsam unseren Zeitrahmen. Gut, also. Was haben wir heute besprochen?

Sharing is caring!

Filed Under: Allgemein, Android, App-Tipps, Datenschutz, Internet, iOS, Tools Tagged With: Published

Reader Interactions

Schreibe einen Kommentar Antworten abbrechen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Primary Sidebar

Neueste Blogartikel

  • Automatisierung mit KI: Agenten & MCP – Podcast-Transkription
  • Zeitwahrnehmung: der Zauberberg-Effekt
  • eM Client: E-Mail in richtig gut!

Tipps per E-Mail

Hier anmelden für die monatliche Mail mit 3 Tipps!

Kategorien

  • Allgemein (64)
  • Android (50)
  • Anwendungstipps (61)
  • App-Tipps (67)
  • Besprechung (9)
  • Browser-Tipps (17)
  • Bücher (5)
  • Checkliste (5)
  • Datenschutz (21)
  • Delegieren (5)
  • Digital Wellbeing (34)
  • Digitale Gesundheit (34)
  • Gadgets (8)
  • Getting Things Done (38)
  • Gruppendynamik (6)
  • GTD (47)
    • Phase 1: Sammeln (9)
    • Phase 2: Verarbeiten (9)
    • Phase 3: Organisieren (12)
    • Phase 4: Durchsehen (4)
    • Phase 5: Erledigen (7)
  • Internet (27)
  • iOS (37)
  • KeePass Passwortmanagement (3)
  • Künstliche Intelligenz (6)
  • Lean (2)
  • Lernen (23)
  • MacOS (23)
  • Meeting (12)
  • Methoden (11)
  • MS Office (24)
    • MS OneNote (3)
    • MS Outlook (12)
    • MS Teams (10)
    • MS To Do (1)
  • Pecha Kucha (5)
  • Podcast (5)
  • Präsentationstechnik (7)
  • Produktivität (97)
  • Projektmanagement (11)
  • Prokrastination (24)
  • Prozessoptimierung (22)
  • Reisen (20)
  • Tools (79)
  • Virtual Reality (1)
  • Whatsapp (6)
  • Windows (46)
  • Wissenschaft (17)

Populäre Downloads

Checkliste für effiziente Telefonkonferenzen (221 Downloads)

Reise-Checkliste (123 Downloads)

  • Impressum
  • Datenschutzerklärung

X
Cookie-Policy & Datenschutz
Diese Website verwendet Cookies. Indem Sie die Website und ihre Angebote nutzen und weiter navigieren, akzeptieren Sie diese Cookies, auch die verwendeten Cookies von Drittanbietern. Diese können Sie in Ihren Browsereinstellungen ändern. Alle Cookies akzeptierenNur notwendige Cookies akzeptierenDatenschutzerklärung
Cookie-Policy & Datenschutz

Privacy Overview

This website uses cookies to improve your experience while you navigate through the website. Out of these cookies, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may have an effect on your browsing experience.
Necessary
Immer aktiviert
Necessary cookies are absolutely essential for the website to function properly. This category only includes cookies that ensures basic functionalities and security features of the website. These cookies do not store any personal information.
Non Necessary
This is an non-necessary category.
Speichern und akzeptieren