©Screenshot Cognition
Devin AI ist der erste vollautonome KI-Softwareentwickler; revolutioniert das Tool die Branche?
Was ist Devin?
Devin ist ein KI-Tool des Unternehmens Cognition.
Das Versprechen lautet: Der vollautonome KI-Softwareentwickler Devin soll komplexe Programmieraufgaben selbstständig planen und umsetzen. Demnach soll das Tool mit einem einzelnen Prompt in der Lage sein, einen Code zu schreiben, Apps oder Websites zu erstellen.
Ausgestattet mit einer vollständigen Entwicklungsumgebung, einschließlich Shell, Code-Editor und Browser, kann Devin ohne menschliche Intervention agieren.
Welches Unternehmen steckt hinter Devin?
Das Unternehmen hinter der Künstliche Intelligenz-Anwendung heißt Cognition AI und wurde im November 2023 gegründet.
Unternehmenssitz: New York und San Francisco
CEO: Scott Wu (Harvard-Absolvent und Programmierer)
Investoren: Cognition AI hat bereits 21 Millionen US-Dollar eingesammelt. Unter anderem von Peter Thiels Founders Fund, Tony Xu, CEO von DoorDash oder Fred Ehrsam, Gründer von Coinbase.
Was macht das Unternehmen? Auf der Seite heißt es: "Wir sind ein Labor für angewandte KI mit Schwerpunkt auf logischem Denken. Wir entwickeln KI-Teammitglieder mit Fähigkeiten, die weit über die der heutigen KI-Tools hinausgehen. Indem wir uns auf das logische Denken konzentrieren, können wir neue Möglichkeiten in einer Vielzahl von Disziplinen erschließen - der Code ist nur der Anfang."
Was kann Devin?
Laut der Unternehmenswebsite soll Devin ein verlässlicher Kollege oder eine Kollegin sein.
"Devin kann komplexe technische Aufgaben planen und ausführen, die Tausende von Entscheidungen erfordern. Devin kann bei jedem Schritt relevante Zusammenhänge abrufen, mit der Zeit lernen und Fehler korrigieren.
Wir haben Devin auch mit gängigen Entwickler-Tools wie Shell, Code-Editor und Browser in einer Sandbox-Computing-Umgebung ausgestattet - alles, was ein Mensch für seine Arbeit braucht.
Schließlich haben wir Devin die Möglichkeit gegeben, aktiv mit dem Benutzer zusammenzuarbeiten. Devin berichtet in Echtzeit über seine Fortschritte, nimmt Rückmeldungen entgegen und arbeitet bei Bedarf mit Ihnen zusammen an Designentscheidungen."
Eine Auswahl an Dingen, die Devin kann:
Devin kann lernen, wie man mit unbekannten Technologien umgeht
Devin kann Apps konzipieren und umsetzen
Devin kann selbstständig Fehler in Codes finden und beheben
Devin kann seine eigenen KI-Modelle trainieren und optimieren
Devin kann sich um Bugs und Feature Requests in Open Source Repositories kümmern
Devin setzt neue Maßstäbe in der SWE-Bench-Coding-Benchmark
Devin hat in der SWE-Bench-Coding-Benchmark außergewöhnlich gut abgeschnitten, insbesondere im Vergleich zu anderen KI-Modellen. Devin löste 13,86% der gestellten Aufgaben komplett autonom, was einen signifikanten Vorsprung gegenüber anderen Modellen darstellt. Zum Vergleich: Claude 2 erreichte eine Lösungsrate von 4,8%, und ChatGPT-4 lag bei 1,74%. Diese Ergebnisse unterstreichen die fortgeschrittenen Fähigkeiten von Devin im Bereich der Softwareentwicklung und positionieren es deutlich vor der Konkurrenz.
Die SWE-Bench-Coding-Benchmark ist eine Evaluierungsplattform, die entwickelt wurde, um die Fähigkeiten von großen Sprachmodellen (Large Language Models, LLMs) bei der Lösung realer Softwareprobleme zu testen, die auf GitHub gesammelt wurden. Die Benchmark besteht aus einer Sammlung von 2.294 Software-Engineering-Problemen, die aus echten GitHub-Issues und den entsprechenden Pull Requests aus 12 populären Python-Repositories stammen.
Die Aufgabe für ein Sprachmodell im Rahmen der SWE-Bench besteht darin, eine Codebasis zu bearbeiten, um ein beschriebenes Problem zu lösen. Dies erfordert häufig das Verständnis und die Koordination von Änderungen über mehrere Funktionen, Klassen und Dateien hinweg und stellt die Modelle vor Herausforderungen, die weit über die traditionelle Codegenerierung hinausgehen. Die Modelle müssen mit Ausführungsumgebungen interagieren können, extrem lange Kontexte verarbeiten und komplexe Überlegungen anstellen
Wie kann ich Devin nutzen?
Aktuell ist das Tool noch nicht frei verfügbar.
Sie können sich auf eine Warteliste setzen lassen. Hier geht es zur Warteliste.
Auswirkungen auf die Softwareindustrie
Die Einführung von Devin könnte tiefgreifende Auswirkungen auf die Softwareindustrie haben. Durch die Automatisierung routinemäßiger und komplexer Aufgaben könnte Devin es Softwareentwicklern ermöglichen, sich auf kreativere und strategischere Aspekte ihrer Arbeit zu konzentrieren.
Zudem könnten Entwicklungskosten reduziert werden und zudem zu einer Demokratisierung des Bereichs führen.
Darüber hinaus könnte die Fähigkeit von Devin, autonom zu lernen und sich anzupassen, die Entwicklungsgeschwindigkeit beschleunigen und die Qualität der Softwareprodukte verbessern.
Was kostet Devin - ist das Tool kostenlos?
Aktuell ist noch nichts über den Preis bekannt. Da das Tool bisher auch noch nicht für die Öffentlichkeit freigeschaltet wurde, können lediglich Vermutungen angestellt werden.
Bereits existierende KI-Codeassistenten bestehen meistens aus einer kostenlosen sowie einer Bezahlversion. Es ist demnach davon auszugehen, dass Cognition AI ein ähnliches Modell etablieren wird.
Key Take-Aways
Devin AI, von Cognition, ist der erste KI-Softwareingenieur der Welt.
Komplexe Codierungsaufgaben werden automatisiert ausgeführt und damit die Produktivität und Effizienz im Softwareentwicklungsprozess verbessert.
Devin arbeitet autonom und kann gesamte Projekte von der Konzeption bis zum Code unabhängig bearbeiten.
Devin setzt neue Maßstäbe für KI-gestützte Codierungshilfen und die Rolle von KI in der Softwareentwicklung.
Über die Autoren
Ann Kathrin Hermes
Ann Kathrin Hermes, Redakteurin trend.at, Senior Manager für strategisches PMO
Themenschwerpunkte: Digitalisierung, Künstliche Intelligenz (KI), Leadership, Strategie
Roman Gaisböck
Leiter der VGN-Digital-Redaktionen. Digital Consultant. Co-Founder mehrerer Startups. Leidenschaftlicher Musiker.