Trend Logo

Devin: Der erste KI-Softwareingenieur der Welt

Subressort
Aktualisiert
Lesezeit
7 min

©Screenshot Cognition
  1. home
  2. Business
  3. Business Tools

Devin AI ist der erste vollautonome KI-Softwareentwickler; revolutioniert das Tool die Branche?

von

Was ist Devin?

Devin ist ein KI-Tool des Unternehmens Cognition.

Das Versprechen lautet: Der vollautonome KI-Softwareentwickler Devin soll komplexe Programmieraufgaben selbstständig planen und umsetzen. Demnach soll das Tool mit einem einzelnen Prompt in der Lage sein, einen Code zu schreiben, Apps oder Websites zu erstellen.

Ausgestattet mit einer vollständigen Entwicklungsumgebung, einschließlich Shell, Code-Editor und Browser, kann Devin ohne menschliche Intervention agieren.

Welches Unternehmen steckt hinter Devin?

Das Unternehmen hinter der Künstliche Intelligenz-Anwendung heißt Cognition AI und wurde im November 2023 gegründet.

Unternehmenssitz: New York und San Francisco

CEO: Scott Wu (Harvard-Absolvent und Programmierer)

Investoren: Cognition AI hat bereits 21 Millionen US-Dollar eingesammelt. Unter anderem von Peter Thiels Founders Fund, Tony Xu, CEO von DoorDash oder Fred Ehrsam, Gründer von Coinbase.

Was macht das Unternehmen? Auf der Seite heißt es: "Wir sind ein Labor für angewandte KI mit Schwerpunkt auf logischem Denken. Wir entwickeln KI-Teammitglieder mit Fähigkeiten, die weit über die der heutigen KI-Tools hinausgehen. Indem wir uns auf das logische Denken konzentrieren, können wir neue Möglichkeiten in einer Vielzahl von Disziplinen erschließen - der Code ist nur der Anfang."

Was kann Devin?

Laut der Unternehmenswebsite soll Devin ein verlässlicher Kollege oder eine Kollegin sein.
"Devin kann komplexe technische Aufgaben planen und ausführen, die Tausende von Entscheidungen erfordern. Devin kann bei jedem Schritt relevante Zusammenhänge abrufen, mit der Zeit lernen und Fehler korrigieren.

Wir haben Devin auch mit gängigen Entwickler-Tools wie Shell, Code-Editor und Browser in einer Sandbox-Computing-Umgebung ausgestattet - alles, was ein Mensch für seine Arbeit braucht.

Schließlich haben wir Devin die Möglichkeit gegeben, aktiv mit dem Benutzer zusammenzuarbeiten. Devin berichtet in Echtzeit über seine Fortschritte, nimmt Rückmeldungen entgegen und arbeitet bei Bedarf mit Ihnen zusammen an Designentscheidungen."

Eine Auswahl an Dingen, die Devin kann:

Devin kann lernen, wie man mit unbekannten Technologien umgeht

Devin kann Apps konzipieren und umsetzen

Devin kann selbstständig Fehler in Codes finden und beheben

Devin kann seine eigenen KI-Modelle trainieren und optimieren

Devin kann sich um Bugs und Feature Requests in Open Source Repositories kümmern

Devin setzt neue Maßstäbe in der SWE-Bench-Coding-Benchmark

Devin hat in der SWE-Bench-Coding-Benchmark außergewöhnlich gut abgeschnitten, insbesondere im Vergleich zu anderen KI-Modellen. Devin löste 13,86% der gestellten Aufgaben komplett autonom, was einen signifikanten Vorsprung gegenüber anderen Modellen darstellt. Zum Vergleich: Claude 2 erreichte eine Lösungsrate von 4,8%, und ChatGPT-4 lag bei 1,74%. Diese Ergebnisse unterstreichen die fortgeschrittenen Fähigkeiten von Devin im Bereich der Softwareentwicklung und positionieren es deutlich vor der Konkurrenz.

 Die SWE-Bench-Coding-Benchmark ist eine Evaluierungsplattform, die entwickelt wurde, um die Fähigkeiten von großen Sprachmodellen (Large Language Models, LLMs) bei der Lösung realer Softwareprobleme zu testen, die auf GitHub gesammelt wurden. Die Benchmark besteht aus einer Sammlung von 2.294 Software-Engineering-Problemen, die aus echten GitHub-Issues und den entsprechenden Pull Requests aus 12 populären Python-Repositories stammen.

Die Aufgabe für ein Sprachmodell im Rahmen der SWE-Bench besteht darin, eine Codebasis zu bearbeiten, um ein beschriebenes Problem zu lösen. Dies erfordert häufig das Verständnis und die Koordination von Änderungen über mehrere Funktionen, Klassen und Dateien hinweg und stellt die Modelle vor Herausforderungen, die weit über die traditionelle Codegenerierung hinausgehen. Die Modelle müssen mit Ausführungsumgebungen interagieren können, extrem lange Kontexte verarbeiten und komplexe Überlegungen anstellen

Blurred image background

Devin überzeugt in den Punkten Genauigkeit und unabhängige Problemlösung. Devin setzt neue Maßstäbe

 © Screenshot Devin AI

Wie kann ich Devin nutzen?

Aktuell ist das Tool noch nicht frei verfügbar.

Sie können sich auf eine Warteliste setzen lassen. Hier geht es zur Warteliste.

Auswirkungen auf die Softwareindustrie

Die Einführung von Devin könnte tiefgreifende Auswirkungen auf die Softwareindustrie haben. Durch die Automatisierung routinemäßiger und komplexer Aufgaben könnte Devin es Softwareentwicklern ermöglichen, sich auf kreativere und strategischere Aspekte ihrer Arbeit zu konzentrieren.

Zudem könnten Entwicklungskosten reduziert werden und zudem zu einer Demokratisierung des Bereichs führen.

Darüber hinaus könnte die Fähigkeit von Devin, autonom zu lernen und sich anzupassen, die Entwicklungsgeschwindigkeit beschleunigen und die Qualität der Softwareprodukte verbessern.

Was kostet Devin - ist das Tool kostenlos?

Aktuell ist noch nichts über den Preis bekannt. Da das Tool bisher auch noch nicht für die Öffentlichkeit freigeschaltet wurde, können lediglich Vermutungen angestellt werden.

Bereits existierende KI-Codeassistenten bestehen meistens aus einer kostenlosen sowie einer Bezahlversion. Es ist demnach davon auszugehen, dass Cognition AI ein ähnliches Modell etablieren wird.

Key Take-Aways

KI-ToolsKünstliche Intelligenz

Über die Autoren

Logo
Jetzt trend. ab € 14,60 im Monat abonnieren!
Ähnliche Artikel