OpenAI hat drei neue Modelle innerhalb seiner API eingeführt: GPT-4.1, GPT-4.1 mini und GPT-4.1 nano. Diese Modelle bringen signifikante Verbesserungen in den Bereichen Codierung, Befolgung von Anweisungen und bieten eine erweiterte Kontextverwaltung mit bis zu 1 Million Tokens.
Optimierte Leistung
Das Flaggschiffmodell, GPT-4.1, verbessert die Leistung im Vergleich zu GPT-4o erheblich, insbesondere in folgenden Bereichen:
-
Codierung: GPT-4.1 erreicht 54,6 % im SWE-bench Verified Benchmark, ein deutlicher Anstieg im Vergleich zu GPT-4o (33,2 %) und GPT-4.5 (38 %). Dieses Ergebnis zeigt eine Verbesserung seiner Fähigkeit, komplexe Softwareentwicklungsprobleme zu lösen.
-
Befolgung von Anweisungen: In der MultiChallenge-Bewertung von Scale erzielt GPT-4.1 38,3 %, was die Leistung im Vergleich zu GPT-4o um 10,5 absolute Punkte verbessert.
-
Langer Kontext: GPT-4.1 stellt mit 72 % im Video-MME-Benchmark einen neuen Rekord auf, der sich der Verständnis multimodaler Inhalte in erweitertem Kontext widmet.
Eine komplette Palette, um verschiedenen Bedürfnissen gerecht zu werden
Neben GPT-4.1 bieten die Mini- und Nano-Versionen effektive Kompromisse zwischen Leistung und Kosten:
-
GPT-4.1 mini: Dieses kompaktere Modell übertrifft GPT-4o in mehreren Bewertungen und reduziert gleichzeitig die Latenz erheblich (nahezu halbiert) und die Kosten (um 83 % reduziert).
-
GPT-4.1 nano: Das schnellste und wirtschaftlichste Modell, ideal für Aufgaben wie Klassifikation oder Autovervollständigung, bietet trotz seiner geringen Größe einen Kontext von bis zu 1 Million Tokens.
Verstärkte Fähigkeiten für intelligente Agenten
Dank der Verbesserungen in der Zuverlässigkeit der Befolgung von Anweisungen und im Verständnis des erweiterten Kontexts stärkt GPT-4.1 Anwendungen, die auf autonomen Agenten basieren. Entwickler können nun zuverlässigere und effizientere Systeme für Dokumentenmanagement, Softwareentwicklung oder automatisierte Kundenanfragen erstellen.
Geplantes Ende von GPT-4.5 Preview
OpenAI hat die bevorstehende Einstellung des Modells GPT-4.5 Preview zugunsten von GPT-4.1 angekündigt, das eine höhere Leistung zu geringeren Kosten bietet. GPT-4.5 Preview wird ab dem 14. Juli 2025 deaktiviert, um den Entwicklern einen reibungslosen Übergang zu ermöglichen.
Exklusive Verfügbarkeit über API
Es ist zu beachten, dass GPT-4.1 ausschließlich über die API von OpenAI verfügbar sein wird. ChatGPT-Nutzer profitieren jedoch schrittweise von den Verbesserungen von GPT-4.1, die in die Version GPT-4o integriert sind.
Optimierte Preisgestaltung
Mit einer überarbeiteten Preisgestaltung ist GPT-4.1 nun zu einem um 26 % niedrigeren Preis im Vergleich zu GPT-4o für gängige Anfragen verfügbar. Die sehr wettbewerbsfähige Preisgestaltung von GPT-4.1 nano macht es zum erschwinglichsten Angebot, das OpenAI je gemacht hat.
Quelle: https://openai.com/index/gpt-4-1/
Übersetzt von OpenAI annonce le lancement de GPT-4.1 : accent sur le codage, le suivi des instructions et la gestion étendue du contexte
Besser verstehen
Was ist der SWE-bench Verified-Benchmark, der zur Bewertung der Modelle von OpenAI verwendet wird?
Der SWE-bench Verified ist eine Testsuite, die entwickelt wurde, um die Fähigkeit von KI-Modellen zu bewerten, komplexe Softwareentwicklungsprobleme zu lösen. Er misst die Kodierungsfähigkeiten der Modelle und ihre Effizienz bei der genauen Befolgung von Entwicklungsanweisungen.
Was ist die aktuelle Regulierung in Bezug auf KI-Modelle wie GPT-4.1?
KI-Modelle wie GPT-4.1 müssen sich an Vorschriften halten, die den Schutz personenbezogener Daten, die Transparenz von Algorithmen und die Verantwortung für Voreingenommenheiten umfassen. Die Europäische Union arbeitet am AI Act, der strenge Konformitätsstandards für kommerziell genutzte Modelle vorschreiben könnte.