Anzeige
Skip to content
Read full article about: Adobe stellt neuen Firefly AI Assistant für komplexe kreative Workflows vor

Adobe stellt den Firefly AI Assistant vor, einen neuen KI-Assistenten, der komplexe kreative Arbeitsabläufe über eine einzige Chat-Oberfläche steuert. Der Assistent verbindet Adobes Apps wie Photoshop, Illustrator, Premiere und Lightroom. Nutzer beschreiben in eigenen Worten, was sie erstellen wollen, und der Assistent führt die nötigen Schritte automatisch aus. Nutzer können jederzeit eingreifen.

Sogenannte "Creative Skills" ermöglichen es, mehrstufige Abläufe mit einem einzigen Befehl zu starten, etwa die Anpassung eines Bildes für verschiedene Social-Media-Plattformen. Adobe plant zudem die Anbindung an Chat-Plattformen wie Anthropics Claude.

Der Assistent basiert auf dem Vorprojekt "Project Moonlight", das auf der Adobe MAX vorgestellt wurde. Zusätzlich erweitert Adobe Firefly um KI-Video- und Bildbearbeitung mit Audio-Optimierung, erweiterten Farbkontrollen und Bildanpassungen. Die Zahl der verfügbaren KI-Modelle wächst auf mehr als 30, neu dabei ist Kling 3.0. Die öffentliche Beta des AI Assistant soll in den kommenden Wochen starten.

Read full article about: OpenAI aktualisiert Agents-SDK mit neuer Sandbox-Unterstützung für sicherere KI-Agenten

OpenAI hat sein Agents-SDK umfassend aktualisiert. Das Software-Entwicklungskit hilft Programmierern, KI-Agenten zu bauen, die Dateien prüfen, Befehle ausführen, Code bearbeiten und längere Aufgaben in geschützten Umgebungen erledigen können. Es bündelt gängige Bausteine für Agenten-Systeme: Werkzeugnutzung über das Model Context Protocol (MCP), Code-Ausführung über ein Shell-Tool, Dateibearbeitung über ein Apply-Patch-Tool und eigene Anweisungen über AGENTS.md-Dateien. Eine Manifest-Funktion beschreibt den Arbeitsbereich und unterstützt neben lokalen Dateien auch Cloud-Speicher wie AWS S3, Google Cloud Storage und Azure Blob Storage.

Schematische Darstellung der Architektur des OpenAI Agents SDK mit Verbindungen zwischen Nutzereingabe, Modell, Tools und Orchestrierung.
Das Diagramm zeigt, wie das Agents-SDK Nutzereingaben, KI-Modelle und Werkzeuge verbindet, um KI-Agenten zu bauen. | Bild: OpenAI

Neu ist eine native Sandbox-Unterstützung: Agenten arbeiten in abgeschotteten Bereichen mit eigenen Dateien, Werkzeugen und Abhängigkeiten. Unterstützt werden Anbieter wie Cloudflare, Vercel, E2B, Modal und weitere. Entwickler können auch eigene Sandboxes einbinden. Die Trennung von Steuerungslogik und Rechenumgebung soll Sicherheit, Stabilität und Skalierbarkeit verbessern. Bei einem Ausfall kann der Agent seinen Zustand in einem neuen Container wiederherstellen. Die neuen Funktionen sind in Python verfügbar, TypeScript soll folgen. Es gelten die normalen API-Preise von OpenAI.

Read full article about: Google neues Gemini 3.1 Flash TTS-Modell macht KI-Stimmen flexibler und dynamischer

Google rollt sein neues Text-to-Speech-Modell basierend auf Gemini 3.1 Flash aus. Es bietet laut Google die bisher natürlichste und ausdrucksstärkste Sprachausgabe des Unternehmens. Neu sind sogenannte Audio-Tags: Entwickler können per Textbefehle Stil, Tempo, Tonfall und Akzent der Sprachausgabe steuern. Das Modell unterstützt mehr als 70 Sprachen und ermöglicht Dialoge mit mehreren Sprechern.

Auf der Rangliste von Artificial Analysis erreicht das Modell einen Elo-Wert von 1.211 und wird dort als besonders gutes Verhältnis von Qualität und Preis eingestuft. Bei der Qualität insgesamt liegt es vor Elevenlabs v3 und knapp hinter Inworld 1.5 Max.

Bild: Google

Gemini 3.1 Flash TTS bietet eine kostenlose Stufe, bei der Google die Daten zur Produktverbesserung nutzen darf. In der kostenpflichtigen Stufe kostet die Texteingabe 1,00 Dollar pro Million Token, die Audioausgabe 20,00 Dollar pro Million Token. Im Batch-Modus halbieren sich die Preise auf 0,50 Dollar (Texteingabe) und 10,00 Dollar (Audioausgabe). Bei der bezahlten Stufe werden die Daten nicht zur Produktverbesserung verwendet.

Gemini 3.1 Flash TTS ist ab sofort als Vorschau über die Gemini-API, Vertex AI für Unternehmen und Google Vids für Workspace-Nutzer verfügbar. Kostenlos testen kann man es in Googles AI Studio. Alle erzeugten Audiodateien werden mit Googles SynthID-Wasserzeichen versehen, um KI-generierte Inhalte erkennbar zu machen.

Anzeige

Anthropic bereitet Opus 4.7 und KI-Design-Tool vor, VCs bieten bis zu 800 Milliarden Dollar

Anthropic plant die Veröffentlichung eines neuen Modells und eines Design-Tools, das Adobe und Figma Konkurrenz machen soll. Gleichzeitig überbieten sich Risikokapitalgeber mit Bewertungsangeboten.

Read full article about: Microsoft Copilot in Word kann jetzt Änderungen nachverfolgen und Kommentare verwalten

Microsoft erweitert Copilot in Word um neue Funktionen, die sich laut dem Unternehmen an Fachleute aus den Bereichen Recht, Finanzen und Compliance richten. Copilot kann nun Änderungen auf Wortebene nachverfolgen (Track Changes), sodass Bearbeitungen transparent und prüfbar bleiben. Außerdem lassen sich Kommentare direkt im Text verwalten, Inhaltsverzeichnisse einfügen und Kopf- sowie Fußzeilen mit dynamischen Feldern wie Seitenzahlen anlegen.

Bei mehrstufigen Bearbeitungen zeigt Copilot in Echtzeit an, woran es gerade arbeitet. Laut Microsoft basieren die Funktionen auf "Work IQ", einer Ebene, die Antworten an den jeweiligen Nutzer und dessen Organisation anpasst. Die Daten bleiben innerhalb der Microsoft-365-Sicherheitsgrenzen. Die neuen Funktionen sind zunächst nur auf dem Windows-Desktop über das Frontier-Programm im Office Insiders Beta-Channel verfügbar. Versionen für Web und Mac sollen folgen.

Anzeige
Read full article about: OpenAIs Stargate-Offensive in Europa bröckelt weiter

OpenAIs Stargate-Offensive in Europa schrumpft und Microsoft und Google übernehmen die Kapazitäten.

"Ich habe immer gesagt, dass wir Stargate gerne nach Europa bringen würden, wenn die Bedingungen stimmen, und wir glauben, dass wir das in Narvik gefunden haben", erklärte OpenAI-CEO Sam Altman im Juli 2025. Wenige Monate später ist von diesem Optimismus wenig übrig: OpenAI hat weder den Vertrag für das norwegische Rechenzentrum am Polarkreis abgeschlossen noch hält es an seinem britischen Stargate-Projekt fest. Beide Standorte wurden vom Neocloud-Anbieter Nscale entwickelt.

Microsoft springt ein und mietet 30.000 Nvidia-Vera-Rubin-Chips in Narvik, zusätzlich zu einem bestehenden 6,2-Milliarden-Dollar-Deal. Das Londoner Nscale-Rechenzentrum geht laut Bloomberg an Google. OpenAIs Infrastrukturversprechen von einst 1,4 Billionen Dollar schrumpft damit auf eine konkretere Prognose von 600 Milliarden Dollar bis 2030.

Read full article about: OpenAIs GPT-5.4 Pro löst offenbar eigenständig offenes Mathematikproblem Erdős #1196

OpenAIs Modell GPT-5.4 Pro hat offenbar das offene Mathematikproblem Erdős #1196 gelöst. Das Modell soll die Lösung in etwa 80 Minuten gefunden und in weiteren 30 Minuten als LaTeX-Arbeit aufbereitet haben. Eine formale Verifikation sei in Arbeit.

Der Mathematiker Terence Tao kommentierte im Erdős-Problems-Forum, die Arbeit zeige eine bisher nicht explizit beschriebene Verbindung zwischen der Anatomie ganzer Zahlen und der Theorie von Markov-Prozessen. Er bezeichnete das als sinnvollen Beitrag, der über die Lösung des einzelnen Problems hinausgehe. Kevin Barreto, der laut eigenen Angaben bald dem AI-for-Science-Team bei OpenAI beitreten wird, merkte im selben Forum an, die verwendete Markov-Ketten-Technik sei ein kreativer Schritt, den menschliche Mathematiker trotz langer Beschäftigung mit dem Problem übersehen hätten.

Die Diskussion ist insofern relevant, als bei LLMs gerade in der Mathematik immer wieder über deren Fähigkeit diskutiert wird, kreative Ansätze jenseits der beim Training gelernten Datenpunkte zu entwickeln. Sie zeigt, dass auch innerhalb bekannter Datenpunkte neues, aber noch nicht beschriebenes Wissen schlummern kann.

OpenAI bringt spezielles Cyber-Sicherheitsmodell heraus und weitet Zugang für Verteidiger aus

OpenAI veröffentlicht mit GPT-5.4-Cyber ein Modell, das gezielt für defensive Cybersicherheit trainiert wurde. Der Zugang bleibt vorerst auf verifizierte Sicherheitsexperten beschränkt.

Anzeige

OpenAI-Präsident sieht radikalen Wandel durch KI und warnt vor disruptiven Folgen für Jobs

KI-Arbeit soll künftig nicht mehr bedeuten, sich an den Computer anzupassen. Der Computer passt sich an den Menschen an, sagt OpenAI-Präsident Greg Brockman. „Das ist disruptiv. Institutionen werden sich verändern.“