OpenAI heeft de nieuwe en verbeterde functie voor beeldgeneratie in ChatGPT beschikbaar gesteld via de API, waardoor ontwikkelaars deze kunnen integreren in hun apps en diensten. De nieuwe beeldgenerator van OpenAI, die eind maart werd gelanceerd voor de meeste ChatGPT-gebruikers, ging viraal vanwege zijn vermogen om realistische beelden in Ghibli-stijl en “AI-actiefiguren” te creëren. Dit was een dubbelzinnige zegen voor OpenAI: het leidde tot miljoenen nieuwe aanmeldingen voor ChatGPT, maar zette ook de capaciteit van het bedrijf zwaar onder druk. Volgens het bedrijf hebben meer dan 130 miljoen ChatGPT-gebruikers in de eerste week van beschikbaarheid meer dan 700 miljoen afbeeldingen gegenereerd.
Binnen de API van OpenAI wordt de beeldgeneratie aangestuurd door een AI-model genaamd “gpt-image-1.” Dit model is van nature multimodaal, wat betekent dat het beelden kan creëren in verschillende stijlen, aangepaste richtlijnen kan volgen, gebruik kan maken van wereldkennis en tekst kan weergeven.
Ontwikkelaars kunnen met gpt-image-1 meerdere beelden tegelijk genereren en de kwaliteit — en dus de snelheid — van de generatie bepalen.
Volgens OpenAI gebruikt gpt-image-1 dezelfde veiligheidsmaatregelen als de beeldgeneratie in ChatGPT, waaronder beperkingen die voorkomen dat het model inhoud genereert die in strijd is met het beleid van het bedrijf. Ontwikkelaars kunnen de gevoeligheid van de moderatie instellen op “auto” voor standaardfiltering of op “laag” voor minder restrictieve filtering. Bij lage filtering worden minder categorieën van mogelijk leeftijdsgevoelige inhoud beperkt, aldus documentatie van OpenAI die aan TechCrunch is verstrekt.
OpenAI zegt ook dat alle beelden die met gpt-image-1 worden gegenereerd, zijn voorzien van een C2PA-watermerk, zodat ze op ondersteunde platforms en apps kunnen worden geïdentificeerd als AI-gegenereerd.
De prijsstelling bedraagt $5 per miljoen inputtokens voor tekst, $10 per miljoen inputtokens voor beelden, en $40 per miljoen outputtokens voor beelden. (Tokens zijn de ruwe gegevens die het model verwerkt.) Volgens OpenAI komt dat neer op ongeveer 2 cent, 7 cent en 19 cent per gegenereerde afbeelding voor respectievelijk lage, middelmatige en hoge kwaliteit vierkante beelden. OpenAI meldt dat bedrijven zoals Adobe, Airtable, Wix, Instacart, GoDaddy, Canva en Figma al gebruikmaken van of experimenteren met gpt-image-1. Het Figma Design-platform laat gebruikers bijvoorbeeld beelden genereren en bewerken met gpt-image-1, terwijl Instacart het model test voor beelden bij recepten en boodschappenlijstjes.