OpenAI macht mit künstlicher Intelligenz aus Text Bilder
Mit 12 Milliarden Parametern kann «Dall-E» des Unternehmens OpenAI nun Bilder aus Text erzeugen. Die Ergebnisse reichen dabei von abstrakt bis zu realistisch.
Das Wichtigste in Kürze
- Das Unternehmen OpenAI hat eine KI geschaffen, welche mit reinem Text-Input «zeichnet».
- Das GTP-3-trainierte Programm visualisiert selbstständig Wörter oder ganze Sätze.
- Die dabei entstehenden Bilder können, abstrakt, realistisch oder auch unerkennbar sein.
In der Welt von künstlichen Intelligenzen entstehen je länger je mehr verschiedene Anwendungsfälle und Umsetzungsmöglichkeiten. Manche sind dabei sinnvoller und erfolgreicher als andere. Das Unternehmen OpenAI stellte kürzlich das neue Programm «Dall-E» vor, welches Text in Bilder verwandeln kann. Bei diesem Vorhaben ist die künstliche Intelligenz auch mehrheitlich erfolgreich.
We’ve developed two neural networks which have learned by associating text and images. CLIP maps images into categories described in text, and DALL-E creates new images, like this, from text.
— OpenAI (@OpenAI) January 5, 2021
A step toward systems with deeper understanding of the world. https://t.co/rppy6u1zcn pic.twitter.com/MNVlo8LZbV
Das Modell wurde vom Unternehmen mit GTP-3 trainiert, und greift bei der Arbeit auf 12 Milliarden Parameter zurück. Somit kann Dall-E selbstständig verschiedene Ausgaben erzeugen, von künstlerischen Illustrationen, bis zu fotorealistischen Motiven ist alles vorhanden. Hierfür erhält das Programm pro Umwandlung 1280 Tokens, wobei 256 auf den Text und 1024 auf das Bild bezogen sind. Die dabei entstehenden Bilder können sich im Grossen und Ganzen auch sehen lassen.
So ganz perfekt funktioniert das Tool aber dann doch nicht, wie so oft bei künstlicher Intelligenz. Hin und wieder entstehen Bilder, bei denen sich nur erahnen lässt, was dargestellt werden soll. Und vor allem bei langen, verschachtelten Sätzen scheint Dall-E noch Probleme zu haben. Nichtsdestotrotz gibt es sicherlich Potenzial für die Arbeit, welche Unternehmen wie OpenAI hier verrichten.