En junio de 2021, Open AI introdujo Dall·E. Apenas 12 meses más tarde, ya tenemos la que es su gran actualización: Dall·E 2. Una nueva herramienta de Inteligencia Artificial que nos permite dictar una orden y que automáticamente se cree una imagen realista con hasta cuatro veces más resolución que la anterior. Actualmente se encuentra en fase beta. Para acceder a todas las funcionalidades, debemos superar una lista de espera a la que podemos acceder en este enlace.
Pese a su carácter privado, la compañía ha publicado diferentes fotografías. Comparándolas, además, con los resultados obtenidos por su predecesora. A continuación, esto es todo lo que tienes que saber al respecto.
«Un nuevo sistema de IA»
OpenIA define a Dall·E 2 como «un nuevo sistema de IA que puede crear imágenes y arte realistas a partir de una descripción en lenguaje natural». Para ello, se sirve del potencial GPT3 para generar todo tipo de diseños a través de una proceso en dos fases:
- En primer lugar, se genera una imagen a través de una leyenda en el texto.
- A posteriori, se crea una segunda imagen que condiciona a la primera y que le permite alcanzar nuevos resultados completamente fidedignos a las órdenes establecidas por los propios usuarios.
Como demuestran los propios resultados que la compañía ha mostrado, éstos están mucho más trabajados que los que habíamos tenido durante la primera versión de este modelo. Además, incorpora la posibilidad de poder crear imágenes desde cero. Siendo posible adaptar cada modelo a las necesidades y requisitos de las propias peticiones.
Una mejor relación entre las imágenes y los textos
Con el objetivo de evitar el mal uso de la herramienta, el equipo que se encuentra detrás del proyecto de Open IA ya advirtió desde la primera versión que la creación de imágenes consideradas como violentas o explícitas no iba a ser posible. Además, también se han establecido límites para poder disponer de todos los mecanismos que impidan la recreación de personas reales. De nuevo, tratando de descubrir nuevos horizontes que favorezcan la acotación en el uso de herramientas que, con una mala ética, podrían alcanzar determiandos usos que no son considerados como legítimos. Especialmente a medida que soluciones tecnológicas como la Inteligencia Artificial han ido alcanzando.
Esta nueva versión Dall·E también asegura una mejor relación entre las imágenes y el texto. Además, y como afirma en su propia página web, puede ayudar en la combinación de conceptos, atributos y todo tipo de estilos.
Tres características para entender Dall·E 2
- Prevención de generaciones dañinas: La capacidad de Dall·E 2 evita la posibilidad de que sea utilizado para la generación de imágenes violentas, de odio o para adultos. Además, también se ha desarrollado la tecnología para prevenir generaciones fotorrealistas de rostros, como ya hemos mencionado previamente.
- Frenar el mal uso de la herramienta: La política de uso de la herramienta evita la capacidad de la misma para generar contenido violento, adulto o político. Ademas, tampoco se generan las imágenes en el caso de que el código detecte cualquier posible mal uso del lenguaje.
- Despliegue natural basado en el aprendizaje: En función de los resultados que se obtengan durante los próximos meses, se espera Dall E 2 vaya alcanzando a una mayor cantidad de usuarios. Sin embargo, su aterrizaje será progresivo e irá supeditado a las nuevas demandas del mercado.