Google Gemini can again create images of people, using Imagen 3
September 03, 2024
Google Gemini can again create images of people, using Imagen 3
Google Gemini illustration. (Google)
HOLIDAY NEWS - Google in February stopped the function of the artificial intelligence (AI) Gemini chatbot to create (generate) images of people.
This is because this chatbot has attracted controversy because it produces images of people that are inaccurate from a historical perspective, such as groups of Nazis with diverse races.
Now, the tech giant announced that Google Gemini can again create images of people.
This feature will be rolled out in the early access stage for users of paid Gemini Advanced, Business, Enterprise services in the next few days.
This feature of creating pictures of people can only be tested in English, but access will certainly be expanded to various languages.
This ability to create images of people is powered by Imagen 3, which is the latest version of Google AI's text-to-image generator.
Image results of people created by Google Gemini artificial intelligence.
Previously, Imagen 3 was launched quietly via Google's experimental site, AI Test Kitchen, and is now being rolled out on Gemini for all languages.
Although Imagen 3 can be used in all languages, the ability to create images of new people can be tested only in the English version.
Imagen 3 comes with built-in safeguards and adheres to Google's product design principles.
Therefore, this text-to-image generator does not support the creation of images depicting real, easily identifiable individuals, minors, or bloody, violent, or sexual scenes.
In terms of features, Imagen 3 is said to be able to create images with "any number of words", including realistic landscapes, watercolor paintings, clay animations (claymation), cartoons, and many more.
Google claims that this generator is equipped with advanced image creation capabilities.
Imagen 3 is claimed to have better test results (benchmarks) than other AI image creation models, such as DALL-E 3, Stable Diffusion 3, and Midjourney V6.
Imagen 3 still uses the SynthID tool to apply watermarks to AI images.
This watermark is used to indicate that this image was created by Google Gemini, not a real photo or work.
Google Gemini Kembali Bisa Buat Gambar Orang, Pakai Imagen 3
HOLIDAY NEWS - Google pada Februari lalu sempat menghentikan fungsi chatbot kecerdasan buatan (artificial intelligence/AI)Gemini untuk membuat (generate) gambar orang.
Sebab, chatbot ini menuai kontroversi lantaran menghasilkan gambar orang yang tidak akurat dari sudut pandang sejarah, seperti kelompok Nazi dengan ras yang beragam.
Kini, raksasa teknologi tersebut mengumumkan bahwa Google Gemini kembali bisa membuat gambar orang.
Fitur ini akan digelontorkan dalam tahap akses awal (early access) untuk pengguna layanan berbayar Gemini Advanced, Business, Enterprise pada beberapa hari ke depan.
Fitur membuat gambar orang ini baru bisa dijajal dalam bahasa Inggris saja, tetapi aksesnya dipastikan akan diperluas ke berbagai bahasa.
Kemampuan membuat gambar orang ini ditenagai oleh Imagen 3, yaitu versi terbaru dari generator text-to-image Google AI.
Sebelumnya, Imagen 3 sudah diluncurkan secara diam-diam lewat situs eksperimen Google, AI Test Kitchen, dan kini sedang digelontorkan di Gemini untuk semua bahasa.
Meskipun Imagen 3 bisa digunakan di semua bahasa, kemampuan membuat gambar orang baru bisa dijajal untuk versi bahasa Inggris saja.
Imagen 3 sudah dilengkapi dengan perlindungan (safeguard) bawaan dan mematuhi prinsip desain produk Google.
Oleh sebab itu, generator text-to-image ini tidak mendukung pembuatan gambar yang menggambarkan individu nyata dan mudah dikenali, anak di bawah umur, atau adegan yang berdarah, penuh kekerasan, dan seksual.
Secara fitur, Imagen 3 disebut bisa membuat gambar dengan "sejumlah kata", baik lanskap realistis, lukisan cat air, animasi tanah liat (claymation), kartun, dan masih banyak lagi.
Google mengeklaim bahwa generator ini dibekali kemampuan membuat gambar tingkat lanjut.
Imagen 3 diklaim memiliki hasil uji (benchmark) yang lebih baik dibandingkan model pembuat gambar AI lainnya, seperti DALL-E 3, Stable Diffusion 3, dan Midjourney V6.
Imagen 3 masih menggunakan alat SynthID untuk memberikan tanda air (watermark) pada gambar AI.
Watermark ini digunakan untuk menunjukkan bahwa gambar ini dibuat oleh Google Gemini, bukan foto atau karya sungguhan.
0 Comments