هوش مصنوعی Imagen گوگل تبدیل متن به عکس را با دقت بالایی انجام می دهد
به گزارش استدیو مرینا، گوگل از هوش مصنوعی جدیدش رونمایی کرد که می تواند بر اساس متون دریافتی تصاویر مرتبط به آن را ایجاد کند. ایده این سیستم در واقع به این شکل است که کاربران با دادن نوشته و متن به این هوش مصنوعی معادل تصویری آن را مشاهده خواهند کرد. گوگل بر این باور است که هوش مصنوعی Imagen، سطح عمیق و بی نظیری از درک زبان و واقع گرایی را به کاربران ارائه می دهد.
این اولین باری نیست ما چنین هوش مصنوعی قدرتمندی را می بینیم. برای مثال هوش مصنوعی DALL-E 2 شرکت تحقیقاتی OpenAI که اخیراً نیز رونمایی شده، از چنین قابلیت فوق العاده ای بهره مند است. اما با این حال هوش مصنوعی Imagen گوگل سعی دارد تصاویر واقع بینانه تری را به کاربران نشان دهد. محققان این پروژه برای ارزیابی این هوش مصنوعی در مقابل سایر رقبای خود، بنچمارک جدیدی به نام Drawbench را ایجاد کردند. در این وب سایت 200 متن به وسیله هوش مصنوعی Imagen و دیگر شرکت ها به عکس تبدیل شد و از رأی دهندگان خواسته شد تا کیفیت و ارتباط هر تصویر با نوشته را مورد ارزیابی قرار دهند. این افراد اعلام کردند که دقت و صحت تصاویر ایجاد شده به وسیله Imagen بسیار واقعی تر و طبیعی تر از سایر مدل هاست.
شایان ذکر است که بعضی نمونه های ایجاد شده به وسیله این هوش مصنوعی در وب سایت Imagen website قابل مشاهده است. با این حال، این نمونه ها به صورت گلچین انتخاب شده اند و ممکن است کیفیت تصاویر دیگر در حد این تصاویر نباشد. بعلاوه باید اشاره کنیم که مدل Imagen به صورت عمومی در دسترس کاربران قرار نگرفته، زیرا غول موتور جست وجو معتقد است که این مدل هنوز به دلایل مختلف برای استفاده عمومی آماده نیست.
محققان گوگل در رابطه با این هوش مصنوعی می گویند: اگرچه این رویکرد باعث پیشرفت های سریع الگوریتمی در سال های اخیر شده، اما اطلاعاتی که از این طریق به دست می آیند حاوی طنزهای اجتماعی، نظرات افراطی و توهین آمیز یا شیو ه های دیگری هستند که موجب ناراحتی بعضی از اقلیت ها خواهد شد. در حالی که بسیاری از این داده ها و اطلاعات از فیلترهای مختلفی عبور کردند تا محتواهای نامطلوب آنان پاک گردد، ما از مجموعه داده LAION-400M هم استفاده کردیم که به داشتن طیف گسترده ای از محتوای نامناسب نظیر توهین های نژادپرستانه و کلیشه های مضر اجتماعی معروف است.
بدین ترتیب این احتمال وجود دارد که هوش مصنوعی Imagen کلیشه ها و مفاهیم مضر اجتماعی را رمزگذاری نموده باشد و آن را در قالب تصاویر مختلف در معرض دید قرار دهد. باید دید در ادامه گوگل می تواند بعضی از این مسائل را حل نماید یا نه. به نظر می رسد که تا برطرف نشدن بعضی از مسائل این مدل، گوگل آن را به صورت عمومی منتشر نخواهد کرد.
منبع: Engadget
منبع: دیجیکالا مگ