دال-ای 2 چیست؟ تبدیل متن به تصویر با یک کلیک! + تصاویر نمونه‌های جالب

23 تیر 1401 - آخرین بروزرسانی: 23 تیر 1401
زمان تقریبی مطالعه: 6 دقیقه

دال-ای 2 (DALL·E 2) نام برنامه ساخته شده در شرکت تحقیقاتی OpenAI است. این برنامه می‌تواند دستورالعمل‌های متنی ساده را به تصاویری باکیفیت تبدیل کند! به نظرتان فوق العاده نیست؟

این برنامه از هوش مصنوعی (AI) برای تهیه تصاویر یا آثار هنری واقع گرایانه از روی توضیحات متنی نوشته شده به زبان طبیعی، استفاده می‌کند. این پروژه میلیارد دلاری، بر اساس پردازش 12 میلیارد پارامتر، روی صدها میلیون تصویر انجام می‌گیرد.

می‌توان از توصیف‌های کاملاً پیچیده شامل اعمال، سبک‌های هنری و موضوعات متعدد استفاده کرد. برخی از نمونه‌های موجود در بلاگ OpenAI عبارتند از: «فضانوردی که در استراحتگاه گرمسیری فضایی به سبک ویپوروِیو در حال استراحت است» و «خرس‌های عروسکی که زیر آب»، روی تحقیقات جدید هوش مصنوعی با فناوری دهه 1990 کار می‌کنند».

 

برنامه دال-ای 2 به هر چیزی یک داستان می‌دهد

دال-ای 2 - خرس‌های عروسکی مثل دانشمندانی دیوانه در حال مخلوط کردن مواد شیمیایی درخشان به سبک استیم پانک هستند

دال-ای 2 تصویر فوق را در پاسخ به این متن ساخته است:«خرس‌های عروسکی مثل دانشمندانی دیوانه در حال مخلوط کردن مواد شیمیایی درخشان به سبک استیم پانک هستند».

برنامه دال-ای 2 بر اساس ابزار قبلی OpenAI، یعنی DALL-E، ساخته شد که در ژانویه 2021 عرضه شده بود. نسخه جدید به لطف تصاویری با وضوح بالاتر، درک متن بیشتر، پردازش سریع تر و برخی قابلیت‌های جدید، نتایج شگفت انگیزتری را به همراه دارد.

دال ای به نام ربات پیکسار یعنی WALL-E و سالوادور دالی نامگذاری شد. این برنامه یک نوع شبکه عصبی است. این سیستم محاسباتی، به طور آزادانه روی نورون‌های درون یک مغز بیولوژیکی، مدلسازی شده است.

شبکه عصبی در مورد تصاویر و توضیحات متنی آنها آموزش دیده تا رابطه بین اشیا را درک کند.

دال-ای 2 - کاسه سوپ شبیه به هیولای بافته شده از پشم

تصویر فوق مربوط به «کاسه سوپ شبیه به هیولای بافته شده از پشم» است.

به نقل از شرکتOpenAI: «یادگیری عمیق، اشیایی مانند خرس‌های کوالا و موتورسیکلت‌ها را درک می‌کند و روابط بین اشیا را هم می‌شناسد.»

«وقتی تصویری از یک خرس کوالا در حال موتورسواری را از DALL-E می‌خواهید، می‌داند که چگونه آن تصویر یا هر چیز دیگری را در ارتباط با شی یا عمل دیگری خلق کند.»

 

قابلیت‌های هوش مصنوعی در شرکت OpenAI

دال-ای 2 چندین تصویر جایگزین برای هر پیام متنی دارد. قابلیت اضافه شده به برنامه جدید شامل استفاده از همان توضیحات زبان طبیعی برای ویرایش و روتوش عکس‌های موجود است.

این ویژگی که OpenAI آن را «in-painting» می‌نامد، مانند نسخه پیچیده‌تری از «content-aware fill» فتوشاپ عمل می‌کند و به طور واقعی با در نظر گرفتن سایه‌ها، بازتاب‌ها و بافت‌ها، اجزایی را از قسمت انتخابی در تصویر، حذف کرده یا به آن اضافه می‌کند.

دال-ای 2 - عکسی از یک فروشگاه گل فروشی جذاب با نمای سبز پاستلی و سفید خالص

در تصویر فوق «عکسی از یک فروشگاه گل فروشی جذاب با نمای سبز پاستلی و سفید خالص» خواسته شد.

به عنوان مثال، نمونه‌های موجود در بلاگ OpenAI، کاناپه‌های اضافه شده به نقاط مختلف عکسی از یک اتاق خالی را نشان می‌دهد.

به گفته OpenAI پروژه DALL-E نه تنها به افراد اجازه می‌دهد تا افکارشان را به صورت بصری، ابراز کنند، بلکه به محققان کمک می‌کند تا بفهمند سیستم‌های پیشرفته هوش مصنوعی چگونه دنیای ما را می‌بینند و درک می‌کنند.

شرکت OpenAI معتقد است: «این پروژه بخش مهمی ‌از توسعه هوش مصنوعی مفید و ایمن است».

این شرکت در ابتدا به عنوان یک سازمان غیرانتفاعی توسط چهره‌های برجسته فناوری از جمله ایلان ماسک تأسیس شد. همچنین این پروژه به توسعه هوش مصنوعی در جهت ایجاد اثرات مثبت و بلندمدت انسانی و مهار خطرات بالقوه آن اختصاص پیدا کرد.

از این رو DALL-E 2 در حال حاضر در دسترس عموم مردم قرار نمی‌گیرد. به اعتقاد شرکت سازنده، اگر از این برنامه برای ایجاد محتوای فریبنده و مشابه «دیپ‌ فیک» فعلی یا تصاویر مضر دیگر استفاده شود، می‌تواند خطرناک شود.

 

مطلب پیشنهادی: آیا هوش مصنوعی می‌تواند جایگزین نویسنده‌ها شود؟

 

مثال‌های جالب DALL-E 2

ترسیم زندگی حیوانات با دال-ای 2

سگ خوشتیپ

دال-ای 2 - سگ شیبا اینو با کلاه برت و یقه اسکی مشکی

تصویر فوق از متن «سگ شیبا اینو با کلاه برت و یقه اسکی مشکی» ساخته شده است.

هوش مصنوعی با کمی سوگیری‌ باعث تقویت کلیشه‌های اجتماعی می‌شود. شرکت OpenAI اقدامات ایمنی را رعایت می‌کند، ولی DALL-E را برای آزمایش کردن در اختیار تعداد کمی ‌از کاربران منتخب قرار داده است. در حال حاضر، یک سیاست محتوایی برای منع کاربران از ایجاد هرگونه تصویر خشونت‌آمیز یا نفرت‌انگیز و محتوای سیاسی وجود دارد.

این کار توسط فیلترها و سیستم‌های نظارت خودکار و انسانی انجام می‌شود.

خرس‌های عروسکی

دال-ای 2- خرس‌های عروسکی در حال خرید مواد غذایی به سبک ukiyo-e

برداشت دال-ای 2 از متن «خرس‌های عروسکی در حال خرید مواد غذایی به سبک ukiyo-e» به شکل فوق است.

توانایی DALL-E برای تولید چنین تصاویری، محدود است. تمام محتوای زننده یا خشونت‌آمیز از داده‌های آموزشی آن حذف شده است؛ بنابراین به طرز خوشایندی با این مفاهیم متنی مواجه می‌شود.

شرکت OpenAI توسط ماسک، سام آلتمن از شرکت Y Combinator و سایر حامیان در اواخر سال 2015 راه اندازی شد. بعد از آن ماسک، از هیئت مدیره استعفا داد. این شرکت در سال 2019، ظاهراً برای تأمین بودجه بیشتر، به یک شرکت انتفاعی تبدیل شد، اگرچه شرکت مادر همچنان یک شرکت غیرانتفاعی است.

یکی دیگر از پروژه‌های OpenAI، به نام Dactyl شامل آموزش یک دست رباتی برای دستکاری سریع اجسام با استفاده از حرکات انسان مانند و خود آموخته بود.

در ادامه تصاویر بیشتری را از زندگی حیوانات مشاهده می‌کنید.

«راکونی که سر کلاس برنامه نویسی گیج شده است»:

دال-ای 2- راکون برنامه نویس

فضانورد

فضانورد اسب سوار

این اسب، فضانورد و ستاره‌ها در دنیای واقعی وجود ندارند. همگی اختراع یک مدل کامپیوتری به نام دال-ای 2 هستند. بنابراین این مدل یاد گرفته تا بین کلمات و تصاویر درون پایگاه داده حاوی صدها میلیون عکس و برچسب‌های محتوایی ارتباط برقرار کند. اگر یک عبارت ساده مانند «عکسی از یک فضانورد سوار بر اسب» را تایپ کنید، DALL-E 2  بر اساس درک خودش از معنای «فضانورد»، «سواری» و «اسب» تصویری را تولید خواهد کرد. حتی جزئیات را بر اساس توانایی خودش در برقراری ارتباط مفاهیم مرتبط، پر می‌کند. به عنوان مثال، فضانوردان معمولاً در پس زمینه‌ای از ستاره‌ها دیده می‌شوند.

جان دادن به غذاها با دال-ای 2

آووکادو در مهمانی

شرکت OpenAI امیدوار است که مردم از ابزارهایی مانند دال-ای 2 به روش‌های عجیب و خلاقانه، مانند «تصویر یک شب دلپذیر برای یک جفت آووکادو در مهمانی» یا «کلم بروکلی در حال شکایت از آب و هوا» استفاده کنند.

بروکلی شاکی از آب و هوا

تهیه آثار هنری با دال-ای 2

«نقاشی رافائل از پیتزا خوردن مدونا در کنار یک کودک»:

دال-ای 2 - پیتزا خوردن مدونا در کنار یک کودک

تصویری از «خرابی وای فای در قرون وسطا»:

دال-ای 2 - خرابی وای فای در قرون وسطا

«دو شخصیت از نقاشی مصری که در حال بحث بر سر بیرون گذاشتن زباله هستند»:

دای-ای 2 - دو شخصیت از نقاشی مصری که در حال بحث بر سر بیرون گذاشتن زباله هستند

«نقاشی سبک گوتیک از فضانورد و زنش»:

گوتیک

«دختر رباتی با گوشواره‌های مروارید»:

دختر رباتی

«لئوناردو وارد متاورس شده» :

متاورس

 

سرگرمی و انیمیشن

«تصویر رادیولوژی مینیون‌ها»:

مینیون‌ها

«نقاشی باستانی از بانی خرگوشه»:

دال-ای 2 - بانی خرگوشه

«شکایت یودا بابت سقوط ارزش سهام»:

دال-ای 2 - شکایت یودا بابت سقوط ارزش سهام

«خانه واقع گرای باب اسفنجی»:

دال-ای 2 - خانه واقع گرای باب اسفنجی

 

در نهایت…

شرکت OpenAI در گذشته، پروژه‌های مشابهی را توسعه داده و آنها را برای عموم منتشر کرده است. هر کسی می‌تواند از آخرین مدل زبان OpenAI، یعنی GPT-3 برای تولید داستان، مقاله و شعر بر اساس توضیحات ساده استفاده کند. با کمی‌ تخصص در کدنویسی، می‌توانید از Jukebox برای اختراع آهنگ‌های عالی با سبک‌های شعری مختلف استفاده کنید. دال-ای 2 هنوز در مرحله آزمایشی بتا است، اما می‌توانید برای استفاده از آن در لیست انتظار ثبت نام کنید. این شرکت هر هفته برای حدود 1000 نفر دعوت نامه ارسال می‌کند. در حال حاضر، نمونه‌های مختلفی از تصاویر دال-ای 2 در شبکه‌های اجتماعی منتشر شده‌ و همگی کاملاً ایمن هستند.

 

در صورتی که شما هم می‌خواهید دال-ای 2 را تست کنید و متن های ساختگی خود را تبدیل به عکس کنید، می‌توانید در حال حاضر از این لینک، از نسخه رایگان و محدود که دال-ای مینی (DALL·E mini) نام دارد، استفاده کنید.

 

منابع

https://www.dezeen.com/2022/04/21/openai-dall-e-2-unseen-images-basic-text-technology

https://qz.com/2176389/the-best-examples-of-dall-e-2s-strange-beautiful-ai-art

آیا این مطلب برای شما مفید بود؟
بلهخیر
برچسب ها :
نویسنده مطلب زینت فلاح
من زینت فلاح، ارشد روان سنجی هستم. هشت ساله که ترجمه متون روانشناسی،مدیریت و فناوری رو انجام میدم. به تولید محتوای جدید علاقمندم. در حدود یک ساله که با کارلنسر همکاری دارم. https://www.karlancer.com/profile/1408

دیدگاه شما

یک دیدگاه

  • داتیس
    25 تیر 1401

    برگاااااااااااااااااااام 😳😳😳 جدی جهان داره به کجا میره