يُشكل إنشاء أمر نصي ووصف دقيق لتوليد صورة باستخدام الذكاء الاصطناعي تحديًا كبيرًا، إذ غالبًا ما تكون النتائج مخيبة للآمال وتتطلب تعديلات متكررة، ولكن مع أداة (Whisk) الجديدة من جوجل، أصبحت هذه العملية بسيطة للغاية، إذ تتيح لك هذه الأداة استخدام الصور بدلًا من النصوص التفصيلية للحصول على صور معدلة أو مُعاد تخيلها.
ولكن كيف تستخدم أداة (Whisk) الصور لتوليد صور جديدة، وكيف يمكنك استخدامها، وكيف ستفتح أفاقًا جديدة للإبداع الفني؟
تُعدّ أداة (Whisk) هي أحدث أداة تجريبية في منصة (Labs.google)، وتستند في عملها إلى نموذجي الذكاء الاصطناعي (Gemini)، و (Imagen 3) من جوجل. ولكنها لا تقوم بنسخ الصور الأصلية، بل تستخلص العناصر الرئيسية منها لإنشاء الصورة الجديدة، ويشمل ذلك:
ويبدأ العمل بتحليل نموذج (Gemini) للصور المُدخلة تلقائيًا، ولا يقتصر هذا التحليل على مجرد تعرّف العناصر الظاهرة في الصورة، بل يتعداه إلى فهم سياق الصورة وتفاصيلها الدقيقة، ثم ينشئ (Gemini) وصف نصي مفصل لكل صورة، ويهدف هذا الوصف إلى التقاط جوهر الصورة، أي العناصر والخصائص الرئيسية التي تميزها، بدلًا من مجرد تقديم نسخة طبق الأصل عنها، إذ يتضمن ذلك وصفًا دقيقًا للموضوع الرئيسي، والخلفية، والألوان، والإضاءة، وأي تفاصيل أخرى ذات صلة.
ثم تُستخدم الأوصاف النصية المفصلة كمدخلات لنموذج (Imagen 3) – وهو أحدث نموذج لتوليد الصور من جوجل – لتوجيه عملية توليد الصور، وبفضل هذه العملية، يصبح من السهل إعادة مزج العناصر المختلفة من الصور – التي تشمل: الموضوعات، والمشاهد، والأنماط – بطرق جديدة ومبتكرة، فعلى سبيل المثال، يُمكن دمج موضوع من صورة مع خلفية من صورة أخرى بأسلوب فني محدد من صورة ثالثة، مما ينتج صورة جديدة تمامًا تحمل مزيجًا فريدًا من هذه العناصر.
وتجدر الإشارة إلى أن هذه الأداة تركز في التقاط جوهر الصور المُدخلة وليس إنشاء نسخة طبق الأصل عنها. ويعني ذلك أن الهدف ليس إعادة إنتاج الصور الأصلية، بل فهم العناصر الرئيسية فيها واستخدامها كقاعدة لإنشاء صورة جديدة تعبر عن فكرة أو مفهوم معين.
بعد تسجيل الدخول، يمكنك اختيار قالب من ثلاثة قوالب أساسية لتوليد الصور، ولكل منها تأثير بصري مختلف، وتشمل:
بالإضافة إلى الطريقة الافتراضية السابقة، توفر أداة (Whisk) خيار (البدء من الصفر) start from scratch، الذي يمنحك تحكمًا كاملًا في العملية الإبداعية.
وعند اختيار هذا الخيار، يُمكنك اتباع الخطوات التالية لتوليد الصور:
تتعدى استخدامات (Whisk) كونها مجرد أداة تجربة ممتعة، إذ تقدم إمكانيات واسعة في مجالات مختلفة، ومنها:
تخيل إنشاء بطاقة تهنئة للعطلات بدمج صورة عائلية مع مشهد جبلي ثلجي ونمط بطاقة بريدية قديمة في ثوانٍ معدودة!
تحافظ أداة (Whisk) على توازن دقيق بين الإبداع والتحكم، فعلى عكس الأدوات التي تعتمد بنحو كبير على الخوارزميات المحددة سابقًا، تتيح لك أداة (Whisk) المشاركة الفعالة في تشكيل النتيجة، إذ يلبي مزيج المطالبات المرئية والنصية احتياجات كل من المبدعين الذين يعتمدون على الحدس وأولئك الذين يفضلون التخصيص التفصيلي.
ومع أن أداة (Whisk) لا تزال في مرحلة الاختبار، لكنها تسلط الضوء على التزام جوجل بتطوير الذكاء الاصطناعي التوليدي، فمع تطورها، يمكن أن تصبح أداة أساسية للفنانين والمصممين وكل من يتطلع إلى توسيع آفاقه الإبداعية، فمن خلال دمج التكنولوجيا مع الخيال، تقدم أداة (Whisk ) لمحة عن المستقبل لا يعرف فيه سرد القصص المرئية حدودًا.