مفهوم – مزايا الذكاء الاصطناعي الجديدة في Gemini من جوجل حيث تشهد تقنيات الذكاء الاصطناعي من جوجل قفزة نوعية مع إطلاق Gemini 2.5 Flash (المعروف أيضًا باسم nano-banana)، وهو النموذج الأحدث من Google DeepMind لتوليد الصور وتحريرها.
ويوفر هذا النموذج للمستخدمين مزيجًا من السرعة، والجودة العالية، والتحكم السلس، ويُصنَّف كأحد أقوى نماذج تحرير الصور في العالم.
وفي الوقت الحالي، أصبح هذا النموذج متاحًا مباشرة عبر تطبيق Gemini، بالإضافة إلى أداة Google AI Studio للمطورين، ومنصة Vertex AI للشركات؛ مما يجعله في متناول المستخدمين من مُختلف الفئات.
إليك كل ما تحتاج إلى معرفته عن نموذج Gemini 2.5 Flash الأحدث من جوجل لتوليد الصور.
مزايا الذكاء الاصطناعي الجديدة في Gemini من جوجل
قدرات رائدة على تحرير الصور
أطلقت جوجل في وقت سابق مزية لتحرير الصور الأصلية داخل تطبيق Gemini، ومنذ ذلك الحين عملت على تحسينها بنحو كبير. ومع إطلاق Gemini 2.5 Flash ركزت الشركة في الحفاظ على اتساق مظهر الشخصيات والعناصر الأساسية عند توليد مجموعة صور تتضمن العناصر نفسها بأوضاع مختلفة، وهو أمر مهم عند تحرير صور الأشخاص أو المنتجات أو الحيوانات الأليفة.
وهذا التحديث الجديد يتيح لك:
تجربة وضعيات جديدة لصورة الشخص أو المنتج نفسه مع الحفاظ على الملامح الأصلية، مثل تجربة تسريحات شعر مختلفة أو ارتداء أزياء متعددة باستخدام صورة واحدة.
دمج صور متعددة لإنشاء مشهد متكامل، كإضافة نفسك وحيوانك الأليف في صورة واحدة على ملعب رياضي.
إجراء تحرير متعدد المراحل عبر خطوات متسلسلة، مثل: طلب تعديل غرفة فارغة بإضافة طلاء للجدران، ثم طلب إضافة مكتبة، ثم أثاث بأشكال وألوان محددة، وغير ذلك.
نقل التصاميم والأنماط من صورة إلى أخرى، مثل: تطبيق ألوان بتلات الزهور على حذاء، أو تصميم فستان بألوان مستوحاة من صورة فراشة ملونة.
أهم مزايا Gemini 2.5 Flash
يتمتع النموذج الجديد من جوجل بمزايا متقدمة لتحرير الصور وتوليدها تجعله مناسبًا للمبدعين، وأبرزها:
الحفاظ على اتساق الشخصيات
سواء كنت تنشئ حملة إعلانية أو أصولًا بصرية لعلامة تجارية، يمكنك الاستعانة بنموذج Gemini 2.5 Flash لإنشاء صور متعددة للمنتج نفسه أو الشخصية نفسها في سياقات متعددة، مع الحفاظ على الهوية البصرية نفسها دائمًا.
التحرير المعتمد على الأوامر النصية
باستخدام اللغة الطبيعية، يمكنك طلب إجراء تعديلات دقيقة مثل:
طمس الخلفية.
إزالة عناصر معينة أو إزالة الأشخاص.
تغيير وضعيات العناصر.
تلوين الصور القديمة المصورة بالأبيض والأسود.
المعرفة العميقة بالبيئة الحقيقية
على عكس النماذج التقليدية التي تفتقر إلى فهم السياق، يستفيد Gemini 2.5 Flash من قاعدة معرفية عميقة بالبيئة الحقيقية؛ مما يتيح استخدامه لتحويل الرسومات إلى مشاهد واقعية تفاعلية، كما يمكن استخدامه في مجالي تصميم الأزياء والتصميم الداخلي، كأن تطلب منه إعادة تصميم الغرف بما يتماشى مع توجهات الموضة فيما يتعلق بالأثاث والديكور.
دمج الصور المتعددة معًا بدقة عالية
يمكنك إدخال عدة صور وطلب دمجها في صورة واحدة، كأن تطلب وضع منتج معين خلفية جديدة، أو إنشاء صورة تسويقية لمتجر إلكتروني تدمج عدة صور للمنتجات المتوفرة في المتجر.
السعر والتوفر
يتوفر نموذج Gemini 2.5 Flash الآن للمطورين والشركات بسعر يبلغ 30 دولارًا لكل مليون رمز إخراج (output tokens). وتوليد صورة واحدة يعادل نحو 1290 رمزًا (أي ما يقارب 0.039 $ فقط للصورة).
وفي تطبيق Gemini، يمكن لجميع المستخدمين تجربة القدرات الجديدة للنموذج مباشرة عبر المطالبات النصية، وجميع الصور المُنشأة أو المعدلة عبر التطبيق تتضمن علامة مائية مرئية، بالإضافة إلى العلامة الرقمية SynthID غير المرئية، لتوضيح أنها من إنتاج الذكاء الاصطناعي.