المصرية للاتصالات Cairo ICT 2024
المصرية للاتصالات Cairo ICT 2024
إعلان إي فينانس

OpenAI تطلق GPT-Image 1.5

كشفت OpenAI عن أحدث نماذجها لتوليد الصور GPT-Image 1.5، في خطوة تؤكد انتقال تقنيات الذكاء الاصطناعي البصري إلى مرحلة أكثر نضجًا ودقة.

ولا يكتفي النموذج الجديد بتحسين جودة الصور، بل يعيد رسم العلاقة بين النص والصورة من حيث الفهم، والتنفيذ، وسرعة الاستجابة.

وتقول الشركة إن النموذج بات أسرع بما يصل إلى أربع مرات مقارنة بالإصدار السابق، مع تحسّن ملحوظ في قدرته على التقاط تفاصيل الأوامر المعقّدة وتنفيذها بصريًا دون تشويه العناصر الأخرى داخل الصورة.

وقد أصبح GPT-Image 1.5 متاحًا لجميع مستخدمي ChatGPT، إلى جانب توفيره للمطورين عبر واجهة البرمجة الخاصة بـOpenAI.

وفي تعليقها على الإطلاق، أوضحت فيدجي سيمو، الرئيسة التنفيذية لتطبيقات OpenAI، أن هذه القدرات تمثل جزءًا من تحوّل أوسع في ChatGPT نحو كونه منصة توليد متعددة الوسائط، قادرة على اختيار الأداة الأنسب تلقائيًا لإنجاز مهمة المستخدم، سواء كانت نصية أو بصرية أو مزيجًا من الاثنين.

ويمكّن النموذج الجديد المستخدمين من تحرير الصور بدقة عالية، مثل تعديل جزء محدد من المشهد أو إضافة عناصر جديدة دون المساس بتوازن الإضاءة أو التكوين العام.

ويدعم عمليات الدمج بين الصور، ونقل العناصر داخلها، وتحويل الأسلوب الفني، ما يفتح الباب أمام استخدامات واسعة في التصميم الاحترافي، والتجارب الافتراضية للأزياء، وصناعة المحتوى الإبداعي.

وأظهرت العروض التوضيحية التي نشرتها OpenAI قدرات متقدمة، من بينها دمج أشخاص وحيوانات أليفة من صور مختلفة في مشهد واحد متناسق، أو تحويل صور بسيطة إلى ملصقات سينمائية ذات طابع كلاسيكي.

أما على مستوى الالتزام بالتعليمات، فقد أبدى GPT-Image 1.5 دقة أعلى في تنفيذ الأوامر التفصيلية؛ ففي اختبارات تتطلب تنظيم عشرات العناصر ضمن توزيع صارم، نجح النموذج في تحقيق نتائج دقيقة، وهو ما يُعد تطورًا مهمًا في إنشاء الصور المعقدة مثل المخططات والإنفوجرافيك.

كما شهدت قدرته على إدراج النصوص داخل الصور تحسنًا واضحًا، خصوصًا في النصوص الصغيرة والجداول المختصرة، رغم استمرار بعض القيود المتعلقة بالنصوص الطويلة، أو الخطوط النادرة، أو المشاهد التي تضم عددًا كبيرًا من الوجوه، أو محتوى متعدد اللغات.

وفي اختبارات داخلية لمشاهد بصرية غير مألوفة، أظهر النموذج أداءً منافسًا لنماذج متقدمة في السوق، مع تفوق واضح على نسخته السابقة، ما يعزز مكانته ضمن الجيل الجديد من تقنيات توليد الصور، بانتظار ما ستكشفه التجربة العملية للمستخدمين.

اترك تعليقا