نموذج Images 2.0 الجديدة داخل ChatGPT يُبهر بدقة غير متوقعة في توليد النصوص داخل الصور

في خطوة جديدة تعكس تسارع تطور الذكاء الاصطناعي، كشفت شركة OpenAI عن نموذجها الأحدث لتوليد الصور داخل ChatGPT تحت اسم Images 2.0، والذي يقدم تحسينات كبيرة في دقة الصور وقدرته على التعامل مع النصوص داخلها، وهي إحدى أبرز نقاط الضعف في النماذج السابقة.
أهم مميزات نموذج Images 2.0 الجديد
تحسن جذري في كتابة النصوص داخل الصور
على مدار السنوات الماضية، عانت نماذج توليد الصور — مثل DALL-E 3 — من صعوبة في كتابة النصوص بشكل صحيح، حيث كانت تُنتج كلمات غير مفهومة أو مليئة بالأخطاء.
أما مع Images 2.0، فقد أصبح بالإمكان إنشاء صور تحتوي على نصوص دقيقة وقابلة للاستخدام مباشرة، مثل قوائم الطعام أو المواد التسويقية، دون أن يلاحظ المستخدم أي خلل واضح. هذا التطور يعكس نقلة نوعية في فهم النموذج لتفاصيل الصورة الدقيقة، خاصة العناصر النصية الصغيرة.
تقنيات أكثر تطورًا لفهم الصور
تعتمد النماذج التقليدية على ما يُعرف بـ”نماذج الانتشار” (Diffusion Models)، والتي تُعيد بناء الصور من الضوضاء، وهو ما كان يجعل النصوص عنصرًا ثانويًا يصعب إتقانه. لكن التطورات الحديثة تشير إلى استخدام تقنيات أكثر تقدمًا — مثل النماذج التوليدية التنبؤية (Autoregressive Models) — التي تعمل بطريقة أقرب إلى نماذج اللغة، ما يساعد على تحسين دقة التفاصيل، خاصة النصوص والعناصر الدقيقة داخل الصورة.
ورغم ذلك، لم تكشف OpenAI رسميًا عن البنية التقنية الدقيقة للنموذج الجديد.
قدرات “تفكير” ومزايا متقدمة
أوضحت الشركة أن نموذج Images 2.0 يتمتع بما وصفته بـ”قدرات التفكير”، والتي تمنحه مجموعة من الميزات المتقدمة، أبرزها:
- القدرة على البحث عبر الإنترنت لتحسين النتائج
- إنشاء عدة صور من طلب واحد
- مراجعة وتحسين مخرجاته تلقائيًا
- تصميم مواد تسويقية بأحجام مختلفة
- إنشاء قصص مصورة متعددة الإطارات (Comics)

كما يتميز النموذج بقدرته على التعامل بشكل أفضل مع اللغات غير اللاتينية، مثل اليابانية والكورية والهندية والبنغالية، ما يوسع نطاق استخدامه عالميًا.
دقة أعلى وجودة تصل إلى 2K
أكدت OpenAI أن النموذج الجديد يقدم مستوى غير مسبوق من الدقة والالتزام بالتفاصيل، حيث يستطيع:
- تنفيذ التعليمات المعقدة بدقة
- الحفاظ على التفاصيل المطلوبة في الصورة
- تحسين العناصر الدقيقة مثل الأيقونات وواجهات المستخدم
- إنتاج صور بجودة تصل إلى 2K
ورغم أن إنشاء الصور المعقدة قد يستغرق وقتًا أطول مقارنة بالإجابات النصية، إلا أن النتائج المتقدمة يمكن إنجازها خلال دقائق قليلة فقط.
التوفر وخيارات الاستخدام
بدأت OpenAI بالفعل في طرح نموذج Images 2.0 لجميع مستخدمي ChatGPT، مع إتاحة ميزات أكثر تقدمًا للمشتركين في الخطط المدفوعة. كما أعلنت الشركة عن توفير واجهة برمجية جديدة تحت اسم gpt-image-2 API، تتيح للمطورين دمج قدرات النموذج في تطبيقاتهم، مع تسعير يعتمد على جودة ودقة الصور المطلوبة.
ملاحظات مهمة
- يعتمد النموذج على بيانات حتى ديسمبر 2025، ما قد يؤثر على دقته في المحتوى المرتبط بالأحداث الحديثة
- توليد الصور المعقدة يستغرق وقتًا أطول نسبيًا، لكنه يظل سريعًا مقارنة بجودة النتائج
تلخيص مميزات نموذج Images 2.0
- توليد صور بدقة تصل إلى 2K بجودة عالية جدًا
- كتابة نصوص داخل الصور بدقة ووضوح دون أخطاء
- إنشاء تصاميم تسويقية وقوائم ومحتوى بصري جاهز للاستخدام
- دعم أفضل للغات غير اللاتينية مثل اليابانية والكورية والهندية وحتى العربية
- القدرة على إنتاج عدة صور من طلب واحد فقط
- تحسين تلقائي للنتائج ومراجعة المخرجات قبل عرضها
- إنشاء محتوى بصري معقد مثل القصص المصورة (Comics)
- فهم أدق للتعليمات والتفاصيل الدقيقة داخل الصورة
- إمكانية استخدامه عبر واجهة برمجية للمطورين (API)
- إنتاج صور متعددة الأحجام والتنسيقات حسب الحاجة
يمثل Images 2.0 خطوة كبيرة نحو جعل الصور المُولدة بالذكاء الاصطناعي أكثر واقعية وقابلة للاستخدام العملي، خاصة في مجالات التصميم والتسويق وصناعة المحتوى. ومع هذا التطور، تقترب الفجوة بين الإبداع البشري والذكاء الاصطناعي من التلاشي أكثر من أي وقت مضى.
اقرأ أيضًا: هل أصبح هاتفك بطيئًا ؟ إليك 3 إعدادات مخفية في هواتف جالكسي ستغيّر كل شيء



إرسال التعليق