أفكار في توليد الصور بالذكاء الاصطناعي باستخدام نماذج Diffusion مع دراسة مقارنة وتأثير هندسة الأوامر النصية
DOI:
https://doi.org/10.58916/jhas.v11i3.1169الكلمات المفتاحية:
Technologies, image generation، artificial intelligence, visual quality، text commandsالملخص
يهدف هذا البحث إلى دراسة تقنيات توليد الصور باستخدام الذكاء الاصطناعي، مع التركيز على نماذج الانتشار (Diffusion Models)، وتحليل أداء أبرز الأدوات وهي DALL·E وMidjourney وStable Diffusion.
كما يتناول البحث تأثير هندسة الأوامر النصية (Prompt Engineering) على جودة الصور الناتجة.
وتم إجراء تجربتين عمليتين؛ الأولى تهدف إلى مقارنة الأدوات الثلاث باستخدام نفس الأوامر النصية ضمن أنماط مختلفة (واقعي، سريالي، عربي)، بينما ركزت التجربة الثانية على تحليل تأثير جودة صياغة الأوامر النصية (ضعيف، متوسط، قوي) باستخدام نفس الأداة.
أظهرت النتائج تفوق Midjourney في الجودة البصرية والإبداع الفني، بينما تميز DALL·E بالدقة في تنفيذ الأوامر النصية، في حين وفر Stable Diffusion مرونة عالية مع تباين في جودة النتائج. كما أثبتت الدراسة أن تحسين صياغة الأوامر النصية يؤدي إلى تحسين كبير في جودة الصور الناتجة.



