במשך כמה שעות, Openai פורס גרסה חדשה של GPT-4O, דגם רב-מודאלי המאפשר לך ליצור ולשנות תמונות ישירות באמצעות CHATGPT. עדכון זה נגיש ללא תשלום, מבטיח חזותיים מפורטים וטקסטים משולבים מדויקים. השווינו את זה לדגם Xai Grok כדי לראות מה זה באמת שווה.

Openaiהשיק עדכון חשוב ל- CHATGPT על ידי שילוב יצירת התמונות באמצעות דגם GPT-4O שלה. בניגוד ל- Dall-E 3 שהוא מחליף, GPT-4O זמין לכל משתמשי CHATGPT, כולל אלה של התוכנית החינמית, עם גבול של שלוש תמונות ביום.למנויים עם יותר, לרמות Pro וצוות יש מכסות גבוהות יותר לשימוש אינטנסיבי יותר.
דגם חדש זה נועד לשלב טקסט ותמונה בצורה קוהרנטית. במקום להשתמש בטכניקת דיפוזיה קלאסית המייצרת תמונה בבת אחת, GPT-4O נוקטת גישה אוטומטית, ובונה את הוויזואליות בהדרגה.זה מאפשר דיוק טוב יותר בפרטים ושיפור העיבוד הטקסטואלי, שימושי במיוחד עבור לוחות או סימנים המציגים מילים.
מכוון לנתונים ציבוריים ושותפויות פרטיות כמו Shutterstock, GPT-4O מבקש להציע יותר מציאותי ומעל לכל תמונות עקביות יותר.OpenAI טוענת כי חיזקה את אבטחת המודל שלה על ידי שילוב מטא נתונים של C2PA כדי לזהות את התמונות שנוצרו על ידי AI.אמצעים קיימים גם כדי להימנע מתוכן לא הולם, ובמיוחד לאלה שמעורבים אנשים אמיתיים.

תכונות ושילוב
GPT-4O משולב כעת בסורה, כלי ייצור הווידיאו של Openai, המאפשר לך להשתמש במודל הן ליצירת תמונות קבועות ותוכן מולטימדיה.Openai מציין גם כי המודל מסוגל להתייחס לבקשות מורכבות הכרוכות במספר אובייקטים מובחנים, עד עשרים, מבלי לאבד דיוק.
הכלי אמור להפוך את הטקסטים טוב יותר לשולב בתמונות מאשר קודמותיו, חולשה שהועלה לעתים קרובות ביצירת תמונות. כמו כן, שימו לב שעכשיו, GPT-4O מסוגל לייצר תמונות שקופות עבור לוגואים או מדבקות, אך גם לעבוד מתמונות שהורדו על ידי המשתמש.

השוואה עם Xai Grok
כדי לבדוק את GPT-4O, השווינו אותו לדגםגרוקמ- XAI, ידוע בזכות איכות יצירת הדימוי שלה אך מתח ביקורת על ניהול הטקסטים הלא מושלם שלה.שלוש הנחיות שימשו כדי להעריך את הביצועים של שני הדגמים:
הנחיה 1:צור לי דימוי של אישה עם שלט ביד בה כתב את Cuckoo Vive Mac4ever.


הנחיה 2:צור לי את התצלום של רחוב טיפוס סקוטי עם חנויות, כולל חנות עם מותג בשם Mac4ever Shop.


הנחיה 3:טוחנים לי את התצלום של אישה צעירה על החוף בבגד ים, עליה אוחזת דף נייר עם דידייה מסומנת אני אוהב את זה.


התמונות שנוצרו על ידי כל דגם בדרך כלל טובות מאוד, בפרט באיכות שילוב הטקסט לוויזואליות.GPT-4O עשוי להציג עקביות טובה יותר בביצוע הטקסטים, שם, אך בכל מקרה זה נראה טוב מאוד.

גבולות ופוטנציאל
ל- GPT-4O עדיין יש כמה תקלות. הכלי לפעמים נאבק בניהול בקשות מפורטות במיוחד או לערוך במדויק חלקים מסוימים של תמונות, בפרט פנים או טקסטים רב לשוניים.יהיה זה ככל שיהיה, התוצאות בדרך כלל עקביות יותר מאלו המתקבלות בדורות הקודמים.
מבחינת האבטחה, OpenAI מציין כי מסננים מחוזקים קיימים כדי לחסום תוכן בלתי הולם, בפרט אלה הכרוכים בעירום או אלימות גרפית. התמונות שנוצרו מסומנות אוטומטית על ידי מטא נתונים כדי לבדוק את מקורן.
עם תכונה חדשה זו, OpenAI ממקמת אפוא את GPT-4O ככלי רב-מודאלי המסוגל להתחרות בדגמים הטובים ביותר של יצירת תמונות.שילוב הטקסט בתמונות מדויק יותר, והטכנולוגיה מסוגלת להתייחס לבקשות מורכבות בהצלחה מסוימת.