גוגל השיקה זה עתה את Whisk, כלי AI חדש שנבדק באמצעות Google Labs. בניגוד למחוללי תמונות מסורתיים, Whisk אינו מסתמך רק על תיאורים טקסטואליים. כאן, התמונות שלך משמשות כהנחיות ליצירת ויז'ואל ייחודי. אתה יכול להוסיף מספר תמונות ויזואליות כדי להגדיר נושא, סצנה וסגנון, ואז לתת ל-AI לעשות את השאר.

איך זה עובד?
הרעיון מאחורילְהַקְצִיףברור: הפוך את העבודה שלך לקלה יותר.אין צורך לכתוב אינסוף הנחיות; פשוט ייבא חזותיים או אפילו השתמש באלו שהוצעו על ידיגוגל.ניתן גם לחדד את התוצאה עם מעט טקסט נוסף במידת הצורך, אך זה לא מחייב. לאחר יצירת התמונה, ניתן לערוך אותה על ידי התאמת ההנחיות או פרטים נוספים.
טכנולוגיות בשימוש
Whisk משתמש בשתי טכנולוגיות מגוגל: Gemini ו-Image 3. ראשית,מַזַל תְאוּמִים, מודל שפת הבינה המלאכותית, מנתח את התמונות שלך ומפיק תיאורים מפורטים בצורת טקסט.תיאורים אלה מועברים לאחר מכן ל-Image 3, מודל יצירת התמונה, אשר מייצר חזותי המבוסס על מידע זה.אבל היזהר, Whisk לא משחזר את התמונה המדויקת. הוא שואב ממנו השראה כדי ליצור יצירה שתופסת את מהותה. הבדיקות שלי מאשרות, השתמשתי בתמונה שלי, ובסופו של דבר זה לא באמת אני בתוצאות.

דוגמא קונקרטית
באופן קונקרטי, אם תעלה תמונה של חתול, סצנת חוף ואיור בסגנון קומיקס, תקבל חזותית בהשראת שלושת האלמנטים הללו.בדקתי עם כיסא, תמונה שלי וענן, זה נתן לי משהו די קוהרנטי, גם אם אני לא ממש רואה מה אני יכול לעשות עם ויז'ואל כזה.

כלי להתנסות, לא להפקה
גוגל אומרת את זה בעצמה: Whisk נועד לסיעור מוחות מהיר, לא ליצירות סופיות מוכנות לשימוש.ייתכן שהוויזואליה שנוצרת חסרה דיוק או היגיון.זה מעל הכל כלי לבדיקת רעיונות, חקירת סגנונות או יצירת ויז'ואל "גולמי" תוך כמה שניות.
מבחינת פונקציונליות, הממשק מציע שלושה סגנונות מוגדרים מראש: מדבקה, סיכת אמייל וקטיפה.מצב מתקדם מאפשר לך ללכת רחוק יותר עם תוספות טקסטואליות כדי להתאים את התוצאות.כרגע האפשרויות נותרו מוגבלות, וזה הגיוני בהתחשב בעובדה שמדובר בניסוי.
לְהַקְצִיףנגיש רק בארצות הברית כרגע, דרך Google Labs, אבל זה עובד בלי בעיה עם שלךVPNרגיל, וחשבון Google שלך, אפילו נוצר בצרפת.הכלי הוא חינמי, ומשתמשים יכולים להעלות את היצירות שלהם ישירות.גוגל סומכת על המשוב הראשון כדי לחדד את ה-Whisk ואולי להרחיב את הפונקציונליות שלו בעתיד.