Anthropic מכריזה על עדכון דגם קלוד 3.5 Sonnet שלה עם ביצועים משופרים, אך מעל לכל פונקציונליות בקרת מחשב ניסיונית, כרגע בגרסת בטא. בואו נראה כיצד התכונה החדשה הזו מייצגת צעד אמיתי קדימה, ואת הסיכונים הכרוכים בכך.

עדכון סונטה של קלוד 3.5
Anthropic פרסמה עדכון גדול לקלוד 3.5 Sonnet, מודל בינה מלאכותית שכבר מוכר בזכות יכולות הקידוד המתקדמות שלו. גרסה משופרת זו בולטת בעלייה משמעותית בביצועים במשימות קידוד ובשימוש בכלים אוטומטיים. על מדדים כמו SWE-bench Verified,קלוד 3.5 Sonnet שיפרה את התוצאות שלו מ-33.4% ל-49%, תוך ביצועים טובים יותר מהדגמים המתחרים, כולל ה-OpenAI o1-preview הפופולרי.ההתקדמות הטכנית הזו מוצעת ללא הגדלת עלות או זמן תגובה עבור המשתמשים.
פונקציה חדשהשימוש במחשב
בגרסת בטא
Anthropic הציגה גם תכונה חדשה בשםשימוש במחשב
, זמין כעת בגרסת בטא ציבורית. API זה מאפשר לקלוד 3.5 להשתלט על המחשב שלך כדי לבצע משימות נפוצות כמו הזזת סמן, לחיצה על כפתורים או מילוי טפסים. למרות שהיכולת הזו עדיין בשלב הניסוי,זה פותח נקודות מבט מעניינות לאוטומציה של משימות מורכבות.חברות כמו Replit ו-Canva כבר בודקות תכונה זו כדי להפוך מספר תהליכים לאוטומטיים, אך אנתרופיק ממליצה על שימוש זהיר, וממליצה להשתמש בה למשימות בסיכון נמוך. לכן נמנע משימוש בו לשליטה בתחנת הכוח הגרעינית המקומית.

אתגרי אבטחה
ההקדמה שלשימוש במחשב
מעלה, כמובן, חששות ביטחוניים לגיטימיים, במיוחד לנוכח הסיכון של מתקפות סייבר כגוןזריקות מיידיות
. התקפות אלו מטרתן לתמרן תגובות AI כדי להשתלט מרחוק על מערכת. למרות שאנתרופיק מודעת לנקודות התורפה הללו ועובדת על פתרונות אבטחה,הפונקציונליות הנוכחית נותרה מוגבלת בשימוש בה, מה שהופך את הסיכונים הללו למתונים לעת עתה.הבה נתעקש עללְפִי שָׁעָה
.

נקודות מבט לעתיד
Anthropic מתכננת להמשיך ולשפר את הכלים החדשים הללו על ידי איסוף משוב ממפתחים. הפונקציונליותשימוש במחשב
צריך להיות מעודן לאורך זמן,במטרה להפוך את הטכנולוגיה הזו לאמינה יותר ובעיקר בטוחה יותר.
איך אתה רואה התקדמות מסוג זה?האם היית נותן לבינה מלאכותית להשתמש במחשב שלך?באופן כללי, האם אתה משתמש באתרי בינה מלאכותית על בסיס יומי? אם כן, לאיזה שימושים?
