חברת Cohere משחררת יכולת ריבוי-שלבים למודל הדגל שלה

מאת Yuval Avidani

תוכן עניינים

אז Cohere ששחררו לאחרונה את מודל הדגל Command-R פנו אלי לבחון יכולת חדשה שנקראת ״ריבוי שלבים״ - שזה בעצם מה שלנגצ'יין מאפשר (וגם OpenAI וקלוד) - להבין את המשימה שאנחנו נותנים למודל, להפעיל כלים רלוונטיים ולהחזיר תשובה.

למה זה מעניין? כי קוהר מעולים בעברית ויש להם יתרון אדיר בכך שהמודל הוזה פחות ומצטט מדויק יותר מקורות. אז לקחתי אותו לסיבוב. כתבתי כמה כלים כמו חיפוש בגוגל, חילוץ (scraping) של מידע מאתרים, חיפוש בוויקיפדיה ושימוש בפייתון, וביקשתי ממנו:

1. מצא לי את הטרנדים הכי חמים בטוויטר, חפש מה זה כל טרנד והסבר על כל אחד בפסקה קצרה.

2. גש לאתר (נתתי לו אתר עם פרק תהילים), הסבר מה משמעות הטקסט, ציין מקורות ובסוף צור קובץ טקסט עם התוכן.

בתמונה אפשר לראות את החשיבה של המודל (Reasoning). הוא מנמק באיזה כלי הוא בוחר להשתמש ומה דרכי הפעולה שלו. נכון - זה לא חדש, ראינו את זה בעבר, אבל אם אני משווה למודלים אחרים נראה שהוא מדויק יותר ואמור לבזבז פחות טוקנים מאשר לנגצ'יין ו-OpenAI וקלוד. לא מדדתי את זה, אבל אין ספק שקוהר נמצאים בדרך הנכונה.

לא רק זה, אלא אתמול הם שחררו 2 מודלים גדולים של שפה בחינם, אחד של 8 מיליארד פרמטרים ואחד של 35 מיליארד. מודלים רב שפתיים! לא רק זה, אלא אפשר להשתמש בחינם ב-Command-R באתר שלהם והוא באמת מעולה. יש להם אפילו ויזואליזציה באתר לתהליך ה-Embeddings שזה מרתק, כמו גם קלסיפיקציה (סיווג) ועוד.

קיצר, תנו לו הזדמנות. לדעתי יש כאן התחלה של ידידות מופלאה!
יובל

תוייג ב

ai tools, LLM, ai agents, cohere

עדכון אחרון יוני 03, 2024

אודות המחבר