فان دايك يثني على سوبوسلاي: يمتلك صفات القائد المستقبلي لليفربول
أنثروبيك تطلق Claude 4.6 Sonnet: الأقوى في البرمجة والاستدلال
تواصل شركة أنثروبيك (Anthropic) تعزيز مكانتها في ساحة الذكاء الاصطناعي بإطلاق نموذجها الجديد Claude Sonnet 4.6، الذي يأتي بعد أسابيع فقط من إطلاق Claude Opus 4.6. وتؤكد الشركة أن هذا الإصدار هو الأقوى في سلسلة Sonnet حتى الآن، خاصة في مهام البرمجة والاستدلال المنطقي، ليصبح النموذج الافتراضي الجديد لروبوت الدردشة Claude، سواء للمستخدمين المجانيين أو مشتركي Pro.
يتوفر Sonnet 4.6 حاليًا عبر منصة الدردشة الخاصة بأنثروبيك، حيث يحصل المستخدمون المجانيون على وصول محدود يتجدد كل خمس ساعات، بينما يستمر المشتركون في خطة Pro بالاستخدام وفق هيكل التسعير الحالي. ولا يقتصر التوزيع على واجهة الدردشة؛ إذ توفره الشركة عبر واجهة برمجة التطبيقات (API) ومنصات الحوسبة السحابية الكبرى، مما يسهل دمجه في تطبيقات ومشاريع المطورين.
أوضحت الشركة أن النموذج يمثل "ترقية شاملة" لمهاراته في البرمجة، واستخدام الحاسوب، والاستدلال طويل السياق، وتخطيط الوكلاء الذكيين، وأعمال المعرفة والتصميم. ومن أبرز الميزات الجديدة هي نافذة السياق التي تصل إلى مليون رمز (1M token) في نسخته التجريبية، مما يسمح بمعالجة كميات ضخمة من البيانات وتحليل المستندات الطويلة بكفاءة غير مسبوقة.
تفوّق Sonnet 4.6 ملحوظ بشكل خاص في مجالات البرمجة وأعمال المعرفة التي تتطلب تحليل المستندات وتلخيص التقارير. وتشير أنثروبيك إلى أن النموذج أصبح أكثر اتساقًا في اتباع تعليمات البرمجة، وأفضل في توليد أكواد قابلة للاستخدام دون انحراف. كما أظهر مستخدمون أوليون تفضيلًا لأدائه مقارنة بالإصدارات السابقة، بل وتفوّق في بعض اختبارات الوكلاء الذكيين على نموذج Claude Opus 4.6 نفسه وفقًا لبعض المقارنات الداخلية.
على صعيد الاختبارات القياسية، حقق Sonnet 4.6 نتائج قوية في تقييمات مثل Humanity’s Last Exam وGPQA Diamond، التي تقيس عمق الاستدلال ودقة البرمجة. وفيما يخص جوانب السلامة، أكدت الشركة أن التحسينات التقنية رافقتها زيادة في معايير الأمان، حيث أظهر النموذج معدلات أقل من "الهلوسة" (توليد معلومات غير دقيقة) وانخفاضًا في ظاهرة "التملّق" أو الميل لموافقة افتراضات المستخدم الخاطئة.