مواجهة بين "كلاود 4.5" و"شات جي بي تي-5".. أيهما الأذكى؟

أجرت شركة Anthropic اختباراً مكثفاً لنموذجها الجديد للذكاء الاصطناعي كلاود 4.5، وصفته بأنه "أذكى نموذج حتى الآن"، وذلك في مواجهة مباشرة مع شات جي بي تي-5 من "أوبن إيه آي". الاختبارات شملت تسعة تحديات متنوعة في المنطق، والرياضيات، والبرمجة، والسرد الإبداعي، والكفاءة العملية، إضافة إلى اختبارات في التلخيص، والقيادة، والذكاء العاطفي.
وفي مجال حل الألغاز المنطقية، قدّم كلاود 4.5 شروحات دقيقة وخطوات تفصيلية للحل، مقابل إجابة مختصرة ومباشرة من شات جي بي تي-5، ما منح كلاود الأفضلية في الشمولية. أما في الرياضيات، فقدّم شات جي بي تي حلولاً سريعة وفعالة، بينما ركّز كلاود على الشرح خطوة بخطوة، مسهلاً فهم المنطق الرياضي.
وفي السرد القصصي، ابتكر كلاود منظوراً فريداً للكائنات الفضائية بتفاصيل بيولوجية وإدارية دقيقة، بينما اكتفى شات جي بي تي-5 بوصف شاعري عام، ما جعل كفة التفوق تميل لصالح كلاود. وفي اختبارات الأسلوب الأدبي، أظهر كلاود قدرته على بناء مشاهد غنية بالخيال والصور، متفوقاً على منافسه في العمق السردي.
أما في البرمجة، فقدّم كلاود حلولاً تحليلية للأخطاء مع تفسير أسبابها، بينما ركّز شات جي بي تي-5 على توفير وظائف جاهزة مع أمثلة عملية، ما كشف عن تميز الأول في التحليل والثاني في التطبيق المباشر. وفي الكفاءة العملية، تفوق شات جي بي تي-5 عندما كان الحل المباشر مطلوباً، بينما قدّم كلاود خيارات متعددة تناسب احتياجات مختلفة.
وفي اختبارات التلخيص، برع شات جي بي تي-5 في تقديم ملخصات قصيرة ودقيقة، بينما فضّل كلاود الإطالة بالشروح. أما في القيادة والذكاء العاطفي، فقدّم كلاود استجابات متوازنة جمعت بين التعاطف والإرشاد، فيما ركّز شات جي بي تي-5 على خطوات عملية ونصائح مالية، ما منح كلاود الأفضلية في التفاعل الإنساني.
وبالنهاية، أظهرت النتائج أن كلاود 4.5 تفوّق في مجالات المنطق والسرد والذكاء العاطفي، بينما احتفظ شات جي بي تي-5 بميزاته في الاختصار والدقة والكفاءة العملية، ليكشف الاختبار عن اختلاف في فلسفة التصميم بين النموذجين: الأول يميل إلى التحليل والشرح، والثاني يركّز على الحلول المباشرة والسريعة.