ما هو LM Arena؟
LM Arena (أو LMArena) هو منصة مفتوحة لتقييم نماذج الذكاء الاصطناعي من خلال التفضيل البشري. تم إطلاقها في الأصل باسم Chatbot Arena من قبل باحثين في جامعة UC Berkeley، وتتيح للمستخدمين التصويت على أي رد من النماذج يفضلونه في مقارنات عمياء.
منذ انطلاقها، جمعت المنصة أكثر من 3.5 مليون صوت عبر أكثر من 400 نموذج حتى سبتمبر 2025.
تمويل ونمو LM Arena
في مايو 2025، أعلنت بلومبرغ أن LM Arena حصلت على 100 مليون دولار في جولة تمويل بتقييم 600 مليون دولار. هذا يعكس أهمية المنصة في تقييم تقنيات الذكاء الاصطناعي.
كيف يعمل فلتر LM Arena؟
الفلتر في LM Arena يسمح لك بتصفية النماذج حسب معايير مختلفة:
أنواع الفلاتر المتاحة
- Text Leaderboard: لمقارنة نماذج المحادثة النصية
- Vision Leaderboard: للنماذج التي تفهم الصور
- WebDev Leaderboard: لنماذج تطوير الويب
- Search Leaderboard: للنماذج المتكاملة مع البحث
- Expert Leaderboard: للمهام المتخصصة والصعبة
أحدث الترتيبات (ديسمبر 2025)
النماذج المضافة حديثاً
- 18 ديسمبر 2025: GPT-5.2 أُضيف إلى Text Leaderboard
- 17 ديسمبر 2025: Gemini-3-flash وGemini-3-flash (thinking-minimal) أُضيفا
- 23 ديسمبر 2025: mimo-v2-flash أُضيف
ترتيب النماذج الحالي
حسب نتائج Arena-Hard-Auto:
- Gemini-2.5: 90.8%
- o3-2025-04-16: 88.8%
- Gemini-2.5-flash: 83.9%
- DeepSeek-R1: 77.0%
نموذج Fiercefalcon
Fiercefalcon هو اسم كودي لنموذج جوجل الجديد الذي تم رصده في 11 ديسمبر 2025. يُعتقد أنه إما Gemini 3 Flash GA أو Gemini 3 Pro GA. بدرجة ELO تبلغ 1501، يتقدم على GPT-5.1 (1485) بـ 16 نقطة وعلى Claude 4 Opus (1472) بـ 29 نقطة.
Arena Expert: تقييم المهام الصعبة
في 5 نوفمبر 2025، أطلقت LMArena ميزة Arena Expert - إطار تقييم جديد لتحديد أصعب المطالبات من المستخدمين الحقيقيين.
مميزات Arena Expert
- يشمل فقط 5.5% من جميع المطالبات (مقارنة بـ Hard الذي يشمل ثلث المطالبات)
- يحدد المطالبات حسب عمق التفكير والتحديد
- ينتج فروقات أوضح بين النماذج
Mixture of Agents
إحدى الميزات المتقدمة في AI Chat هي خيار Mixture of Agents الذي يدمج بين ChatGPT وClaude وGemini. النظام يجري خطوة انعكاس للاحتفاظ بأقوى الأجزاء من كل إجابة - مفيد للمواضيع المعقدة.
كيف تستخدم LM Arena؟
- زيارة الموقع: اذهب إلى lmarena.ai
- اختر الوضع: Battle (مقارنة عمياء) أو Direct Chat
- أدخل سؤالك: اكتب ما تريد اختباره
- قارن الردود: ستحصل على ردين من نموذجين مجهولين
- صوّت: اختر الرد الأفضل
- اكتشف النماذج: بعد التصويت ستعرف أي نموذج كان كل رد
لماذا LM Arena مهم؟
- تقييم موضوعي: المستخدمون يصوتون بدون معرفة النموذج
- بيانات حقيقية: ملايين التفاعلات الفعلية
- تحديث مستمر: نماذج جديدة تُضاف باستمرار
- مجاني: متاح للجميع
استخدام الذكاء الاصطناعي في الكتابة
بعد فهم قدرات النماذج المختلفة عبر LM Arena، يمكنك اختيار الأداة المناسبة لاحتياجاتك. للكتابة باللغة العربية، يوفر الكاتب العربي واجهة سهلة تستفيد من أحدث نماذج الذكاء الاصطناعي.
جرب الكتابة بالذكاء الاصطناعي: https://app.arwriterai.com/
التعليقات