مجموعة الوكلاء في النصف الأول من 2026: النماذج، Harnesses، Runtimes، ومساحات عمل AI
خريطة موجزة للنصف الأول من 2026 حول AI agents، ووكلاء البرمجة، وharnesses، وruntimes، وبنية المتصفح وsandbox، وقابلية الملاحظة، والحوكمة، ومساحات عمل AI، مع وضع MCPlato ضمن طبقة مساحة العمل.
نُشر في 2026-05-29
لم يعد سباق الوكلاء في النصف الأول من 2026 يبدو كلوحة ترتيب بسيطة للنماذج.
ما زالت النماذج الأفضل مهمة. فقد دفعت Claude 4 وClaude Sonnet 4.5 وClaude Opus 4.8 وGemini 2.5 Pro وDeepSeek R1/V3.1 وQwen3-Coder وMistral Magistral الطبقة الأساسية إلى الأمام في الاستدلال والبرمجة والسياق واستخدام الأدوات.12345678 لكن سؤال المنافسة تغير:
من يستطيع تحويل هذه النماذج إلى عمل موثوق؟
هذا يعني harnesses وruntimes ومتصفحات وsandboxes وتقييمات وقابلية ملاحظة وحوكمة وأذونات ومساحات عمل موجهة للمستخدم. النموذج هو المحرك. منتج الوكيل هو المركبة. ويقرر harness ومساحة العمل ما إذا كانت هذه المركبة قادرة على العمل داخل شركة حقيقية دون فقدان الحالة أو الصلاحية أو الثقة.
مجموعة وكلاء 2026 H1 متعددة الطبقات
الطريقة المفيدة لقراءة السوق هي النظر إليه كمجموعة طبقات، لا كدليل شعارات.
مجموعة وكلاء متعددة الطبقات في النصف الأول من 2026 من نماذج الأساس إلى مساحة عمل AI
الشكل 1: تنتقل مجموعة الوكلاء في النصف الأول من 2026 صعودا من قدرة النموذج إلى التنفيذ وقابلية الملاحظة والحوكمة واستمرارية مساحة العمل.
| الطبقة | ما الذي تضيفه | أمثلة تمثيلية |
|---|---|---|
| نماذج الأساس | الاستدلال، البرمجة، السياق الطويل، استخدام الكمبيوتر/الأدوات، التخطيط | Claude 4 / Sonnet 4.5 / Opus 4.8, Gemini 2.5 Pro, DeepSeek R1/V3.1, Qwen3-Coder, Mistral Magistral |
| منتجات الوكلاء | Workflows جاهزة للبرمجة والبحث وبناء التطبيقات والعمليات وإجراءات الشركات | Claude Code, OpenAI Codex, GitHub Copilot coding agent, Cursor, Devin, Jules, Replit Agent, Lovable, Bolt.new, Manus, Perplexity Labs |
| Harness / runtime | الحالة، إعادة المحاولة، الإنسان داخل الحلقة، التنسيق، الذاكرة، استدعاءات أدوات منظمة | LangGraph/LangChain, LlamaIndex, AutoGen, CrewAI, OpenAI Agents SDK, Vercel AI SDK, Mastra, PydanticAI, Agno, Letta |
| بنية المتصفح وsandbox | بيئات تنفيذ آمنة، أتمتة المتصفح، sandboxes للكود، عزل المهام | Browserbase, Stagehand, Playwright MCP, E2B, Daytona, Temporal, Arcade, Composio |
| قابلية الملاحظة والتقييمات | Traces، التكلفة، زمن الاستجابة، اختبارات الانحدار، تصحيح prompts/الأدوات، مراجعة الإنتاج | LangSmith, Langfuse, Helicone, معايير النماذج والوكلاء |
| حوكمة المؤسسات | الرؤية، التحكم في الوصول، السياسات، جرد الوكلاء، قابلية التدقيق، workflows الامتثال | Microsoft Copilot Studio, Salesforce Agentforce, ServiceNow AI Control Tower, أنماط تكامل قائمة على MCP |
| مساحة عمل AI | المكان الموجه للمستخدم حيث تستمر الأعمال متعددة الخطوات والملفات والجلسات والآثار والقرارات | MCPlato, Dust, Hebbia, منصات وكلاء بأسلوب مساحة العمل |
النقطة المهمة ليست أن كل منتج يجب أن يغطي كل طبقة. بل إن العمل الجاد بالوكلاء يحتاج الآن إلى كل هذه الطبقات في مكان ما من النظام.
عناقيد منتجات لا دليل خام
1. أصبحت وكلاء البرمجة أول فئة وكلاء جماهيرية
وكلاء البرمجة هي أوضح دليل على أن الوكلاء يمكنها تجاوز الدردشة. أصبح Claude Code متاحا بشكل عام مع Claude 4، وتم توثيقه كأداة agentic coding tool لبيئات الطرفية وworkflows التطوير.19 وتشير OpenAI Codex وGitHub Copilot coding agent وCursor وDevin وGoogle Jules وReplit Agent كلها إلى الاتجاه نفسه: يريد المطورون وكلاء يمكنها فحص المستودعات، وتحرير الملفات، وتشغيل الأوامر، وفتح pull requests، ومواصلة العمل عبر السياقات المحلية والسحابية.101112131415
هذا العنقود متقدم لأن العمل البرمجي لديه بالفعل حواجز مفيدة: الملفات، وdiffs، والاختبارات، والسجلات، والفروع، وCI، والمراجعة. الدرس لبقية السوق ليس أن “كل شيء يجب أن يكون برمجة”. بل إن الوكلاء تحتاج إلى آثار قابلة للمراجعة وحلقات تحقق.
2. حوّل بناة التطبيقات والوكلاء العامة prompts إلى workflows
تعد Lovable وBolt.new وReplit Agent وManus أمثلة على منتجات تتمحور حول إنتاج تطبيقات أو مواقع ويب أو عمل قابل للتنفيذ؛ وتصف Perplexity خدمة Labs بأنها ميزة إنشاء لمشاريع مثل التقارير ولوحات المعلومات والتطبيقات الخفيفة.16171819 وتصف وثائق المطورين لدى OpenAI بدائيات computer-use وبناء الوكلاء، بما في ذلك سطح أداة متصفح مرئي؛ لذلك من الأفضل التعامل مع اتجاهها في الوكلاء كجزء من تحول workflow نفسه، لا كميزة دردشة بسيطة.2021
تضغط هذه المنتجات المسافة بين النية والأثر. وتحديها هو التحدي نفسه الذي يواجه سوق الوكلاء الأوسع: عندما تصبح المهمة طويلة الأمد أو متعددة الخطوات أو مرئية خارجيا، يحتاج المنتج إلى حالة وأذونات وrollback وتسليم واضح من المسودة المولدة إلى أصل الإنتاج.
3. تنتقل وكلاء المؤسسات من التبني إلى التحكم
تعكس Salesforce Agentforce وServiceNow AI Control Tower وMicrosoft Copilot Studio هذا الواقع المؤسسي.22232425 يعتمد تبني الوكلاء الآن على الرؤية والسياسات والأذونات والملكية التشغيلية، لا على جودة prompt فقط.
تقع Zapier Agents وLindy وGumloop وDust وHebbia أقرب إلى أتمتة workflows والعمل المعرفي لفرق الأعمال.2627282930 وهي مهمة لأن تبني الوكلاء ليس مشكلة هندسية فقط. ففرق المبيعات والمالية والقانون والعمليات والتوظيف والبحث والدعم تحتاج أيضا إلى أنظمة وكلاء تستطيع استخدام الأدوات دون تجاوز السياسة بصمت.
4. أصبحت الأطر وruntimes الطبقة الوسطى للوكلاء
تمثل LangGraph/LangChain وLangSmith وLlamaIndex وAutoGen وCrewAI وOpenAI Agents SDK وVercel AI SDK وMastra وPydanticAI وAgno وLetta طبقة البناء تحت المنتجات الجاهزة.313233343536373839404142
في هذه الطبقة تصبح الحالة الدائمة والذاكرة وتوجيه الأدوات والموافقة البشرية والمخرجات المنظمة وتنسيق الوكلاء المتعددين primitives قابلة لإعادة الاستخدام. وهنا أيضا تكتشف فرق كثيرة أن “الوكيل” ليس تجريدا واحدا. فمساعد retrieval، وcoding worker، ومشغل المتصفح، والمحلل المالي، ووكيل خدمة العملاء، كلها تحتاج إلى عقود runtime مختلفة.
5. أصبحت البنية التحتية وقابلية الملاحظة متطلبات إنتاج
ليست Browserbase وStagehand وPlaywright MCP وE2B وDaytona وTemporal وArcade وComposio أدوات هامشية. إنها جزء من مستوى التحكم في الوكلاء.4344454647484950
تحتاج الوكلاء إلى المتصفحات لأن جزءا كبيرا من ويب العمل لا يزال يفتقر إلى APIs نظيفة. وتحتاج إلى sandboxes لأن الكود والأدوات يجب أن تعمل في بيئات معزولة. وتحتاج إلى محركات workflow دائمة لأن المهام الطويلة تفشل ثم تستأنف. وتحتاج إلى بوابات تكامل لأن بيانات الاعتماد والأذونات ونطاقات الفعل لا ينبغي ارتجالها داخل prompt.
تظهر LangSmith وLangfuse وHelicone النضج نفسه من جانب قابلية الملاحظة.325152 إذا كان الوكيل يلمس بيانات العملاء أو أنظمة الإنتاج أو استدعاءات نماذج مكلفة، فستحتاج الفرق إلى traces وتقييمات ورؤية للتكلفة ورؤية لزمن الاستجابة وفحوصات انحدار.
خمسة اتجاهات يجب متابعتها
1. يتلاشى التمايز بالنموذج وحده لصالح تمايز runtime
تتقارب أفضل النماذج حول قوة البرمجة واستخدام الأدوات والسياق الطويل والتخطيط. تذكر Anthropic نتائج برمجة Claude 4 وتوفر Claude Code، بينما تؤكد Gemini 2.5 Pro قدرة البرمجة والسياق الطويل، وتقدم DeepSeek V3.1 نفسها كخطوة نحو عصر الوكلاء، وتبرز Qwen3-Coder بيئات تدريب كبيرة لوكلاء الكود.1467
هذا يجعل runtime أكثر أهمية، لا أقل. عندما تستطيع عدة نماذج أساس الاستدلال بما يكفي، تختار الفرق المجموعة القادرة على حفظ الحالة، واستدعاء الأدوات بأمان، وتقييم النتائج، وإبقاء البشر في موقع التحكم.
2. أصبحت قابلية الملاحظة بوابة الإنتاج
سؤال “هل أجاب النموذج؟” ضعيف جدا للوكلاء. تحتاج فرق الإنتاج إلى معرفة:
- ما الأدوات التي تم استدعاؤها؟
- ما الحالة التي تغيرت؟
- ما الأدلة التي تدعم اكتمال المهمة؟
- كم كلفت عملية التشغيل؟
- أين ظهر زمن الاستجابة؟
- أي تغيير في prompt أو النموذج أو الأداة أو البيئة تسبب في انحدار؟
لهذا السبب أصبحت LangSmith وLangfuse وHelicone ومجموعات benchmarks ومراكز قيادة المؤسسات جزءا من نقاش الشراء. لا تستطيع الشركة حوكمة ما لا تراه.
3. أصبحت sandboxes المتصفح والكود بنية تحتية من الدرجة الأولى
تحتاج وكلاء computer-use ووكلاء البرمجة إلى أسطح تشغيل آمنة. تركز Browserbase وStagehand على أتمتة المتصفح لوكلاء AI؛ ويعرض Playwright MCP التحكم في المتصفح عبر MCP؛ وتركز E2B وDaytona على بيئات التنفيذ المعزولة؛ وتقدم Temporal التنفيذ الدائم لworkflows agentic AI.434445464753
هذا واحد من أهم تحولات النصف الأول من 2026: أصبحت “بيئة الوكيل” فئة منتجات. فالبيئة هي المكان الذي تصبح فيه الاستقلالية مفيدة أو خطيرة.
4. أصبحت الحوكمة والبروتوكولات توقعات افتراضية
MCP مهم لأنه يمنح السوق لغة مشتركة لربط النماذج بالأدوات والسياق.5455 لكن البروتوكولات لا تزيل متطلبات الحوكمة. بل تجعلها أكثر إلحاحا: عندما يصبح ربط الأدوات أسهل، تحتاج الفرق إلى سياسات أوضح حول من يمكنه ربطها، وما الأفعال المسموحة، وكيف تحدد نطاقات بيانات الاعتماد، وكيف تدقق الأنشطة.
تعكس Salesforce Agentforce وServiceNow AI Control Tower وMicrosoft Copilot Studio هذا الواقع المؤسسي. يعتمد تبني الوكلاء الآن على الرؤية والسياسات والأذونات والملكية التشغيلية، لا على جودة prompt فقط.
5. مساحة العمل غير المتزامنة متعددة الجلسات هي طبقة المستخدم المفقودة
سلسلة دردشة واحدة حاوية ضعيفة للعمل الطويل. غالبا ما يتفرع عمل الوكلاء الحقيقي: جلسة تبحث، وأخرى تصيغ، وأخرى تختبر، وأخرى تراجع، وأخرى تنتظر متابعة مجدولة. يحتاج المستخدمون إلى مكان تبقى فيه هذه المسارات والملفات والقرارات والآثار قابلة للفحص.
هنا يناسب MCPlato بشكل طبيعي. أفضل فهم لMCPlato هو أنه طبقة مساحة عمل AI: بيئة للمواد المحلية، والجلسات المتعددة، والعمل الخلفي أو المجدول، والآثار، والتنفيذ المرخص والقابل للملاحظة.56 لا ينبغي التعامل معه كبديل شامل لوكلاء البرمجة أو أبراج التحكم المؤسسية أو بنية المتصفح. دوره مختلف: مساعدة المستخدمين على تنظيم ومراقبة عمل AI الذي يمتد عبر الوثائق والبحث وسياق المتصفح ومخرجات المكتب والمتابعة غير المتزامنة.
بعبارة أخرى، ينتمي MCPlato إلى طبقة مساحة العمل في مجموعة الوكلاء: قريب من المستخدم، قريب من المواد، وفوق مكونات runtime والبنية التحتية الأدنى التي تجعل التنفيذ ممكنا.
إطار قرار عملي
مصفوفة قرار لاختيار منتجات الوكلاء حسب أفق الاستقلالية واحتياجات الحوكمة
الشكل 2: يجب أن تستند اختيارات مجموعة الوكلاء إلى أفق الاستقلالية وضغط الحوكمة، لا إلى ترتيب عالمي واحد.
استخدم خمسة أسئلة قبل اختيار مجموعة وكلاء.
| السؤال | إذا كانت الإجابة “نعم”، فامنح الأولوية ل |
|---|---|
| هل سيعدل الوكيل الكود أو البيانات أو السجلات أو الأنظمة الخارجية؟ | Sandbox، الأذونات، سجلات التدقيق، بوابات المراجعة، مسارات rollback |
| هل ستستمر المهمة أكثر من prompt واحد أو جلسة واحدة؟ | حالة دائمة، نقاط تحقق، تنفيذ في الخلفية، استمرارية مساحة العمل |
| هل سيستخدم الوكيل المتصفحات أو ينفذ كودا؟ | بنية أتمتة المتصفح، sandboxes معزولة، حدود بيانات الاعتماد |
| هل ستعتمد فرق متعددة على المخرج؟ | قابلية الملاحظة، التقييمات، تتبع التكلفة، السياسة، الملكية |
| هل سيحتاج المستخدمون إلى الإشراف على مسارات عمل متوازية كثيرة؟ | مساحة عمل AI، تنسيق متعدد الجلسات، آثار، ملخصات، انضباط التسليم |
يساعد تعيين بسيط:
- مهمة برمجة قصيرة: ابدأ بوكيل أصيل للبرمجة مثل Claude Code أو Codex أو Cursor أو Jules أو Devin أو Replit Agent أو GitHub Copilot coding agent.
- نموذج أولي لتطبيق: فكر في Lovable أو Bolt.new أو Replit Agent أو واجهات بناء مشابهة، ثم أضف مراجعة قبل الاستخدام الإنتاجي.
- أتمتة workflow للأعمال: انظر إلى Copilot Studio وAgentforce وServiceNow وZapier Agents وLindy وGumloop وDust وHebbia حسب البيانات والحوكمة وملاءمة المجال.
- منتج وكيل مخصص: اجمع مكونات runtime وبنية تحتية مثل LangGraph وLlamaIndex وCrewAI وOpenAI Agents SDK وVercel AI SDK وMCP وBrowserbase وE2B وTemporal وComposio وLangfuse وHelicone وLangSmith.
- عمل معرفي عابر للمواد: استخدم نمط مساحة عمل AI، حيث يعد MCPlato مثالا ذا صلة، خصوصا عندما يمتد العمل عبر مواد محلية وبحث وآثار وجلسات متعددة وتنفيذ مرخص.
الخلاصة
ليست خريطة الوكلاء في النصف الأول من 2026 معركة بين “النماذج” و“المنتجات”. إنها ظهور مجموعة كاملة.
توفر النماذج طبقة الاستدلال. وتغلف منتجات الوكلاء الأعمال الشائعة. وتحافظ harnesses وruntimes على العمل ذا حالة. وتجعل بنية المتصفح وsandbox استخدام الأدوات أكثر أمانا. وتجعل قابلية الملاحظة والتقييمات التنفيذ قابلا للفحص. وتجعل الحوكمة الاستقلالية مقبولة في المؤسسات. وتمنح مساحات عمل AI المستخدمين مكانا لتنسيق العمل طويل الأمد.
لن يكون الفائزون ببساطة الفرق ذات أكبر رقم benchmark للنموذج. بل الفرق القادرة على تحويل ذكاء النموذج إلى workflows موثوقة وقابلة للمراجعة ومقيدة بالأذونات.
المراجع
Footnotes
-
Anthropic, “Introducing Claude 4,” https://www.anthropic.com/news/claude-4 ↩ ↩2 ↩3
-
Anthropic, “Claude Sonnet 4.5,” https://www.anthropic.com/news/claude-sonnet-4-5 ↩
-
Anthropic, “Claude Opus 4.8,” https://www.anthropic.com/news/claude-opus-4-8 ↩
-
Google, “Gemini 2.5 Pro coding performance,” https://developers.googleblog.com/en/gemini-2-5-pro-io-improved-coding-performance/ ↩ ↩2
-
DeepSeek, “DeepSeek-R1 release,” https://api-docs.deepseek.com/news/news250120 ↩
-
DeepSeek, “DeepSeek-V3.1 release,” https://api-docs.deepseek.com/news/news250821 ↩ ↩2
-
Qwen, “Qwen3-Coder,” https://qwenlm.github.io/blog/qwen3-coder/ ↩ ↩2
-
Mistral AI, “Magistral,” https://mistral.ai/news/magistral ↩
-
Anthropic, “Claude Code overview,” https://code.claude.com/docs/en/overview ↩
-
OpenAI Codex developer documentation, https://developers.openai.com/codex ↩
-
GitHub, “GitHub Copilot coding agent in public preview,” https://github.blog/changelog/2025-05-19-github-copilot-coding-agent-in-public-preview/ ↩
-
Cursor changelog, https://cursor.com/changelog ↩
-
Cognition, “Devin 2,” https://cognition.ai/blog/devin-2 ↩
-
Google, “Jules now available,” https://blog.google/innovation-and-ai/models-and-research/google-labs/jules-now-available/ ↩
-
Replit, “Introducing Agent 3,” https://replit.com/blog/introducing-agent-3-our-most-autonomous-agent-yet ↩
-
Lovable, https://lovable.dev/ ↩
-
Bolt.new, https://bolt.new/ ↩
-
Manus, https://manus.im/ ↩
-
Perplexity, “Getting started with Labs,” https://www.perplexity.ai/hub/getting-started ↩
-
OpenAI developer documentation, “Computer use,” https://developers.openai.com/api/docs/guides/tools-computer-use ↩
-
OpenAI developer documentation, “Agents,” https://developers.openai.com/api/docs/guides/agents ↩
-
Salesforce, “Salesforce launches Agentforce 3,” https://www.salesforce.com/ap/news/press-releases/2025/06/24/salesforce-launches-agentforce-3-to-solve-the-biggest-blockers-to-scaling-ai-agents-visibility-and-control/ ↩
-
ServiceNow, “AI Control Tower,” https://www.servicenow.com/products/ai-control-tower.html ↩
-
Microsoft Copilot Studio release plan, https://learn.microsoft.com/en-us/power-platform/release-plan/2025wave2/microsoft-copilot-studio/ ↩
-
Microsoft, “6 core capabilities to scale agent adoption in 2026,” https://www.microsoft.com/en-us/microsoft-copilot/blog/copilot-studio/6-core-capabilities-to-scale-agent-adoption-in-2026/ ↩
-
Zapier, “AI agents survey,” https://zapier.com/blog/ai-agents-survey/ ↩
-
Lindy Agents, https://www.lindy.ai/agents ↩
-
Gumloop, https://www.gumloop.com/ ↩
-
Dust documentation, “Welcome to Dust,” https://docs.dust.tt/docs/welcome-to-dust ↩
-
Hebbia product, https://www.hebbia.com/product ↩
-
LangChain, “LangChain and LangGraph 1.0,” https://www.langchain.com/blog/langchain-langgraph-1dot0 ↩
-
LangSmith platform, https://www.langchain.com/langsmith-platform ↩ ↩2
-
LlamaIndex, “Introducing LlamaIndex 0.11,” https://www.llamaindex.ai/blog/introducing-llamaindex-0-11 ↩
-
Microsoft Research, AutoGen, https://www.microsoft.com/en-us/research/project/autogen/ ↩
-
CrewAI, “CrewAI OSS 1.0,” https://blog.crewai.com/crewai-oss-1-0-we-are-going-ga/ ↩
-
OpenAI Agents SDK, https://openai.github.io/openai-agents-python/ ↩
-
Vercel AI SDK documentation, https://ai-sdk.dev/docs/introduction ↩
-
Vercel, “Agentic infrastructure,” https://vercel.com/blog/agentic-infrastructure ↩
-
Mastra, https://mastra.ai/ ↩
-
PydanticAI documentation, https://pydantic.dev/docs/ai/ ↩
-
Agno documentation, https://docs.agno.com/introduction ↩
-
Letta, “Letta v1 agent,” https://www.letta.com/blog/letta-v1-agent ↩
-
Browserbase for AI, https://www.browserbase.com/industry/ai ↩ ↩2
-
Browserbase Stagehand, https://www.browserbase.com/stagehand ↩ ↩2
-
Microsoft Playwright MCP, https://github.com/microsoft/playwright-mcp ↩ ↩2
-
E2B Enterprise, https://e2b.dev/enterprise ↩ ↩2
-
Daytona sandboxes, https://www.daytona.io/docs/en/sandboxes/ ↩ ↩2
-
Temporal AI solutions, https://temporal.io/solutions/ai ↩
-
Arcade, https://www.arcade.dev/ ↩
-
Composio, https://composio.dev/ ↩
-
Langfuse documentation, https://langfuse.com/docs ↩
-
Helicone, https://www.helicone.ai/ ↩
-
Temporal, Agentic AI, https://temporal.io/ai/agentic-ai ↩
-
Anthropic, “Model Context Protocol,” https://www.anthropic.com/news/model-context-protocol ↩
-
Model Context Protocol, “2026 MCP Roadmap,” https://blog.modelcontextprotocol.io/posts/2026-mcp-roadmap/ ↩
-
MCPlato, https://mcplato.com/en/ ↩
