العودة إلى المدونة
وكلاء AI
مجموعة الوكلاء
Agent harness
Runtime
مساحة عمل AI
MCPlato

مجموعة الوكلاء في النصف الأول من 2026: النماذج، Harnesses، Runtimes، ومساحات عمل AI

خريطة موجزة للنصف الأول من 2026 حول AI agents، ووكلاء البرمجة، وharnesses، وruntimes، وبنية المتصفح وsandbox، وقابلية الملاحظة، والحوكمة، ومساحات عمل AI، مع وضع MCPlato ضمن طبقة مساحة العمل.

نُشر في 2026-05-29

لم يعد سباق الوكلاء في النصف الأول من 2026 يبدو كلوحة ترتيب بسيطة للنماذج.

ما زالت النماذج الأفضل مهمة. فقد دفعت Claude 4 وClaude Sonnet 4.5 وClaude Opus 4.8 وGemini 2.5 Pro وDeepSeek R1/V3.1 وQwen3-Coder وMistral Magistral الطبقة الأساسية إلى الأمام في الاستدلال والبرمجة والسياق واستخدام الأدوات.12345678 لكن سؤال المنافسة تغير:

من يستطيع تحويل هذه النماذج إلى عمل موثوق؟

هذا يعني harnesses وruntimes ومتصفحات وsandboxes وتقييمات وقابلية ملاحظة وحوكمة وأذونات ومساحات عمل موجهة للمستخدم. النموذج هو المحرك. منتج الوكيل هو المركبة. ويقرر harness ومساحة العمل ما إذا كانت هذه المركبة قادرة على العمل داخل شركة حقيقية دون فقدان الحالة أو الصلاحية أو الثقة.

مجموعة وكلاء 2026 H1 متعددة الطبقات

الطريقة المفيدة لقراءة السوق هي النظر إليه كمجموعة طبقات، لا كدليل شعارات.

مجموعة وكلاء متعددة الطبقات في النصف الأول من 2026 من نماذج الأساس إلى مساحة عمل AIمجموعة وكلاء متعددة الطبقات في النصف الأول من 2026 من نماذج الأساس إلى مساحة عمل AI

الشكل 1: تنتقل مجموعة الوكلاء في النصف الأول من 2026 صعودا من قدرة النموذج إلى التنفيذ وقابلية الملاحظة والحوكمة واستمرارية مساحة العمل.

الطبقةما الذي تضيفهأمثلة تمثيلية
نماذج الأساسالاستدلال، البرمجة، السياق الطويل، استخدام الكمبيوتر/الأدوات، التخطيطClaude 4 / Sonnet 4.5 / Opus 4.8, Gemini 2.5 Pro, DeepSeek R1/V3.1, Qwen3-Coder, Mistral Magistral
منتجات الوكلاءWorkflows جاهزة للبرمجة والبحث وبناء التطبيقات والعمليات وإجراءات الشركاتClaude Code, OpenAI Codex, GitHub Copilot coding agent, Cursor, Devin, Jules, Replit Agent, Lovable, Bolt.new, Manus, Perplexity Labs
Harness / runtimeالحالة، إعادة المحاولة، الإنسان داخل الحلقة، التنسيق، الذاكرة، استدعاءات أدوات منظمةLangGraph/LangChain, LlamaIndex, AutoGen, CrewAI, OpenAI Agents SDK, Vercel AI SDK, Mastra, PydanticAI, Agno, Letta
بنية المتصفح وsandboxبيئات تنفيذ آمنة، أتمتة المتصفح، sandboxes للكود، عزل المهامBrowserbase, Stagehand, Playwright MCP, E2B, Daytona, Temporal, Arcade, Composio
قابلية الملاحظة والتقييماتTraces، التكلفة، زمن الاستجابة، اختبارات الانحدار، تصحيح prompts/الأدوات، مراجعة الإنتاجLangSmith, Langfuse, Helicone, معايير النماذج والوكلاء
حوكمة المؤسساتالرؤية، التحكم في الوصول، السياسات، جرد الوكلاء، قابلية التدقيق، workflows الامتثالMicrosoft Copilot Studio, Salesforce Agentforce, ServiceNow AI Control Tower, أنماط تكامل قائمة على MCP
مساحة عمل AIالمكان الموجه للمستخدم حيث تستمر الأعمال متعددة الخطوات والملفات والجلسات والآثار والقراراتMCPlato, Dust, Hebbia, منصات وكلاء بأسلوب مساحة العمل

النقطة المهمة ليست أن كل منتج يجب أن يغطي كل طبقة. بل إن العمل الجاد بالوكلاء يحتاج الآن إلى كل هذه الطبقات في مكان ما من النظام.

عناقيد منتجات لا دليل خام

1. أصبحت وكلاء البرمجة أول فئة وكلاء جماهيرية

وكلاء البرمجة هي أوضح دليل على أن الوكلاء يمكنها تجاوز الدردشة. أصبح Claude Code متاحا بشكل عام مع Claude 4، وتم توثيقه كأداة agentic coding tool لبيئات الطرفية وworkflows التطوير.19 وتشير OpenAI Codex وGitHub Copilot coding agent وCursor وDevin وGoogle Jules وReplit Agent كلها إلى الاتجاه نفسه: يريد المطورون وكلاء يمكنها فحص المستودعات، وتحرير الملفات، وتشغيل الأوامر، وفتح pull requests، ومواصلة العمل عبر السياقات المحلية والسحابية.101112131415

هذا العنقود متقدم لأن العمل البرمجي لديه بالفعل حواجز مفيدة: الملفات، وdiffs، والاختبارات، والسجلات، والفروع، وCI، والمراجعة. الدرس لبقية السوق ليس أن “كل شيء يجب أن يكون برمجة”. بل إن الوكلاء تحتاج إلى آثار قابلة للمراجعة وحلقات تحقق.

2. حوّل بناة التطبيقات والوكلاء العامة prompts إلى workflows

تعد Lovable وBolt.new وReplit Agent وManus أمثلة على منتجات تتمحور حول إنتاج تطبيقات أو مواقع ويب أو عمل قابل للتنفيذ؛ وتصف Perplexity خدمة Labs بأنها ميزة إنشاء لمشاريع مثل التقارير ولوحات المعلومات والتطبيقات الخفيفة.16171819 وتصف وثائق المطورين لدى OpenAI بدائيات computer-use وبناء الوكلاء، بما في ذلك سطح أداة متصفح مرئي؛ لذلك من الأفضل التعامل مع اتجاهها في الوكلاء كجزء من تحول workflow نفسه، لا كميزة دردشة بسيطة.2021

تضغط هذه المنتجات المسافة بين النية والأثر. وتحديها هو التحدي نفسه الذي يواجه سوق الوكلاء الأوسع: عندما تصبح المهمة طويلة الأمد أو متعددة الخطوات أو مرئية خارجيا، يحتاج المنتج إلى حالة وأذونات وrollback وتسليم واضح من المسودة المولدة إلى أصل الإنتاج.

3. تنتقل وكلاء المؤسسات من التبني إلى التحكم

تعكس Salesforce Agentforce وServiceNow AI Control Tower وMicrosoft Copilot Studio هذا الواقع المؤسسي.22232425 يعتمد تبني الوكلاء الآن على الرؤية والسياسات والأذونات والملكية التشغيلية، لا على جودة prompt فقط.

تقع Zapier Agents وLindy وGumloop وDust وHebbia أقرب إلى أتمتة workflows والعمل المعرفي لفرق الأعمال.2627282930 وهي مهمة لأن تبني الوكلاء ليس مشكلة هندسية فقط. ففرق المبيعات والمالية والقانون والعمليات والتوظيف والبحث والدعم تحتاج أيضا إلى أنظمة وكلاء تستطيع استخدام الأدوات دون تجاوز السياسة بصمت.

4. أصبحت الأطر وruntimes الطبقة الوسطى للوكلاء

تمثل LangGraph/LangChain وLangSmith وLlamaIndex وAutoGen وCrewAI وOpenAI Agents SDK وVercel AI SDK وMastra وPydanticAI وAgno وLetta طبقة البناء تحت المنتجات الجاهزة.313233343536373839404142

في هذه الطبقة تصبح الحالة الدائمة والذاكرة وتوجيه الأدوات والموافقة البشرية والمخرجات المنظمة وتنسيق الوكلاء المتعددين primitives قابلة لإعادة الاستخدام. وهنا أيضا تكتشف فرق كثيرة أن “الوكيل” ليس تجريدا واحدا. فمساعد retrieval، وcoding worker، ومشغل المتصفح، والمحلل المالي، ووكيل خدمة العملاء، كلها تحتاج إلى عقود runtime مختلفة.

5. أصبحت البنية التحتية وقابلية الملاحظة متطلبات إنتاج

ليست Browserbase وStagehand وPlaywright MCP وE2B وDaytona وTemporal وArcade وComposio أدوات هامشية. إنها جزء من مستوى التحكم في الوكلاء.4344454647484950

تحتاج الوكلاء إلى المتصفحات لأن جزءا كبيرا من ويب العمل لا يزال يفتقر إلى APIs نظيفة. وتحتاج إلى sandboxes لأن الكود والأدوات يجب أن تعمل في بيئات معزولة. وتحتاج إلى محركات workflow دائمة لأن المهام الطويلة تفشل ثم تستأنف. وتحتاج إلى بوابات تكامل لأن بيانات الاعتماد والأذونات ونطاقات الفعل لا ينبغي ارتجالها داخل prompt.

تظهر LangSmith وLangfuse وHelicone النضج نفسه من جانب قابلية الملاحظة.325152 إذا كان الوكيل يلمس بيانات العملاء أو أنظمة الإنتاج أو استدعاءات نماذج مكلفة، فستحتاج الفرق إلى traces وتقييمات ورؤية للتكلفة ورؤية لزمن الاستجابة وفحوصات انحدار.

خمسة اتجاهات يجب متابعتها

1. يتلاشى التمايز بالنموذج وحده لصالح تمايز runtime

تتقارب أفضل النماذج حول قوة البرمجة واستخدام الأدوات والسياق الطويل والتخطيط. تذكر Anthropic نتائج برمجة Claude 4 وتوفر Claude Code، بينما تؤكد Gemini 2.5 Pro قدرة البرمجة والسياق الطويل، وتقدم DeepSeek V3.1 نفسها كخطوة نحو عصر الوكلاء، وتبرز Qwen3-Coder بيئات تدريب كبيرة لوكلاء الكود.1467

هذا يجعل runtime أكثر أهمية، لا أقل. عندما تستطيع عدة نماذج أساس الاستدلال بما يكفي، تختار الفرق المجموعة القادرة على حفظ الحالة، واستدعاء الأدوات بأمان، وتقييم النتائج، وإبقاء البشر في موقع التحكم.

2. أصبحت قابلية الملاحظة بوابة الإنتاج

سؤال “هل أجاب النموذج؟” ضعيف جدا للوكلاء. تحتاج فرق الإنتاج إلى معرفة:

  • ما الأدوات التي تم استدعاؤها؟
  • ما الحالة التي تغيرت؟
  • ما الأدلة التي تدعم اكتمال المهمة؟
  • كم كلفت عملية التشغيل؟
  • أين ظهر زمن الاستجابة؟
  • أي تغيير في prompt أو النموذج أو الأداة أو البيئة تسبب في انحدار؟

لهذا السبب أصبحت LangSmith وLangfuse وHelicone ومجموعات benchmarks ومراكز قيادة المؤسسات جزءا من نقاش الشراء. لا تستطيع الشركة حوكمة ما لا تراه.

3. أصبحت sandboxes المتصفح والكود بنية تحتية من الدرجة الأولى

تحتاج وكلاء computer-use ووكلاء البرمجة إلى أسطح تشغيل آمنة. تركز Browserbase وStagehand على أتمتة المتصفح لوكلاء AI؛ ويعرض Playwright MCP التحكم في المتصفح عبر MCP؛ وتركز E2B وDaytona على بيئات التنفيذ المعزولة؛ وتقدم Temporal التنفيذ الدائم لworkflows agentic AI.434445464753

هذا واحد من أهم تحولات النصف الأول من 2026: أصبحت “بيئة الوكيل” فئة منتجات. فالبيئة هي المكان الذي تصبح فيه الاستقلالية مفيدة أو خطيرة.

4. أصبحت الحوكمة والبروتوكولات توقعات افتراضية

MCP مهم لأنه يمنح السوق لغة مشتركة لربط النماذج بالأدوات والسياق.5455 لكن البروتوكولات لا تزيل متطلبات الحوكمة. بل تجعلها أكثر إلحاحا: عندما يصبح ربط الأدوات أسهل، تحتاج الفرق إلى سياسات أوضح حول من يمكنه ربطها، وما الأفعال المسموحة، وكيف تحدد نطاقات بيانات الاعتماد، وكيف تدقق الأنشطة.

تعكس Salesforce Agentforce وServiceNow AI Control Tower وMicrosoft Copilot Studio هذا الواقع المؤسسي. يعتمد تبني الوكلاء الآن على الرؤية والسياسات والأذونات والملكية التشغيلية، لا على جودة prompt فقط.

5. مساحة العمل غير المتزامنة متعددة الجلسات هي طبقة المستخدم المفقودة

سلسلة دردشة واحدة حاوية ضعيفة للعمل الطويل. غالبا ما يتفرع عمل الوكلاء الحقيقي: جلسة تبحث، وأخرى تصيغ، وأخرى تختبر، وأخرى تراجع، وأخرى تنتظر متابعة مجدولة. يحتاج المستخدمون إلى مكان تبقى فيه هذه المسارات والملفات والقرارات والآثار قابلة للفحص.

هنا يناسب MCPlato بشكل طبيعي. أفضل فهم لMCPlato هو أنه طبقة مساحة عمل AI: بيئة للمواد المحلية، والجلسات المتعددة، والعمل الخلفي أو المجدول، والآثار، والتنفيذ المرخص والقابل للملاحظة.56 لا ينبغي التعامل معه كبديل شامل لوكلاء البرمجة أو أبراج التحكم المؤسسية أو بنية المتصفح. دوره مختلف: مساعدة المستخدمين على تنظيم ومراقبة عمل AI الذي يمتد عبر الوثائق والبحث وسياق المتصفح ومخرجات المكتب والمتابعة غير المتزامنة.

بعبارة أخرى، ينتمي MCPlato إلى طبقة مساحة العمل في مجموعة الوكلاء: قريب من المستخدم، قريب من المواد، وفوق مكونات runtime والبنية التحتية الأدنى التي تجعل التنفيذ ممكنا.

إطار قرار عملي

مصفوفة قرار لاختيار منتجات الوكلاء حسب أفق الاستقلالية واحتياجات الحوكمةمصفوفة قرار لاختيار منتجات الوكلاء حسب أفق الاستقلالية واحتياجات الحوكمة

الشكل 2: يجب أن تستند اختيارات مجموعة الوكلاء إلى أفق الاستقلالية وضغط الحوكمة، لا إلى ترتيب عالمي واحد.

استخدم خمسة أسئلة قبل اختيار مجموعة وكلاء.

السؤالإذا كانت الإجابة “نعم”، فامنح الأولوية ل
هل سيعدل الوكيل الكود أو البيانات أو السجلات أو الأنظمة الخارجية؟Sandbox، الأذونات، سجلات التدقيق، بوابات المراجعة، مسارات rollback
هل ستستمر المهمة أكثر من prompt واحد أو جلسة واحدة؟حالة دائمة، نقاط تحقق، تنفيذ في الخلفية، استمرارية مساحة العمل
هل سيستخدم الوكيل المتصفحات أو ينفذ كودا؟بنية أتمتة المتصفح، sandboxes معزولة، حدود بيانات الاعتماد
هل ستعتمد فرق متعددة على المخرج؟قابلية الملاحظة، التقييمات، تتبع التكلفة، السياسة، الملكية
هل سيحتاج المستخدمون إلى الإشراف على مسارات عمل متوازية كثيرة؟مساحة عمل AI، تنسيق متعدد الجلسات، آثار، ملخصات، انضباط التسليم

يساعد تعيين بسيط:

  • مهمة برمجة قصيرة: ابدأ بوكيل أصيل للبرمجة مثل Claude Code أو Codex أو Cursor أو Jules أو Devin أو Replit Agent أو GitHub Copilot coding agent.
  • نموذج أولي لتطبيق: فكر في Lovable أو Bolt.new أو Replit Agent أو واجهات بناء مشابهة، ثم أضف مراجعة قبل الاستخدام الإنتاجي.
  • أتمتة workflow للأعمال: انظر إلى Copilot Studio وAgentforce وServiceNow وZapier Agents وLindy وGumloop وDust وHebbia حسب البيانات والحوكمة وملاءمة المجال.
  • منتج وكيل مخصص: اجمع مكونات runtime وبنية تحتية مثل LangGraph وLlamaIndex وCrewAI وOpenAI Agents SDK وVercel AI SDK وMCP وBrowserbase وE2B وTemporal وComposio وLangfuse وHelicone وLangSmith.
  • عمل معرفي عابر للمواد: استخدم نمط مساحة عمل AI، حيث يعد MCPlato مثالا ذا صلة، خصوصا عندما يمتد العمل عبر مواد محلية وبحث وآثار وجلسات متعددة وتنفيذ مرخص.

الخلاصة

ليست خريطة الوكلاء في النصف الأول من 2026 معركة بين “النماذج” و“المنتجات”. إنها ظهور مجموعة كاملة.

توفر النماذج طبقة الاستدلال. وتغلف منتجات الوكلاء الأعمال الشائعة. وتحافظ harnesses وruntimes على العمل ذا حالة. وتجعل بنية المتصفح وsandbox استخدام الأدوات أكثر أمانا. وتجعل قابلية الملاحظة والتقييمات التنفيذ قابلا للفحص. وتجعل الحوكمة الاستقلالية مقبولة في المؤسسات. وتمنح مساحات عمل AI المستخدمين مكانا لتنسيق العمل طويل الأمد.

لن يكون الفائزون ببساطة الفرق ذات أكبر رقم benchmark للنموذج. بل الفرق القادرة على تحويل ذكاء النموذج إلى workflows موثوقة وقابلة للمراجعة ومقيدة بالأذونات.

المراجع

Footnotes

  1. Anthropic, “Introducing Claude 4,” https://www.anthropic.com/news/claude-4 2 3

  2. Anthropic, “Claude Sonnet 4.5,” https://www.anthropic.com/news/claude-sonnet-4-5

  3. Anthropic, “Claude Opus 4.8,” https://www.anthropic.com/news/claude-opus-4-8

  4. Google, “Gemini 2.5 Pro coding performance,” https://developers.googleblog.com/en/gemini-2-5-pro-io-improved-coding-performance/ 2

  5. DeepSeek, “DeepSeek-R1 release,” https://api-docs.deepseek.com/news/news250120

  6. DeepSeek, “DeepSeek-V3.1 release,” https://api-docs.deepseek.com/news/news250821 2

  7. Qwen, “Qwen3-Coder,” https://qwenlm.github.io/blog/qwen3-coder/ 2

  8. Mistral AI, “Magistral,” https://mistral.ai/news/magistral

  9. Anthropic, “Claude Code overview,” https://code.claude.com/docs/en/overview

  10. OpenAI Codex developer documentation, https://developers.openai.com/codex

  11. GitHub, “GitHub Copilot coding agent in public preview,” https://github.blog/changelog/2025-05-19-github-copilot-coding-agent-in-public-preview/

  12. Cursor changelog, https://cursor.com/changelog

  13. Cognition, “Devin 2,” https://cognition.ai/blog/devin-2

  14. Google, “Jules now available,” https://blog.google/innovation-and-ai/models-and-research/google-labs/jules-now-available/

  15. Replit, “Introducing Agent 3,” https://replit.com/blog/introducing-agent-3-our-most-autonomous-agent-yet

  16. Lovable, https://lovable.dev/

  17. Bolt.new, https://bolt.new/

  18. Manus, https://manus.im/

  19. Perplexity, “Getting started with Labs,” https://www.perplexity.ai/hub/getting-started

  20. OpenAI developer documentation, “Computer use,” https://developers.openai.com/api/docs/guides/tools-computer-use

  21. OpenAI developer documentation, “Agents,” https://developers.openai.com/api/docs/guides/agents

  22. Salesforce, “Salesforce launches Agentforce 3,” https://www.salesforce.com/ap/news/press-releases/2025/06/24/salesforce-launches-agentforce-3-to-solve-the-biggest-blockers-to-scaling-ai-agents-visibility-and-control/

  23. ServiceNow, “AI Control Tower,” https://www.servicenow.com/products/ai-control-tower.html

  24. Microsoft Copilot Studio release plan, https://learn.microsoft.com/en-us/power-platform/release-plan/2025wave2/microsoft-copilot-studio/

  25. Microsoft, “6 core capabilities to scale agent adoption in 2026,” https://www.microsoft.com/en-us/microsoft-copilot/blog/copilot-studio/6-core-capabilities-to-scale-agent-adoption-in-2026/

  26. Zapier, “AI agents survey,” https://zapier.com/blog/ai-agents-survey/

  27. Lindy Agents, https://www.lindy.ai/agents

  28. Gumloop, https://www.gumloop.com/

  29. Dust documentation, “Welcome to Dust,” https://docs.dust.tt/docs/welcome-to-dust

  30. Hebbia product, https://www.hebbia.com/product

  31. LangChain, “LangChain and LangGraph 1.0,” https://www.langchain.com/blog/langchain-langgraph-1dot0

  32. LangSmith platform, https://www.langchain.com/langsmith-platform 2

  33. LlamaIndex, “Introducing LlamaIndex 0.11,” https://www.llamaindex.ai/blog/introducing-llamaindex-0-11

  34. Microsoft Research, AutoGen, https://www.microsoft.com/en-us/research/project/autogen/

  35. CrewAI, “CrewAI OSS 1.0,” https://blog.crewai.com/crewai-oss-1-0-we-are-going-ga/

  36. OpenAI Agents SDK, https://openai.github.io/openai-agents-python/

  37. Vercel AI SDK documentation, https://ai-sdk.dev/docs/introduction

  38. Vercel, “Agentic infrastructure,” https://vercel.com/blog/agentic-infrastructure

  39. Mastra, https://mastra.ai/

  40. PydanticAI documentation, https://pydantic.dev/docs/ai/

  41. Agno documentation, https://docs.agno.com/introduction

  42. Letta, “Letta v1 agent,” https://www.letta.com/blog/letta-v1-agent

  43. Browserbase for AI, https://www.browserbase.com/industry/ai 2

  44. Browserbase Stagehand, https://www.browserbase.com/stagehand 2

  45. Microsoft Playwright MCP, https://github.com/microsoft/playwright-mcp 2

  46. E2B Enterprise, https://e2b.dev/enterprise 2

  47. Daytona sandboxes, https://www.daytona.io/docs/en/sandboxes/ 2

  48. Temporal AI solutions, https://temporal.io/solutions/ai

  49. Arcade, https://www.arcade.dev/

  50. Composio, https://composio.dev/

  51. Langfuse documentation, https://langfuse.com/docs

  52. Helicone, https://www.helicone.ai/

  53. Temporal, Agentic AI, https://temporal.io/ai/agentic-ai

  54. Anthropic, “Model Context Protocol,” https://www.anthropic.com/news/model-context-protocol

  55. Model Context Protocol, “2026 MCP Roadmap,” https://blog.modelcontextprotocol.io/posts/2026-mcp-roadmap/

  56. MCPlato, https://mcplato.com/en/