مستقبل البرمجة المدعوم بالذكاء الاصطناعي أصبح قريبًا
أنا لست مبرمجًا ماهرًا بأي حال من الأحوال، ولكن بفضل برنامج مجاني يسمى SWE-agent، تمكنت من تصحيح وإصلاح مشكلة خطيرة تتضمن ملفًا تمت تسميته بشكل خاطئ ضمن مستودعات تعليمات برمجية مختلفة على موقع استضافة البرامج GitHub.
لقد وجهت وكيل SWE إلى مشكلة على GitHub وشاهدتها وهي تمر عبر الكود وفكرت في الخطأ الذي قد يكون خطأ. لقد حدد بشكل صحيح أن السبب الجذري للخلل هو سطر يشير إلى الموقع الخاطئ للملف، ثم انتقل عبر المشروع، وحدد موقع الملف، وعدّل التعليمات البرمجية بحيث يعمل كل شيء بشكل صحيح. إنه نوع الشيء الذي قد يقضيه مطور عديم الخبرة (مثلي) ساعات في محاولة تصحيح الأخطاء.
يستخدم العديد من المبرمجين بالفعل الذكاء الاصطناعي لكتابة البرامج بسرعة أكبر. كانت GitHub Copilot أول بيئة مطورة متكاملة تستخدم الذكاء الاصطناعي، ولكن الكثير من بيئات التطوير المتكاملة ستعمل الآن تلقائيًا على إكمال أجزاء من التعليمات البرمجية عندما يبدأ المطور في الكتابة. يمكنك أيضًا طرح أسئلة على الذكاء الاصطناعي حول التعليمات البرمجية أو مطالبته بتقديم اقتراحات حول كيفية تحسين ما تعمل عليه.
في الصيف الماضي، بدأ جون يانج وكارلوس جيمينيز، وهما طالبا دكتوراه في جامعة برينستون، بمناقشة ما يتطلبه الذكاء الاصطناعي ليصبح مهندس برمجيات في العالم الحقيقي. وقد قادهم هذا وآخرون في جامعة برينستون إلى التوصل إلى SWE-bench، وهي مجموعة من المعايير لاختبار أدوات الذكاء الاصطناعي عبر مجموعة من مهام البرمجة. بعد إطلاق المعيار في أكتوبر، قام الفريق بتطوير أداته الخاصة -SWE-agent – لإتقان هذه المهام.
يعد SWE-agent (“SWE” اختصارًا لـ “هندسة البرمجيات”) واحدًا من عدد من برامج ترميز الذكاء الاصطناعي الأكثر قوة والتي تتجاوز مجرد كتابة أسطر من التعليمات البرمجية وتعمل بمثابة ما يسمى بوكلاء البرمجيات، حيث تسخر الأدوات اللازمة للمجادلة وتصحيح الأخطاء وتنظيم البرامج. انتشرت شركة Devin الناشئة على نطاق واسع من خلال عرض فيديو توضيحي لإحدى هذه الأدوات في شهر مارس.
يقول أوفير بريس، وهو عضو في فريق برينستون، إن SWE-bench يمكن أن يساعد OpenAI في اختبار أداء وموثوقية وكلاء البرمجيات. يقول بريس: “إنه مجرد رأيي، لكنني أعتقد أنهم سيطلقون وكيل برمجيات قريبًا جدًا”.
رفضت شركة OpenAI التعليق، لكن مصدرًا آخر على دراية بأنشطة الشركة، والذي طلب عدم ذكر اسمه، أخبر WIRED أن “OpenAI تعمل بالتأكيد على وكلاء البرمجة”.
وكما أظهر GitHub Copilot أن نماذج اللغات الكبيرة يمكنها كتابة التعليمات البرمجية وتعزيز إنتاجية المبرمجين، فإن أدوات مثل SWE-agent قد تثبت أن وكلاء الذكاء الاصطناعي يمكنهم العمل بشكل موثوق، بدءًا من بناء التعليمات البرمجية والحفاظ عليها.
يقوم عدد من الشركات باختبار وكلاء لتطوير البرمجيات. في الجزء العلوي من لوحة المتصدرين SWE-bench، التي تقيس درجات وكلاء البرمجة المختلفين عبر مجموعة متنوعة من المهام، يوجد واحد من Factory AI، وهي شركة ناشئة، يليه AutoCodeRover، وهو مدخل مفتوح المصدر من فريق في جامعة سنغافورة الوطنية .
كما يخوض اللاعبون الكبار أيضًا. وتعد أداة كتابة البرامج التي تسمى Amazon Q من بين أفضل الأدوات أداءً على مقاعد SWE. يقول ديباك سينغ، نائب رئيس تطوير البرمجيات في Amazon Web Services: “إن تطوير البرمجيات هو أكثر بكثير من مجرد الكتابة”.
ويضيف أن AWS استخدمت الوكيل لترجمة مجموعات البرامج بأكملها من لغة برمجة إلى لغة أخرى. يقول سينغ: “يشبه الأمر وجود مهندس ذكي يجلس بجوارك، يكتب ويبني تطبيقًا معك”. “أعتقد أن هذا تحول كبير.”
ساعد فريق في OpenAI مؤخرًا طاقم برينستون على تحسين معيار لقياس موثوقية وفعالية أدوات مثل SWE-agent، مما يشير إلى أن الشركة قد تقوم أيضًا بشحذ الوكلاء لكتابة التعليمات البرمجية أو القيام بمهام أخرى على جهاز كمبيوتر.
يقول سينغ إن عددًا من العملاء يقومون بالفعل ببناء تطبيقات خلفية معقدة باستخدام Q. وتشير تجاربي الخاصة مع SWE-bench إلى أن أي شخص يقوم بالبرمجة سيرغب قريبًا في استخدام الوكلاء لتعزيز براعته في البرمجة، أو المخاطرة بالتخلف عن الركب.