أعلنت OpenAI عن إطلاق عائلة جديدة من الموديلات المسماة GPT-4.1، التي تشمل موديلات GPT-4.1 وGPT-4.1 mini وGPT-4.1 nano، والتي تم تصميمها خصيصًا لتفوق في مهام البرمجة واتباع التعليمات. تتميز هذه الموديلات بقدرتها على معالجة ما يصل إلى مليون رمز في جلسة إدخال واحدة، ما يعادل تقريبًا 750,000 كلمة. هذا التقدم يعكس قدرة نماذج الذكاء الاصطناعي على التعامل مع مهام هندسية معقدة مثل البرمجة، وهو خطوة هامة نحو تحقيق هدف OpenAI في بناء "مهندس برمجيات ذكي" قادر على تنفيذ التطبيقات بالكامل، بما في ذلك اختبار الأخطاء وكتابة الوثائق.
في الوقت الذي يتسابق فيه منافسو OpenAI مثل Google وAnthropic لتطوير نماذج قادرة على البرمجة، تبرز GPT-4.1 بفضل التحسينات الملحوظة التي تركز على أداء البرمجة الواقعية بناءً على ملاحظات المطورين. وفقًا لـ OpenAI، تمت تحسين هذه النماذج لتقديم أداء أكثر دقة في استخدام الأدوات، والتحقق من أنماط الاستجابة، والالتزام بالبنية المطلوبة. هذه التحسينات توفر للمطورين أدوات أفضل لإنشاء وكلاء يمكنهم أداء مهام البرمجة بفعالية أكبر.
تكلفة استخدام GPT-4.1 هي 2 دولار لكل مليون رمز مدخل و8 دولارات لكل مليون رمز مخرجات، بينما توفر النماذج الأصغر مثل GPT-4.1 nano سرعات أعلى بتكلفة منخفضة، ما يجعلها الخيار الأمثل للمهام التي تتطلب كفاءة وسرعة. رغم الأداء الجيد الذي أظهرته GPT-4.1 على المعايير المختلفة مثل SWE-bench، إلا أن النماذج لا تزال تواجه تحديات في معالجة بعض القضايا مثل الثغرات الأمنية في الكود، مما يتطلب المزيد من التحسينات من المطورين.
على الرغم من التحسينات الكبيرة التي تقدمها GPT-4.1 في مجال البرمجة، اعترفت OpenAI بأن هذه النماذج تصبح أقل دقة عندما تتعامل مع عدد كبير من الرموز. ففي اختبارات الشركة الداخلية، انخفضت الدقة بشكل ملحوظ مع زيادة عدد الرموز المدخلة، ما يشير إلى الحاجة لتحسين دقة النموذج في معالجة كميات كبيرة من البيانات.