به نقل از مهتاب من
سم آلتمن Sam Altman مدیرعامل اوپن ای آی، با یک شوخی مختصر درمورد GPT-6 مجدد موجی از گمانه زنی درمورد نسل بعدی مدلهای ChatGPT تشکیل کرد. او در جریان بحثی درمورد رفتارهای شگفت Codex به آموزش GPT-6 با گابلین های زیاد تر اشاره کرد، اما هیچ زمان اراعه، مشخصات فنی یا تایید رسمی برای مدل بعدی اراعه نداد.
به نقل از رسانه اخبار فناوری تکنا، عرصه این شوخی به ماجرای عجیبی برمی گردد که در روزهای تازه حوالی Codex شکل گرفت. کاربران فهمید شدند ابزار برنامه نویسی اوپن ای آی بعضی اوقات در پاسخهای فنی و کدنویسی، بی علت به گابلین ها و موجودات خیالی اشاره می کند. شرکت بعدا برای افت این حرکت، دستورهای محدود کننده ای به prompt گسترش دهنده اضافه کرد.
اوپن ای آی در توضیح رسمی خود خبرداد ریشه این حرکت از GPT-5.1 اغاز شده و با نسلهای بعدی شدت گرفته است. مطابق این توضیح، یک سیگنال پاداش مربوط به شخصیت Nerdy به طور ناخواسته خروجیهایی را که از استعاره های موجودات خیالی منفعت گیری می کردند مطلوب تر برسی کرده و همین الگو در مدلها گسترش یافته است.
اعداد انتشار شده نشان می دهند این قضیه فقط یک شوخی اینترنتی نبوده است. بعد از اراعه GPT-5.1، منفعت گیری از واژه گابلین در پاسخهای ChatGPT نزدیک به ۱۷۵ درصد و منفعت گیری از گرملین ۵۲ درصد افزایش یافت. در عین حال، شخصیت Nerdy فقط ۲.۵ درصد پاسخهای ChatGPT را راه اندازی می داد، اما ۶۶.۷ درصد اشاره ها به گابلین از همان مسیر آمده می بود.
تحلیل داخلی اوپن ای آی نشان داد پاداشهای مرتبط با Nerdy در ۷۶.۲ درصد مجموعه داده های بازدید شده، خروجیهای دارای واژه های گابلین یا گرملین را بالاتر از خروجیهای شبیه بدون این واژه ها امتیاز داده اند. این یعنی آموزش تقویتی می تواند یک عادت زبانی کوچک را از یک حالت شخصیتی به بخشهای دیگر حرکت مدل منتقل کند.
مشکل در GPT-5.5 نیز باقی ماند، چون آموزش این مدل پیش از شناسایی کامل علت اغاز شده می بود. اوپن ای آی می گوید شخصیت Nerdy را در مارس بازنشسته کرده، سیگنال پاداش مرتبط را حذف کرده و داده های آموزشی دارای واژه های موجودات خیالی را پالایش کرده است. با این حال، Codex برای مهار حرکت ناخواسته به دستورهای اضافی نیاز اشکار کرد.
اشاره آلتمن به GPT-6 را باید در همین بستر خواند. این جمله زیاد تر یک شوخی عمومی درمورد حرکت شگفت مدلها می بود تا معارفه رسمی محصول، اما چون مستقیما نام GPT-6 را داخل او گفت و گو کرد، به گفتن نشانه ای از گسترش نسل بعدی تعبیر شد. خود آلتمن توضیحی درمورد قابلیت، معماری یا زمان اراعه این مدل نداده است.
انتظارهای جاری درمورد GPT-6 زیاد تر حول حافظه بهتر، تعامل مدام تر، حرکت پایدارتر و ادغام عمیق تر با فایلها، اپلیکیشنها و ابزارهای کاری شکل گرفته است. مسیر جاری ChatGPT نیز به همین سمت حرکت می کند؛ یعنی کاربر به جای باز کردن یک ابزار جداگانه برای هر ماموریت، با دستیار ماندگارتری روبه رو می شود که عرصه کاری او را بهتر نگه داری می کند.
اراعه GPT-5.5 هم نشان می دهد اوپن ای آی به مدلهای عامل محور و مناسب کار حرفه ای سختی بیشتری داخل کرده است. این مدل برای کاربران Plus، Pro، Business و Enterprise در ChatGPT و Codex اراعه شده و در Codex با پنجره عرصه ۴۰۰ هزار توکنی در دسترس قرار گرفته است. نسخه API نیز با شرایط حفاظتی جداگانه برنامه ریزی شده است.
اهمیت واقعی ماجرای گابلین ها در این است که نشان می دهد حرکت مدلهای بزرگ فقط با توان خام سنجیده نمی شود. یک سیگنال پاداش کوچک می تواند در طول آموزش به عادت رفتاری گسترده تبدیل شود. به این علت GPT-6 اگر در راه باشد، فقط باید پرقدرت نباشد؛ باید قابل کنترل تر، قابل پیش بینی تر و شفاف تر هم باشد.
دسته بندی مطالب
اخبار کسب وکارها





