نگاهی به جدیدترین مدل هوش مصنوعی «اوپنایآی»
جدیدترین مدل هوش مصنوعی شرکت «اوپنایآی» قرار است هوشمندترین راه را برای انجام دادن کارها با رایانه به نمایش بگذارد.
به گزارش چابک آنلاین، شرکت «اوپنایآی»(OpenAI) به تازگی جدیدترین مدل هوش مصنوعی خود موسوم به «GPT-5.5» را منتشر کرد که آن را هوشمندترین و شهودیترین مدل برای استفاده تا به امروز مینامد. این مدل هوش مصنوعی با قابلیتهای بیشتری در زمینههای گوناگون ارائه شده و «گرگ بروکمن»(Greg Brockman) یکی از بنیانگذاران و رئیس اوپنایآی ادعا کرده است که این الگوریتم، شرکت را یک گام به ایجاد ابربرنامه اوپنایآی نزدیکتر میکند.
بروکمن گفت: این مدل یک گام واقعی به سمت آن نوع محاسباتی است که در آینده انتظار داریم، اما این فقط یک گام است و ما انتظار داریم در آینده شاهد گامهای بیشتری باشیم. این مدل در مقایسه با مدلهایی مانند 5.4 با توکنهای کمتر، سریعتر و دقیقتر عمل میکند. بنابراین، این بدان معناست که هوش مصنوعی پیشرفتهتری برای کسبوکارها و مصرفکنندگان در دسترس خواهد بود که بخشی از هدف ماست.
اوپنایآی نوشت: ما GPT‑5.5 را منتشر میکنیم که هوشمندترین و شهودیترین مدل ما برای استفاده تا به امروز است و گام بعدی به سوی روشی جدید برای انجام دادن کار با رایانه به شمار میرود.
مدل GPT‑5.5 سریعتر متوجه میشود که شما چه کاری میخواهید انجام دهید و میتواند بخش بیشتری از کار را خودش انجام دهد. این سیستم در نوشتن و اشکالزدایی کد، پژوهش آنلاین، تحلیل دادهها، ایجاد اسناد و صفحات گسترده، کار با نرمافزار و جابهجایی بین ابزارها تا زمان به پایان رسیدن یک کار، عالی عمل میکند. به جای مدیریت دقیق هر مرحله میتوانید به GPT‑5.5 یک کار چندبخشی و شلوغ بدهید و به آن اعتماد کنید تا برنامهریزی کند، از ابزارها استفاده کند، کارش را بررسی کند، از ابهامات عبور کند و به کار خود ادامه دهد.
این دستاوردها بهویژه در کدنویسی عاملی، استفاده از رایانه، کارهای دانشمحور و تحقیقات علمی اولیه قوی هستند؛ یعنی حوزههایی که پیشرفت در آنها به استدلال در محتوا و اقدام به مرور زمان بستگی دارد. مدل GPT-5.5 این گام را در هوش بدون کاهش سرعت ارائه میدهد. مدلهای بزرگتر و توانمندتر اغلب کندتر عمل میکنند، اما GPT-5.5 برای خدمترسانی در دنیای واقعی، با تأخیر GPT-5.4 به ازای هر توکن مطابقت دارد، ولی در سطح بسیار بالاتری از هوش عمل میکند. همچنین، این مدل از توکنهای بسیار کمتری برای انجام دادن وظایف مدل کدنویسی «کدکس»(Codex) استفاده میکند که آن را کارآمدتر و همچنین توانمندتر میکند.
اوپنایآی نوشت: ما GPT‑5.5 را با قویترین مجموعه حفاظتی خود تا به امروز منتشر میکنیم که برای کاهش سوءاستفاده و در عین حال، حفظ دسترسی برای کارهای سودمند طراحی شده است. ما این مدل را در مجموعه کامل چارچوبهای ایمنی و آمادگی خود ارزیابی کردیم، با گروههای داخلی و خارجی همکاری کردیم، آزمایشهای هدفمندی را برای قابلیتهای پیشرفته امنیت سایبری و زیستشناسی اضافه کردیم و پیش از انتشار، از نزدیک به ۲۰۰ شریک مورد اعتماد دسترسی زودهنگام، بازخوردهایی را درباره موارد استفاده واقعی جمعآوری کردیم.
مدل GPT‑5.5 برای کاربران نسخههای Plus، Pro، Business و Enterprise چتبات «چتجیپیتی»(ChatGPT) و کدکس و مدل GPT‑5.5 Pro برای کاربران نسخههای Pro، Business و Enterprise در چتجیپیتی در دسترس قرار میگیرد.
اوپنایآی اضافه کرد: استقرار API به اقدامات حفاظتی متفاوتی نیاز دارد و ما در حال همکاری نزدیک با شرکا و مشتریان درباره الزامات ایمنی و امنیتی برای ارائه آن در مقیاس بزرگ هستیم. ما خیلی زود GPT‑5.5 و GPT‑5.5 Pro را به API اضافه خواهیم کرد.
قابلیتهای مدل GPT‑5.5
اوپنایآی در حال ساخت زیرساخت جهانی برای هوش مصنوعی عاملمحور است و این امکان را برای افراد و مشاغل در سراسر جهان فراهم میکند تا با هوش مصنوعی کار کنند. در طول سال گذشته شاهد بودیم که هوش مصنوعی به طور چشمگیری مهندسی نرمافزار را تسریع کرد. با GPT‑5.5 در کدکس و چتجیپیتی، همین تحول در حال گسترش یافتن به تحقیقات علمی و کارهای گستردهتری است که مردم با رایانه انجام میدهند.
در این حوزهها GPT‑5.5 نه تنها هوشمندتر است، بلکه در نحوه حل مسائل نیز کارآمدتر عمل میکند و اغلب با توکنهای کمتر و تلاشهای مجدد کمتر، به خروجیهای باکیفیتتری میرسد. این مدل در شاخص کدگذاری «Artificial Analysis» با نصف هزینه مدلهای کدگذاری رقابتی، هوش پیشرفتهای را ارائه میدهد.
کدگذاری عاملی
اوپنایآی نوشت: مدل GPT‑5.5 قویترین مدل کدنویسی عاملگرای ما تا به امروز است. در «Terminal-Bench 2.0» که گردشهای کاری پیچیده خط فرمان را که به برنامهریزی، تکرار و هماهنگی ابزار نیاز دارند آزمایش میکند، به دقت پیشرفته ۸۲.۷ درصد دست مییابد. در «SWE-Bench Pro» که حل مسئله «گیتهاب»(GitHub) را در دنیای واقعی ارزیابی میکند، به ۵۸.۶ درصد میرسد و وظایف بیشتری را در یک مرحله نسبت به مدلهای پیشین از ابتدا تا انتها حل میکند. مدل GPT‑5.5 در «Expert-SWE» که ارزیابی مرزی داخلی ما برای وظایف کدنویسی بلندمدت با میانگین زمان تکمیل تخمینی ۲۰ ساعت برای انسان است نیز از GPT‑5.4 بهتر عمل میکند.
در هر سه ارزیابی، GPT‑5.5 با استفاده از توکنهای کمتر به امتیازهای بهتر از GPT‑5.4 میرسد.
نقاط قوت کدنویسی این مدل به ویژه در کدکس به وضوح نمایان میشوند که در آنها میتواند کارهای مهندسی را از پیادهسازی و اصلاح کدها گرفته تا اشکالزدایی، آزمایش و اعتبارسنجی انجام دهد. آزمایشهای اولیه نشان میدهند که GPT-5.5 در رفتارهایی که کار مهندسی واقعی به آنها وابسته است، مانند نگهداری محتوا در سیستمهای بزرگ، استدلال از طریق شکستهای مبهم، بررسی فرضیات با ابزارها و انتقال تغییرات از طریق پایگاه داده اطراف، بهتر عمل میکند.
«مارک چن»(Mark Chen)، مدیر ارشد تحقیقات در اوپنایآی گفت: GPT-5.5 در پیمایش کارهای رایانههای نسبت به مدلهای پیشین خود بهتر عمل میکند و دستاوردهای معناداری را در گردشهای کاری تحقیقات علمی و فنی نشان میدهد.
وی خاطرنشان کرد که این شرکت احساس میکند واقعاً میتواند به دانشمندان متخصص در پیشرفت کردن کمک کند. همچنین، چن گفت که این مدل میتواند به حوزه کشف دارو کمک کند که در چند سال گذشته علاقه صنعت به آن افزایش یافته است.