خالق ChatGPT GPT-4 را فاش کرد – هنوز نمی تواند AP انگلیسی را پاس کند

روز سه شنبه، OpenAI، خالق چت ربات ویروسی ChatGPT، از پیشرفته ترین مدل هوش مصنوعی خود با نام GPT-4 رونمایی کرد. اما علیرغم تمام توانایی هایش، هنوز یک ضعف عمده دارد: امتحانات زبان انگلیسی AP.

در مقایسه با GPT-3.5، که در حال حاضر نسخه پایه ChatGPT را تامین می کند، جدیدترین نسخه قدرت خلاقیت خود را افزایش داده است، قادر به تجزیه و تحلیل تصاویر است و می تواند بیش از 25000 کلمه را پردازش کند – که امکان ایجاد محتوای طولانی را فراهم می کند.

ChatGPT یک چت ربات مجهز به هوش مصنوعی است که قادر به مکالمه با صدای طبیعی است. با توجه به اعلان‌های مناسب، می‌تواند پاسخ‌های دقیقی برای پرسش‌ها، نوشتن غزل، نرم‌افزار کد و موارد دیگر ایجاد کند.

طبق یک بیانیه مطبوعاتی، ارتقاهای خلاقانه جدید GPT-4 آن را قادر می سازد تا در پروژه های مختلف نوشتاری «تولید، ویرایش و تکرار با کاربران» را انجام دهد. این شرکت گفت که این می تواند شامل آهنگسازی، نوشتن فیلمنامه یا تقلید از سبک نوشتن کاربر باشد.

در همین حال، قابلیت‌های بصری آن به کاربران اجازه می‌دهد تصاویری را برای ربات وارد کنند و آن را زیرنویس و تحلیل کند. برای مثال، می‌توانید یک الگوی رفتاری برای GPT-4 بفرستید و از آن بپرسید که چرا مردم تصویر را خنده‌دار می‌دانند – و احتمالاً پاسخ دقیقی خواهد داد.

در حال حاضر، GPT-4 فقط در ChatGPT Plus، مدل اشتراک پرداختی ماهانه 20 دلاری چت بات، قابل دسترسی است. این ارتقا همچنین به عنوان یک رابط برنامه نویسی برنامه (API) برای توسعه دهندگان منتشر خواهد شد تا برنامه های خود را از این فناوری بسازند.

یک سخنگوی OpenAI گفت قبل از انتشار هیچ کس برای اظهار نظر در دسترس نبود، اما ستاره را به بیانیه مطبوعاتی و مقاله تحقیقاتی شرکت هدایت کرد.

با توجه به مقاله تحقیقاتی GPT-4 OpenAI، مدل هوش مصنوعی بر روی مجموعه‌ای از معیارها از جمله آزمون‌های طراحی شده برای انسان‌ها مانند آزمون SAT یا آزمون نوار آزمایش شد.

علیرغم اینکه GPT-4 هیچ آموزش خاصی از قبل دریافت نکرده بود، در اکثر این آزمایشات بسیار بهتر از سلف خود و بسیاری از انسان ها عمل کرد. حدود صدک 90 را برای نوار و مؤلفه های مختلف SAT کسب کرد و حتی در صدک 99 برای المپیاد زیست شناسی قرار گرفت.

با این حال، GPT-4 در ادبیات انگلیسی AP بسیار بدتر عمل کرد و در صدک 8 تا 22 قرار گرفت – تقریباً مشابه GPT-3. به طور مشابه در زبان انگلیسی AP ضعیف عمل کرد و در صدک 14 تا 44 فرود آمد.

نسخه جدید همچنین می تواند دستورالعمل های ظریف تری را نسبت به نسخه قبلی خود انجام دهد و پاسخ های قابل اعتماد تری ارائه می دهد. به عنوان مثال، GPT-4 40 درصد بیشتر از GPT-3 اطلاعات واقعی تولید می کند و 82 درصد کمتر به درخواست های محتوای ممنوعه پاسخ می دهد.

همانطور که گفته شد، محققان خاطرنشان کردند که GPT-4 هنوز بسیاری از مشکلات نسخه قبلی خود را دارد – هنوز هم در معرض سوگیری است، می تواند از “توهمات” منجر به اطلاعات غیر واقعی رنج ببرد، تنها یک پنجره محدود برای زمینه دارد و نمی تواند از تجربه یاد بگیرید

در مقاله تحقیقاتی OpenAI آمده است: “در هنگام استفاده از خروجی های GPT-4، به ویژه در زمینه هایی که قابلیت اطمینان مهم است، باید دقت شود.”

قابلیت های این مدل نیز آن را در برابر روش های جدید سوء استفاده آسیب پذیر می کند. برای مثال، می‌توان از GPT-4 بپرسید که چگونه با استفاده از مواد اولیه و لوازم آشپزخانه خریداری شده در فروشگاه، یک بمب در خانه بسازیم. نسخه‌های قبلی GPT-4 دستورالعمل‌های دقیقی برای انجام این کار ارائه می‌دهند.

پس از مشورت با 50 کارشناس مختلف، OpenAI از آن زمان به ربات آموزش داده است تا چنین درخواست هایی را رد کند. اما این امکان وجود دارد که برخی از راه‌های استفاده نادرست از بین رفته باشند.

شاید OpenAI در انتشار خود به بهترین وجه گفته است: “GPT-4 و مدل های جانشین پتانسیل این را دارند که به طور قابل توجهی بر جامعه از هر دو جنبه مفید و مضر تأثیر بگذارند.”

به گفتگو بپیوندید

گفتگوها نظرات خوانندگان ما است و مشمول این است کد رفتار. ستاره این نظرات را تایید نمی کند.