روز سه شنبه، OpenAI، خالق چت ربات ویروسی ChatGPT، از پیشرفته ترین مدل هوش مصنوعی خود با نام GPT-4 رونمایی کرد. اما علیرغم تمام توانایی هایش، هنوز یک ضعف عمده دارد: امتحانات زبان انگلیسی AP.
در مقایسه با GPT-3.5، که در حال حاضر نسخه پایه ChatGPT را تامین می کند، جدیدترین نسخه قدرت خلاقیت خود را افزایش داده است، قادر به تجزیه و تحلیل تصاویر است و می تواند بیش از 25000 کلمه را پردازش کند – که امکان ایجاد محتوای طولانی را فراهم می کند.
ChatGPT یک چت ربات مجهز به هوش مصنوعی است که قادر به مکالمه با صدای طبیعی است. با توجه به اعلانهای مناسب، میتواند پاسخهای دقیقی برای پرسشها، نوشتن غزل، نرمافزار کد و موارد دیگر ایجاد کند.
طبق یک بیانیه مطبوعاتی، ارتقاهای خلاقانه جدید GPT-4 آن را قادر می سازد تا در پروژه های مختلف نوشتاری «تولید، ویرایش و تکرار با کاربران» را انجام دهد. این شرکت گفت که این می تواند شامل آهنگسازی، نوشتن فیلمنامه یا تقلید از سبک نوشتن کاربر باشد.
در همین حال، قابلیتهای بصری آن به کاربران اجازه میدهد تصاویری را برای ربات وارد کنند و آن را زیرنویس و تحلیل کند. برای مثال، میتوانید یک الگوی رفتاری برای GPT-4 بفرستید و از آن بپرسید که چرا مردم تصویر را خندهدار میدانند – و احتمالاً پاسخ دقیقی خواهد داد.
در حال حاضر، GPT-4 فقط در ChatGPT Plus، مدل اشتراک پرداختی ماهانه 20 دلاری چت بات، قابل دسترسی است. این ارتقا همچنین به عنوان یک رابط برنامه نویسی برنامه (API) برای توسعه دهندگان منتشر خواهد شد تا برنامه های خود را از این فناوری بسازند.
یک سخنگوی OpenAI گفت قبل از انتشار هیچ کس برای اظهار نظر در دسترس نبود، اما ستاره را به بیانیه مطبوعاتی و مقاله تحقیقاتی شرکت هدایت کرد.
با توجه به مقاله تحقیقاتی GPT-4 OpenAI، مدل هوش مصنوعی بر روی مجموعهای از معیارها از جمله آزمونهای طراحی شده برای انسانها مانند آزمون SAT یا آزمون نوار آزمایش شد.
علیرغم اینکه GPT-4 هیچ آموزش خاصی از قبل دریافت نکرده بود، در اکثر این آزمایشات بسیار بهتر از سلف خود و بسیاری از انسان ها عمل کرد. حدود صدک 90 را برای نوار و مؤلفه های مختلف SAT کسب کرد و حتی در صدک 99 برای المپیاد زیست شناسی قرار گرفت.
با این حال، GPT-4 در ادبیات انگلیسی AP بسیار بدتر عمل کرد و در صدک 8 تا 22 قرار گرفت – تقریباً مشابه GPT-3. به طور مشابه در زبان انگلیسی AP ضعیف عمل کرد و در صدک 14 تا 44 فرود آمد.
نسخه جدید همچنین می تواند دستورالعمل های ظریف تری را نسبت به نسخه قبلی خود انجام دهد و پاسخ های قابل اعتماد تری ارائه می دهد. به عنوان مثال، GPT-4 40 درصد بیشتر از GPT-3 اطلاعات واقعی تولید می کند و 82 درصد کمتر به درخواست های محتوای ممنوعه پاسخ می دهد.
همانطور که گفته شد، محققان خاطرنشان کردند که GPT-4 هنوز بسیاری از مشکلات نسخه قبلی خود را دارد – هنوز هم در معرض سوگیری است، می تواند از “توهمات” منجر به اطلاعات غیر واقعی رنج ببرد، تنها یک پنجره محدود برای زمینه دارد و نمی تواند از تجربه یاد بگیرید
در مقاله تحقیقاتی OpenAI آمده است: “در هنگام استفاده از خروجی های GPT-4، به ویژه در زمینه هایی که قابلیت اطمینان مهم است، باید دقت شود.”
قابلیت های این مدل نیز آن را در برابر روش های جدید سوء استفاده آسیب پذیر می کند. برای مثال، میتوان از GPT-4 بپرسید که چگونه با استفاده از مواد اولیه و لوازم آشپزخانه خریداری شده در فروشگاه، یک بمب در خانه بسازیم. نسخههای قبلی GPT-4 دستورالعملهای دقیقی برای انجام این کار ارائه میدهند.
پس از مشورت با 50 کارشناس مختلف، OpenAI از آن زمان به ربات آموزش داده است تا چنین درخواست هایی را رد کند. اما این امکان وجود دارد که برخی از راههای استفاده نادرست از بین رفته باشند.
شاید OpenAI در انتشار خود به بهترین وجه گفته است: “GPT-4 و مدل های جانشین پتانسیل این را دارند که به طور قابل توجهی بر جامعه از هر دو جنبه مفید و مضر تأثیر بگذارند.”
به گفتگو بپیوندید