قابلیت های GPT-4 از زبان توسعه‌گر آن

قابلیت های GPT-4 از زبان توسعه‌گر آن

قابلیت‌ های GPT-4  را از زبان توسعه گر این ابزار بشنویم.

من خودم هم باور ندارم که امروز اینجا ایستاده ام. Open AI کار روی این تکنولوژی را تقریبا از زمان شروع به‌کار شرکت آغاز کرده بود، ولیکن دراین 2 سال اخیر روی اتمام پروژه GPT-4 بیشتر متمرکز شدیم. این پروژه را با بازسازی تمام  پشته‌های آموزشی ما شروع شد، مخصوصا بازسازی مدل‌های آموزشی شروع کردیم تا ببینیم چه قابلیت هایی دارد. سعی کریدم تا حالت های مختلف را بررسی کنیم و ببینیم که آیا این حالت یک قابلیت است یا خطر به حساب می‌آید. با کمک شرکا در دنیای واقعی روی این سناریوها کار کردیم تا بهینه سازی رفتار این مدل را براساس شرایط دنیای واقعی تنظیم کنیم، تا بتوانیم آن را دردسترس همگان قرار دهیم تا از آن به صورت عمومی استفاده شود.

امروز هم میخواهیم به شما نشان دهیم که چگونه میتوانید از GPT-4 استفاده کنید، طوریکه بتوانید به خوبی از تمام قابلیت های آن بهره مند شوید. میخواهیم به شما یاد دهیم که چگونه بهترین استفاده را از این ابزار داشته باشید.

درست است که GPT-4 در قسمت‌هایی که در حال کار روی آن ها هستیم ضعف‌هایی دارد، ولی این کاملا به خود شما بستگی دارد که چگونه از آن به عنوان یک ابزار یا شریک خوب استفاده کنید.

اولین چیزی که میخواهم به شما نشان دهم، اولین تسکی است که GPT-4 قادر به انجام دادن آن است، یعنی نسخه 3.5 نمی توانست این تسک را انجام دهد. شاید فکر کنید که تمام این قابلیت ها از طریق آموزش به وجود آمده، که شما به طور مداوم در حال انجام دادن کاری هستید، ساعت 2 صبح است، آلارم پیجر را خاموش می‌کنید، مدل را اصلاح می‌کنید و همیشه کنجکاو هستید که آیا مدل درست کار خواهد کرد یا نه، آیا جواب تمام این تلاش ها را می‌گیرم. خب همه ما کارهای مورد علاقه خودمان را داریم که واقعا دوستشان داریم و همه ما هم درتلاش بودیم تا ببینیم که آیا مدل ما هم واقعا قادر به انجام دادن این کارهاست یا نه.

اکنون اولین تسکی که درآن موفق عمل کردیم را به شما معرفی می‌کنم، که نسخه 3.5 هیچ وقت قادر به انجام دادن آن نیست.

قسمتی از متن وبلاگ را کپی می کنم و داخل زمین بازی (playground) پیست می‌کنم. این قسمت زمین بازی جدید (chat completion playground) GPT-4 است.

قابلیت های GPT-4

از قسمت system message به مدل کاری که باید انجام دهد را توضیح می‌دهیم. اینجا ما از مدل می‌خواهیم که کاری را که از آن درخواست می‌کنیم انجام دهد، اینگونه مدل هدایت پذیری بیشتری دارد. این مدل قادر به انجام دادن هر دستورعملی که از سمت شما به او داده می‌شود است.

شما به عنوان کاربر، متن خود را داخل باکس مربوطه جایگذاری می‌کنید و مدل به عنوان دستیار یک پیام نمایش می‌دهد. به نوعی می‌خواهیم به‌جای فضایی که صرفا نوشتاری است  و خشک به نظر می‌رسد یک فضای تعاملی ایجاد کنیم. چون فقط با نوشتن متوجه نخواهیم شد که الان کجای بحث هستیم. بنابراین برای بدست آوردن یک فرم ساختاریافته تر که به مدل فرصت این را می‌دهد که بفهمد این کاربر است که از من درخواست انجام کاری را دارد که توسعه‌گر (دولوپر) در آن شرکت نکرده، پس اینجا من باید به حرف توسعه‌گر گوش کنم.

همه ما با خلاصه نویسی آشنا هستیم. پس ازاینکه متن را داخل باکس پیست کردیم، برای اینکه جواب بهتری بگیریم، از مدل می‌خواهیم که تمام کلماتی که با حرف G شروع شده اند را برای ما جمع کند. GPT-3.5 با این فرمان هیچ عکس‌العملی نشان نمی‌دهد.  مخصوصا اگر این متن کمی پیچیده تر باشد دربیشتر مواقع نسخه 3.5 کار نمی‌کند.

GPT-3.5

 

قابلیت های GPT-4
پیدا کردن کلماتی که در داخل متن با حرف G شروع شده اند
  • درقسمت system هم از مدل درخواست می‌کنیم که از دستورات کاربر پیروی کند.

حالا از مدل میخواهیم تا محتوای متنی دو مقاله مختلف را باهم ادغام کند.

بدین‌منظور یک متن متفاوت از قبلی را کپی میکنیم و در ادامه همان متن قبلی داخل باکس چت پیست می‌کنیم. از مدل درخواست می‌کنیم تا بین هردو متن یک موضوع مشترک پیدا کند.

پیدا کردن مفهوم مشترک بین دو متن که از جاهای مختلف کپی شده اند

اگر جوابی که gpt-4 داده کافی نبود، میتوانیم ایم موضوع را مطرح کنیم و از مدل جواب کامل‌تری درخواست کنیم.

 حتی فقط میتوانید بگویید که جواب کامل نبود و توضیح اضافه ای دراین باره ندهید.

جوابی که دریافت کردیم کافی و کامل نبود

این مدل قادر به تشخیص زبان‌های مختلف و ترکیب آنهاست. مثلا از مدل میتوانیم درخواست کنیم که پست وبلاگ GPT-4  را به یک قطعه شعر تبدیل کند.

از متن وبلاگ GPT-4 یک شعر با قافیه و ریتمیک بساز

از تمام ارزیابی‌های انجام شده توسط ارزیابی‌های منبع باز Open AI برای کمک به هدایت پاسخ‌ها استفاده می‌شود. به هرحال اگر بااین مدل در تعامل هستید، لطفا ارزیابی های خودتان را با ما درمیان بگذارید، ما یک چارچوب ارزیابی متن باز داریم که به ما کمک می‌کند تا مدل را بهتر هدایت کنیم و تمام کاربران بااستفاده از این ارزیابی ها می توانند از قابلیت های مدل آگاه شوند و در بهبود آن به ما کمک کنند.

اینجا ما بااستفاده از GPT-4 با اندکی چاشنی خلاقیت، محتوای موجود را مصرف می‌کنیم.

قابلیت دیگری که قصد داریم به شما نشان دهیم، این است که چگونه می‌توانید بااستفاده از GPT-4 چیزی را بسازید. چگونه با شراکت و همراهی GPT-4 چیزی را خلق کنیم؟

دراین مثال میخواهیم با کمک GPT-4 یک ربات دیسکورد بسازیم.  ابتدا در قسمت Assistant message به مدل دستورت لازم را میدهیم، اینکه تو اکنون یک دستیار برنامه نویسی هستی، این محدودیت ها را باید رعایت کنی و …

توضیح به دستیار برای فعال شدن حالت دولوپر

این کار باعث می‌شود تا مدل مساله را به قطعات کوچکتر تقسیم بندی کند و اینگونه مجبور نیستید تا چندبار دیگر درخواست تان را برای مدل دوباره و دوباره به شکل های دیگر توضیح دهید. علاوه براین این کار باعث می‌شود تا تعامل بیشتری با مدل داشته باشید، چراکه متوجه می‌شویدکه مدل از چه دیدگاهی به درخواست شما نگاه می‌کندو درصورت بروز مشکل به راحتی میتوانید هرکجا که باعث به وجود امدن چنین مشکلی شده را اصلاح کنید.

مشکلی که اینجا با آن روبه رو هستیم این است که بخش از مدل در سال 2021 توسعه داده شده و فرمت chat completions را هنوز درآن زمان توسعه نداده بودیم. برای همین یک توضیح کوچک درباره اینکه چگونه می توان تصویر را وارد متن کرد هم به مدل می‌دهیم.

این مدل در یادگیری محتوا و مطالب جدید بهتر از مدل های قبلی عمل می‌کند.

پس اینکه کد برای شما تولید شد، هیچ وقت بدون بررسی درستی از آن استفاده نکنید، هیچ وقت کدهایی که توسط انسانها یا هوش مصنوعی تولید شده اند را بدون تست اجرا نکنید.

کد تولیدشده توسط GPT-4 به درخواست کاربر برای گرفتن ورودی به شکل تصویر از دیسکورد

نکته قابل توجه این است که API دیسکورد زود به زود عوض می‌شود، و یکی از چیزهایی است که در زمان توسعه این مدل باز هم تغییر کرده است. باتوجه به اینکه داده‌های این مدل از سال 2021 توسعه یافته است، احتمال اینکه چیزهایی که مربوط به قبل از آن باشد از سمت مدل شناسایی نشود زیاد است.

اگر خطایی در قطعه کد نوشته شده توسط مدل رخ داد، بدون هیچ حرف اضافه ای ، متن کامل خطا را داخل مدل کپی پیست کنید.

درخواست از GPT-4 برای تحلیل تصویر ارائه شده توسط کاربر در دیسکورد بااستفاده از قطعه کد تولید شده توسط خود GPT-4

GPT-4 تنها یک مدل متنی نیست، بلکه یک مدل بصری هم هست.  پس ورودی‌هایی متشکل از تصاویر و متون پراکنده را می تواند به عنوان ورودی بگیرد. البته ورودی تصویر هنوز در دسترس عموم قرار نگرفته.   اما میتوانیم از GPT-4 درخواست کنیم تا جزئیات یک تصویر را داخل یک متن برای ما توصیف کند.

GPT-4 جزئیات داخل تصویر دیسکورد را به کاربر برگردانده

چیزی که باید بیشتر به آن بپردازیم سرعت سیستم است.

اگر بازهم به مشکلی برخورد کردید، می‌توانید از Documentation پلتفرم موردنظرتان استفاده کنید و موارد مورد نیاز را داخل باکس چت مدل کپی پیست کنید و منتظر جواب بهینه سازی شده باشید. به مدل توضیح دهید که این پیام خطا را دریافت کردید، چرا این خطا برای من نمایش داده می‌شود، چگونه میتوانم آن را حل کنم؟!

طول عبارات متنی دراین نسخه از مدل تا 32000 توکن افزایش یافته، پس درصورتیکه متن بلندبالایی برای مدل آماده کرده اید نگران محدودیت تعداد کلمات نباشید. البته هنوز هم درحال بهبود این قابلیت مدل هستیم.

پس ازاینکه درخواست خودتان را با مدل مطرح کردید، و پاسخ مدل را دریافت کردید، هم خودتان به صورتدستی می‌توانید قطعه کد را دیباگ کنید، یا می‌توانید از مدل درخواست کنید تا باتوجه به شرایط جدید قطعه کدی را برای شما تولید کند.

اسکچ یک صفحه سایت که به عنوان ورودی به GPT-4 داده شده است تا از آن یک خروجی با فرمت HTML بدهد

 می‌توانیم از مدل بخواهیم تا از تصویر یک خروجی HTML بگیرد. یک تصویر از ماکت از طرح دلخواهتان به مدل بدهید و سپس فرمت HTML آن را دریافت کنید. یعنی یک تصویر از دست خط تان به برنامه بدهید و یک وب سایت به شکل تصیور مدنظرتان دریافت کنید.

خروجی HTML تولید شده توسط GPT-4

این یکی از کاربردهای gpt-4 بود و این به خود شما بستگی دارد که از این ویژگی در چه زمینه‌هایی استفاده کنید.

آخرین چیزی که میخواهیم به شما معرفی کنیم.

تااینجا نشان دادیم که GPT-4 چگونه یک محتوای متنی را می‌تواند بخواند، نشان دادیم که چگونه مثل یک همکار و دستیار می‌تواند در ساختن یک برنامه یا اپلیکیشن به شما کمک کند، آخرین چیزی که میخواهیم معرفی کنیم این است، چگونه از این سیستم برای کامل کردن یک تسک هایی دوست نداریم انجام دهیم، ولیکن مجبوریم آنها را به پایان برسانیم، استفاده کنیم. یکی از این کارها پرداخت مالیات است! اینجا تاکید میکنیم که GPT-4 حسابدار حرفه ای نیست و حتما چنین مواردی را با حسابدار خودتان درمیان بگذارید. اما در برای درک مفاهیم پایه و داشتن یک سری اطلاعات که به کمک آنها بتوانید گلیم خودتان را آب بیرون بکشید، از GPT-4 می‌توانید کمک بگیرید.

توضیحات و محاسبات ارائه شده توسط GPT-4 پس از مطالعه مستندات مالیات و پاسخ به سوال کاربر

اینکار چیزی نیست که GPT-4 مخصوصا برای اینکار آموزش دیده باشد. بدین‌منظور، قوانین مربوط به مالیات که حدودا 16 صفحه بود را به  مدل دادم، سپس سوال خودم را پرسیدم. من شخصا برای حل کردن یک مساله مربوط به مالیات نصف روز فقط وقت گذاشتم تا مستندات مربوط به مالیات را فقط بخوانم که چیزی متوجه نشدم! اما وقتی از مدل خواستم تا مساله را برای من حل کند، خودم هم از فرایند محاسبه آن توانستم سر در بیاورم و یاد گرفتم که نحوه محاصبه به چه صورت است.

سیستم کامل و بی نقص نیست، ما هم بی نقص نیستیم، پس درکنارهم میتوانیم با تکمیل کردن کارها و دانش یکدیگر به جاهای بهتری برسیم.

این مدل در محاسبات ذهنی هم عالی عمل می‌کند.

قابلیت هایی که دراین مقاله گفته شد به صورت خام بودند، یعنی یک مفهوم کلی از کاری بود که مدل قادر به انجام دادن آن بود. این مدل بسیار منعطف است  واین شما هستید که می توانید بااستفاده از قدرت خلاقیت تان از قابلیت های آن برای انجام کارهای دلخواهتان استفاده کنید.

 مهم نیست که بخواهید روی یک متن کاری اجام دهید، یا روی یک قطعه کد یا محاسبه مالیات. شما میتوانید از تمام این قابلیت ها برای کار روی مساله، اپلیکیشن یا هرچیز دیگری که مدنظر شماست استفاده کنید.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *