نحوه فعالیت ChatGPT

بسمه تعالی
در پست قبل معرفی کوتاهی از ChatGPT و تاریخچه بوجود آمدن مدل GPT ارائه شد و قصد دارم در این پست اشاره کوتاهی به نحوه فعالیت ChatGPT کنم و به صورت خلاصه توضیح دهد که ChatGPT چگونه کار می کند.

قاعدتا خیلی فنی صحبت نمی‌کنم، البته که خود شرکت تولیدکننده ChatGPT (یعنی شرکت OpenAI) هم خیلی مستندات دقیقی درباره نحوه فعالیت اون ارائه نکرده.

بصورت کلی ساخت یک ابزار پردازش زبان شبیه ChatGPT شامل سه مرحله است :

+ مرحله اول ساخت ChatGPT این است که به ماشین آموزش داده شود که کلمه بعدی متن را حدس بزد. این کار را نسل های قبل از ChatGPT یعنی همان GPT نسخه های 1 و 2 و 3 براساس داده هایی که از اینترنت جمع آوری کرده بودند انجام می دهند. یعنی مثلا براساس متن میلیون ها کتاب، مقاله، منابع اینترنتی و …
نحوه کار هم به این ترتیب است که مثلا ماشین یاد می‌گیرد جمله «امروز هوای شیراز …» را با عبارت‌هایی شبیه «دلچسب» یا «سرد» یا «مناسب» پر کند و مثلا عبارت پرتی مثل «کارت سوخت» را استفاده نکند. این دقیقا همان قابلیتی است که باعث می شود مدل GPT بتواند جمله ای را کامل کند.

+ مرحله 2 از آماده سازی ChatGPT این است که ماشین باید یاد بگیرد متن چت ما را به عنوان یک جمله ورودی برای تکمیل کردن در نظر بگیرد.

خب پیش از این متوجه شدیم که مدل GPT می تواند براساس داده های بزرگی که قبلا پردازش کرده عبارت بعدی را پیش بینی کند. در این مرحله باید یاد بگیرد که جملات در ساختار چت را نیز به عنوان ورودی بپذیرد و شروع به تولید کلمات بعدی کند.

تصور کنید نحوه کار این گونه باشد که شرکت در طول زمان تعدادی اپراتور داشته که عبارات مختلف را به حالت چت به ماشین عرضه کردند و طبعا هم ماشین یاد گرفته است چگونه پاسخ دهد.(به نظر میرسد این فرایند یادگیری همچنان نیز در حال انجام است و ما کاربران به صورت رایگان در حال تکمیل مدل ChatGPT هستیم!)

به متنی که به عنوان ورودی به ChatGPT ارائه می‌شود Prompt گفته می شود. (بعدا درباره شغل Promp Engineering یک مقاله خواهم نوشت.)
عملا قرار است ماشین شروع به شناخت Prompt ها کند و مبتنی بر آن ها یکی یکی کلمات بعدی را حدس زده و در خروجی نمایش دهد.

+ مرحله 3 : تا اینجای کار مدل توانسته در ازای ورودی که کاربران ارائه کردند، پاسخ معنی داری بدهد. (این پاسخ معنی دار ممکن است این باشد که ChatGPT پاسخ دهد: بعنوان یک مدل هوش مصنوعی، امکان پیش بینی زلزله را ندارم)
اما مرحله سوم آماده سازی ChatGPT این است که شرکت OpenAI به کمک انسان پاسخ های مختلفی را که ChatGPT به یک سوال می داده را اولویت بندی کرده و به ماشین فهمانده اند که پاسخ هایش به ترتیب از خوب به بد چه ترتیبی دارند.

تمام!

شاید تعجب کنید که بگویم بله! ChatGPT یک مدل است که فقط می تواند لغت بعدی را حدس بزند.

به همین دلیل است که به راحتی می توان ChatGPT را در مکالمات و شرایط مختلف به اشتباه انداخت. البته که همین محصول شاهکار بزرگی است که منشا تغییرات بزرگی در دنیای تکنولوژی خواهد بود، اما احتمالا با الگوریتم های مختلف نحوه فعالیت آن روز به روز بهتر هم خواهد شد.

لازم به توضیح است که به دلیل ناکافی بودن منابع فارسی که مدل های زبانی جمع آوری کردند پاسخ های فارسی که ChatGPT به سوالات و چت های کاربران می دهد ممکن است خیلی کامل نباشد، اما احتمالا در گذر زمان ماشین فارسی را نیز مثل بقیه زبان ها بهتر و بیشتر یاد خواهد گرفت و پاسخ ها با کیفیت تر خواهند بود.

تصویر زیر مراحل تکمیل شدن ChatGPT را به صورت شماتیک تشریح کرده است :

نحوه آماده سازی Chatgpt

سعی کردم به ساده ترین حالت ممکن نحوه آماده سازی و پاسخگویی ChatGPT را معرفی کنم.

در پست های بعدی کاربردهای مختلف ChatGPT را در شرایط مختلف بررسی خواهیم کرد.

گاه‌نوشت های علیرضا کاربُر

درباره زندگی، استارتاپ ها، کسب‌وکارهای اینترنتی و اقتصاد دیجیتال

بصورت کلی ساخت یک ابزار پردازش زبان شبیه ChatGPT شامل سه مرحله است :

دیدگاهتان را بنویسید لغو پاسخ