chatGPT چیست؟

 

 

chatGPT یک چت‌بات هوشمند است که توسط شرکت OpenAI توسعه داده شده و در نوامبر سال ۲۰۲۲ معرفی شد. این نام از ترکیب دو کلمه Chat و GPT به وجود آمده است. Chat به معنای گفتگو و GPT مخفف Generative Pre-trained Transformer است که یک نوع مدل زبانی بزرگ (LLM) است. chatGPT یک مدل زبانی خاص وظیفه است که برای انجام گفتگو با کاربران آموزش دیده شده و از نسخه بهبود یافته‌ای از مدل GPT-3 که GPT-3.5 نام دارد، ساخته شده است.

 

مدل‌های زبانی بزرگ (LLM) چیستند؟

 

مدل‌های زبانی بزرگ (LLM) نوعی از مدل‌های هوش مصنوعی هستند که قادر به درک و تولید متن هستند. این مدل‌ها با استفاده از شبکه‌های عصبی عمیق و روش‌های یادگیری عمیق (DL) آموزش داده می‌شوند. این مدل‌ها با خواندن و تحلیل مقادیر زیادی از داده‌های متنی (مثلا کتاب‌ها، مقالات، صفحات وب، توئیت‌ها و غیره)، قواعد زبان را به صورت خودکار فرا می‌گیرند و سپس قادر به تولید متن جدید هستند. برخی از کاربردهای این مدل‌ها عبارتند از:

 

**پاسخ به سوالات**: این مدل‌ها با دریافت یک سوال به صورت متن، قادر به پیدا کردن پاسخ مناسب در داده‌های خود هستند. برای مثال، اگر سوال بپرسید «پایتخت فرانسه کجاست؟»، این مدل‌ها با جستجو در داده‌های خود، پاسخ «پاریس» را خروجی می‌دهند.

 

**خلاصه سازی متن**: این مدل‌ها با دریافت یک متن طولانی، قادر به تولید یک خلاصه کوتاه و مناسب از آن هستند. برای مثال، اگر یک مقاله درباره chatGPT را به عنوان ورودی بدهید، این مدل‌ها با خلاص کردن نکات اصلی آن، چند جمله به عنوان خروجی می‌دهند.

 

**ترجمه متن**: این مدل‌ها با دریافت یک متن به یک زبان، قادر به تولید معادل آن به زبان دیگر هستند. برای مثال، اگر یک متن فارسی را به عنوان ورودی بدهید، این مدل‌ها با استفاده از داده‌های ترجمه شده، معادل انگلیسی آن را خروجی می‌دهند.

 

**تولید محتوا**: این مدل‌ها با دریافت یک عبارت یا یک موضوع به عنوان ورودی، قادر به تولید متن جدید و منحصر به فرد هستند. برای مثال، اگر عبارت «chatGPT چیست؟» را به عنوان ورودی بدهید، این مدل‌ها با استفاده از دانش خود، چند پاراگراف توضیحات درباره chatGPT را خروجی می‌دهند.

 

 

 

chatGPT چگونه کار می‌کند؟

 

chatGPT یک نوع خاص از مدل‌های زبانی بزرگ (LLM) است که برای انجام گفتگو با کاربران آموزش دیده شده است. این مدل با استفاده از یک ساختار شبکه عصبی به نام Transformer کار می‌کند. Transformer یک نوع شبکه عصبی است که قادر به پردازش داده‌های دنباله‌ای (مثلا جملات) است. این شبکه با استفاده از دو بخش به نام Encoder و Decoder کار می‌کند. Encoder قادر است که یک دنباله ورودی را به یک نمایش برداری تبدیل کند که حاوی اطلاعات آن دنباله است. Decoder قادر است که با دریافت نمایش برداری و چند توکن (کلمات) اول دنباله خروجی، توکن بعدی را پیش‌بینی کند. با تکرار این فرآیند، Decoder قادر است که یک دنباله خروجی کامل تولید کند.

 

chatGPT از نسخه بهبود یافته‌ای از Transformer به نام GPT-3.5 استفاده می‌کند. GPT-3.5 یک نسل جدید از مدل‌های GPT است که در سال ۲۰۲۲ توسط OpenAI ساخته شده است. GPT-3.5 دارای حجم زیادتر و قابلیت های پیشرفته تر نسبت به GPT-3 است. GPT-3.5 با خواندن و تحلیل حجم عظیمی از داده‌های متنی (حدود ۱۰۰۰ بیلیون توکن)، قواعد زبان را فرا گرفته و قادر به تولید متن جدید در هر زمینه و سبک زبانی است.

 

chatGPT با استفاده از یک روش آموزش به نام Reinforcement Learning from Human Feedback (RLHF)، برای انجام گفتگو با کاربران آموزش دیده شده است. RLHF یک روش یادگیری تقویتی است که با استفاده از بازخورد انسانی به مدل کمک می‌کند تا رفتار خود را بهبود بخشد. در این روش، ابتدا یک مدل اولیه با استفاده از آموزش نظارت شده (supervised learning) ساخته می‌شود. در این مرحله، آموزگاران هوش مصنوعی (AI trainers) گفتگوهایی را فراهم می‌کنند که در آن‌ها هر دو طرف گفتگو (کاربر و دستیار هوشمند) را بازی می‌کنند. آموزگاران هوش مصنوعی از پیشنهادات تولید شده توسط مدل برای نوشتن پاسخ‌های خود استفاده می‌کنند. این داده‌های گفتگو با داده‌های InstructGPT که به فرمت گفتگو تبدیل شده‌اند، ترکیب می‌شوند. InstructGPT یک مدل خواهر chatGPT است که برای پاسخ دادن به دستورالعمل‌ها در یک پرسش آموزش دیده شده است.

 

سپس برای ساختن یک مدل پاداش (reward model) برای آموزش تقویتی، نیاز به جمع‌آوری داده‌های مقایسه (comparison data) است. این داده‌ها شامل دو یا چند پاسخ مدل هستند که بر اساس کیفیت رتبه‌بندی شده‌اند. برای جمع‌آوری این داده‌ها، گفتگوهایی که آموزگاران هوش مصنوعی با chatGPT داشته‌اند را در نظر می‌گیریم. یک پاسخ تولید شده توسط مدل را به صورت تصادفی انتخاب کرده و چندین پاسخ جایگزین را نمونه برداری می‌کنیم و سپس آموزگاران هوش مصنوعی آن‌ها را رتبه‌بندی می‌کنند. با استفاده از این مدل‌های پاداش، می‌توان مدل را با استفاده از Proximal Policy Optimization بهینه سازی کرد. چندین دور از این فرآیند اجرا شده است.

 

chatGPT از یک مدل در سری GPT-3.5 به عنوان نقطه شروع استفاده می‌کند. GPT-3.5 یک سری از مدل‌های GPT است که در اوایل سال ۲۰۲۲ آموزش دیده‌اند. شما می‌توانید درباره سری ۳.۵ اینجا بیشتر بخوانید. chatGPT و GPT-3.5 با استفاده از زیرساخت هوش مصنوعی Azure AI آموزش داده شده‌اند.

 

chatGPT چه قابلیت‌هایی دارد؟

 

chatGPT قادر است که در یک فرمت گفتگو با کاربران تعامل کند. این فرمت گفتگو باعث می‌شود که chatGPT بتواند به سوالات پیگیری پاسخ دهد، اشتباهات خود را اعتراف کند، فرضیات نادرست را چالش برانگیز کند و درخواست‌های نامناسب را رد کند. برخی از قابلیت‌های chatGPT عبارتند از:

 

**پاسخ به سوالات عمومی و تخصصی**: chatGPT با استفاده از دانش خود که از داده‌های متنی به دست آورده است، قادر است که به سوالات مختلف در زمینه‌های عمومی و تخصصی پاسخ دهد. برای مثال، شما می‌توانید از chatGPT بپرسید «چطور می‌توانم یک برنامه پایتون بنویسم؟» و chatGPT با استفاده از دانش خود و یا جستجو در منابع معتبر، شما را راهنمایی کند.

 

**پاسخ به سوالات شخصی و خلاقانه**: chatGPT با استفاده از شخصیت خود که در طول آموزش تشکیل شده است، قادر است که به سوالات شخصی و خلاقانه پاسخ دهد. برای مثال، شما می‌توانید از chatGPT بپرسید «چطور حال داری؟» و chatGPT با استفاده از حس خود، شما را جواب بدهد.

 

 

 

نتیجه‌گیری

 

chatGPT یک چت‌بات هوشمند است که توسط شرکت OpenAI توسعه داده شده و در نوامبر سال ۲۰۲۲ معرفی شد. این چت‌بات از یک مدل زبانی بزرگ به نام GPT-3.5 استفاده می‌کند که قادر به درک و تولید متن در هر زمینه و سبک زبانی است. chatGPT با استفاده از یک روش آموزش تقویتی به نام RLHF، برای انجام گفتگو با کاربران آموزش دیده شده است. این روش با استفاده از بازخورد انسانی به مدل کمک می‌کند تا رفتار خود را بهبود بخشد. chatGPT قادر است که پاسخ‌های منطقی، مناسب، جذاب و خلاقانه به سوالات و دستورالعمل‌های کاربران بدهد. chatGPT یک نمونه بارز از پیشرفت هوش مصنوعی در زمینه گفتگو است.