تزیین‌کننده‌‌های پُرسَند و تعامل بهتر با هوش مصنوعی

| چهارشنبه, ۶ شهریور ۱۴۰۴، ۱۲:۰۵ ب.ظ | ۰ نظر

عباس پورخصالیان - این یادداشت در بارۀ Prompt Decorators یا «تزئین‌کننده‌های پرامپت» است. این بار بجای اصطلاح Prompt معادل پیشنهادی آن: «پُرسَند» به کار رفته است؛ به امید آن که «پُرسَند» بجایِ Prompt در واژگان کاربرانِ فارسی زبانِ هوش مصنوعی جا بیافتد.

منظور از «تزئین‌کننده‌های پُرسَند»، دستورهایی استاندارد شده هستند که در معماری انواع پلتفرم‌های چت جی‌پی‌تی پیش‌بینی شده‌اند و از طرف کاربر هوش مصنوعی برای اجرا توسط مدل زبانی صادر می‌شوند تا تعاملی دلخواه با پلتفرم هوش مصنوعی برای اخذ نتایجی به تدریج بهتر و دقیق تر صورت پذیرد. نقش این «تزئین‌کننده‌های پُرسَند» ساختاردهی دقیق به پرسش‌ها یا «پُرسُند‌ها» است تا کیفیت و نحو و سَبک پاسخ‌های پلتفرم هوش مصنوعی را به سلیقۀ کاربرِ مدل زبانی، نزدیک و نزدیکتر کند و سطح جدیدی از کنترل و شفافیت را در تولید برونداد و پاسخ‌های هوشمند فراهم سازد.

معنا و مفهوم «تزئین‌کننده‌های پُرسَند»

به‌ بیان ساده، «تزئین‌کننده‌های پُرسَند»، (Prompt Decorator ) دستورالعملی اضافه ‌شده به پرسند اصلی است که هدفش تغییر شکل پاسخ یا نحوه‌ تولید آن توسط مدل هوش مصنوعی است. این تزیین‌‌کننده‌ها همانند «صافی‌های عقلی» عمل می‌کنند؛ ملاک و معیارهایی که خروجی تفکر را از مسیرهای مشخص فکری عبور می‌دهند. این «صافی‌های عقلی» قواعدی سختگیرانه‌ هستند برای انطباق درخواست با برونداد.

در استفاده از تزیین‌کننده‌‌ها، رعایت کامل و بی‌‌چون‌ وچرای این‌ قواعد سختگیرانه‌ الزامی است. به عبارت دیگر: سیستم هوش مصنوعی موظف است تمام تزیین‌‌کننده‌ها را تشخیص دهد، اجرا کند و آن‌ها را در حافظۀ گفت ‌وگو تا پایان گفت وگو محفوظ نگه دارد. اگر یک تزیین‌کننده در سطح گفت ‌وگو فعال شده باشد، سیستم هوش مصنوعی باید در تمام پیام‌هایش تا زمان غیرفعال ‌سازی آن تزیین‌کننده از طرف کاربر، آنها را رعایت و اِعمال کند.

آشنایی با تزیین‌کننده‌‌های اصلی

در میان تزیین‌کننده‌‌های تعریف ‌شده، برخی در سو‌دهی به نوع و ساختار پاسخ، نقشی بسیار مهم دارند. در ادامه به تعدادی از مهم ترینِ آن‌ها اشاره می شود:

+++Reasoning = الزام به ارائۀ توضیح دقیق در مورد منطق مندرج در پاسخ.

+++StepByStep = تقسیم پاسخ به مراحل منطقی به صورت شماره گذاری‌ شده.

+++Socratic = اتخاذ رویکرد سقراطی شامل پرسشگری، تحلیل و ایجاد فضای تفکر.

+++Debate = اِعمال تحلیل دیدگاه‌های مختلف پیش از نتیجه‌گیری.

+++Critique = رعایت نقد متوازن شامل نکات قوت، ضعف و ارائۀ پیشنهادهای برای بهبود.

همچنین تزیین‌کننده‌‌هایی وجود دارند که بر فرمتینگ یا قالب بندی برونداد یا بر لحنِ پاسخ تأثیر می‌گذارند، مانندِ:

+++OutputFormat(format=JSON/YAML/…) = الزام به فرمت‌بندی مشخص مانندِ فرمتِ JSON، YAML و Markdown که سه فرمت مختلف برای اهداف متفاوت هستند به شرح زیر:

JSON = (JavaScript Object Notation) یک قالب برنامه‌نویسی وب برای انتقال داده بین سرور و کلاینت است که بر اساس نحو شیءگرای جاوا اسکریپت طراحی شده، و دارای ویژگی خوانا بودن و پشتیبانی کردن از انواع داده‌های مختلف (مانند رشته، عدد، بولی، آرایه و اشیاء) است که از محبوبیت بالا در بین زبان‌های برنامه‌نویسی برخوردار است. یک فایل JSON ممکن است شامل اطلاعات کاربری مانند نام کاربر، ایمیل و شماره تلفن وی باشد.
YAML یا (YAML Ain’t Markup Language) که یک فرمت خوانا برای انسان است برای نمایش داده‌ها و پیکربندی آنها، دارای کاربرد گسترده در فایل‌های پیکربندی نرم ‌افزارها، اسناد و اتوماسیون با ویژگی خوانایی بالا، ساختاردهی ساده و استفاده از تورفتگی برای نمایش سلسله‌ مراتب داده‌ها. یک فایل YAML می‌تواند شامل تنظیمات یک وب‌سایت مانند آدرسِ سرور، پورت و نام پایگاه داده باشد.

و Markdown نیز یک زبان نشانه‌گذاری سبک است که برای نوشتن محتوای متنی با قالب‌بندی ساده برای نوشتن مستندات، یادداشت‌ها، مقالات و محتوای وب با ویژگی‌هایی چون نحو ساده و قابل فهم، تبدیل آسان به HTML و سایر فرمت‌ها استفاده می‌شود؛ یک فایل Markdown می‌تواند شامل عنوان، پاراگراف، فهرست‌ها و لینک‌ها باشد که با استفاده از نشانه‌گذاری‌های ساده ایجاد می شوند.
+++Tone(style=formal/technical/humorous/…) = تعیین سبک و لحن نگارش.

مدیریت دامنه و حافظه

دیگر تزیین‌کننده‌های مهم برای تأثیرگذاری بر مدیریت دامنۀ و حافظه پلتفرم در حین گفت وگو عبارتند از:

+++ChatScope = اِعمال دستورالعمل‌ها در سطح کل گفت‌وگو تا زمان پاک‌سازی.

+++MessageScope = اِعمال دستورالعمل‌ها فقط در همان پیام به معنی موقتی بودن تأثیر.

+++Clear = پاک‌سازی تمام یا برخی از تزیین‌‌کننده‌‌های فعال.

+++ActiveDecs = درخواستِ فهرستِ تزیین‌کننده‌‌های فعال فعلی.

+++AvailableDecs = نمایش جدول کلیۀ تزیین‌‌کننده‌ها و وضعیت فعلی آن‌ها.

چرا تزئین‌کننده‌ها ابزاری بااهمیت هستند؟

در عصر هوش مصنوعیِ مولد، کاربر پلتفرم هوش مصنوعی نیازمند اِعمال کنترل بیشتر روی نحوۀ تولید محتواست. تزیین‌‌کننده‌‌ها به کاربران حرفه‌ای، پژوهشگران و خبرنگاران ابزارهایی را می‌دهند تا محتوای برونداد نه فقط درست، بلکه منطبق بر چارچوب‌های فکری، منطقی یا زبانی دلخواهِ کاربرِ مربوط باشد.

این قابلیت‌ها می‌توانند در زمینه‌هایی چون آموزش، روزنامه‌‌نگاری گزارش‌نویسی تحلیلی، تحقیقات علمی، تولید محتوای ساختاریافته و حتی طراحی مکالمات شخصی‌سازی شده میان انسان و ماشین، تحولی بنیادین ایجاد کنند.

به این ترتیب: تزیین‌کننده‌های پرسند نه صرفاً ابزارهایی فنی، بلکه نشان‌‌دهندۀ ورود کاربران سیستم‌های هوش مصنوعی به مرحله‌ای جدید از تعامل پیشرفته و آگاهانه با مدل زبانی هستند؛ مرحله‌ای که در آن، کاربران نه فقط سؤالات بهتری می‌پرسند، بلکه پاسخ‌هایی را دریافت می‌کنند که کاملاً با نیاز و اهداف ایشان منطبق هستند.

«تزیین‌کننده‌های پُرسند» به شکلی که در بالا تعریف و ارائه شدند، یک ساختار صریح، رسمی و منظم است که در حال حاضر فقط در چارچوب پلتفرم‌هایی از نوع ChatGPT (و دیگر سامانه‌های مبتنی بر GPT از شرکتOpenAI ) به‌ صورت کاملاً ساختاریافته استفاده می‌شود.

سایر پلتفرم‌های مدل‌های زبانی بزرگ ممکن است چیزی شبیه به تزئین‌کننده‌های موجود در معماریChatGPT را داشته باشند، اما آنها معمولاً به صورت غیررسمی و در قالب کنترل‌های موجود در سطح میانای برنامه کاربردی (API-level controls ) پیاده‌سازی شده‌ اند و در سطح کاربر.

بررسی مقایسه‌ای ایزارِ مشابهِ تزئین‌کننده‌های پُرسند در چند پلتفورم‌

در پلتفرمِ Claude

نام این پلتفرم هوش مصنوعی ( Claude) برگرفته از اسم کوچک «شانون» است که شرکت Anthropic آن را ایجاد و عرضه کرده است. این پلتفرم بجای «دکوراتور» از «Constitutional AI» برای راهنمایی رفتار مدل زبانی استفاده می‌کند، که شبیه به برخی تزیین‌کننده‌ها مثل +++Critique یا +++Socratic است، اما کاربر معمولاً مستقیماً آن‌ها را به‌صورت دستوری وارد نمی‌کند، بلکه توسط توسعه دهنده، اِعمال می‌شوند.

در پلتفرم Google Gemini (پیش‌تر Bard)

پلتفرمGoogle Gemini بجای دکوراتورهای پیش‌بینی شده در معماری چت جی‌پی‌تی، از پُرسندهای سیستمی (system prompts ) استفاده می‌کند که می‌تواند دستوراتی مشابه با +++Tone یا +++OutputFormat را اعمال کنند.

این پُرسندهای سیستمی اما بیشتر در تنظیمات توسعه ‌دهنده یا API فعال هستند، نه در گفت‌وگوی کاربر عادی با پلتفرم.

در پلتفرم + Meta LLaMA Mistral models

در این مدل‌ها، استفاده از ابزارهای تزئین‌کننده تنها برای مهندسان پرسند (prompt engineers) پیش‌بینی شده است و امکان کنترل و راهبری پاسخ‌ها از طریق کاربر وجود ندارد؛ مگر این که خود کاربر آن قدر وارد باشد که بتواند چیزی مشابه دکوراتورهای ساختاریافته (مانند +++StepByStep یا +++Debate ) را شبیه‌سازی کند.

در پلتفرم‌های Cohere, AI21 (Jurassic), xAI (Grok)

در این سیستم‌ها نیز توانایی‌های کنترل پاسخ به کمک قالب ‌بندی پرسند و در فاز fine-tuning توسط مهندسان پرسند انجام می‌شود. اما هیچ‌کدام از این پلتفرم‌ها، دکوراتورهای از پیش تعریف‌شدۀ استاندارد، آن طور که ChatGPT دارد، ندارند.

بنابراین: تنها انواع پلتفرم‌هایChatGPT هستند که دارای تزئین‌کننده‌های پرسند در قالب‌هایی صریح مانند +++Debate یا +++FactCheck هستند. سایر پلتفرم‌ها، مفهومی مشابه دکوراتور را در سطح‌های زیرین (system-level prompts، API parameters یا alignment tuning) پیاده‌سازی می‌کنند، به طوری که دسترسی مستقیم کاربر به این ابزار ممکن نیست.

به همین دلیل، تزیین‌کننده‌های پرسند را می‌توان یکی از نوآوری‌های مهم در طراحی میانای انسان و ماشین در انواع پلتفرم‌های ChatGPT دانست. (منبع:عصرارتباط)

۰۴/۰۶/۰۶

ITanalyze

ITanalyze

تحلیل وضعیت فناوری اطلاعات در ایران :: Iran IT analysis and news

تزیین‌کننده‌‌های پُرسَند و تعامل بهتر با هوش مصنوعی

هوش مصنوعی

نظرات (۰)

ارسال نظر