تزیینکنندههای پُرسَند و تعامل بهتر با هوش مصنوعی

عباس پورخصالیان - این یادداشت در بارۀ Prompt Decorators یا «تزئینکنندههای پرامپت» است. این بار بجای اصطلاح Prompt معادل پیشنهادی آن: «پُرسَند» به کار رفته است؛ به امید آن که «پُرسَند» بجایِ Prompt در واژگان کاربرانِ فارسی زبانِ هوش مصنوعی جا بیافتد.
منظور از «تزئینکنندههای پُرسَند»، دستورهایی استاندارد شده هستند که در معماری انواع پلتفرمهای چت جیپیتی پیشبینی شدهاند و از طرف کاربر هوش مصنوعی برای اجرا توسط مدل زبانی صادر میشوند تا تعاملی دلخواه با پلتفرم هوش مصنوعی برای اخذ نتایجی به تدریج بهتر و دقیق تر صورت پذیرد. نقش این «تزئینکنندههای پُرسَند» ساختاردهی دقیق به پرسشها یا «پُرسُندها» است تا کیفیت و نحو و سَبک پاسخهای پلتفرم هوش مصنوعی را به سلیقۀ کاربرِ مدل زبانی، نزدیک و نزدیکتر کند و سطح جدیدی از کنترل و شفافیت را در تولید برونداد و پاسخهای هوشمند فراهم سازد.
- معنا و مفهوم «تزئینکنندههای پُرسَند»
به بیان ساده، «تزئینکنندههای پُرسَند»، (Prompt Decorator ) دستورالعملی اضافه شده به پرسند اصلی است که هدفش تغییر شکل پاسخ یا نحوه تولید آن توسط مدل هوش مصنوعی است. این تزیینکنندهها همانند «صافیهای عقلی» عمل میکنند؛ ملاک و معیارهایی که خروجی تفکر را از مسیرهای مشخص فکری عبور میدهند. این «صافیهای عقلی» قواعدی سختگیرانه هستند برای انطباق درخواست با برونداد.
در استفاده از تزیینکنندهها، رعایت کامل و بیچون وچرای این قواعد سختگیرانه الزامی است. به عبارت دیگر: سیستم هوش مصنوعی موظف است تمام تزیینکنندهها را تشخیص دهد، اجرا کند و آنها را در حافظۀ گفت وگو تا پایان گفت وگو محفوظ نگه دارد. اگر یک تزیینکننده در سطح گفت وگو فعال شده باشد، سیستم هوش مصنوعی باید در تمام پیامهایش تا زمان غیرفعال سازی آن تزیینکننده از طرف کاربر، آنها را رعایت و اِعمال کند.
- آشنایی با تزیینکنندههای اصلی
در میان تزیینکنندههای تعریف شده، برخی در سودهی به نوع و ساختار پاسخ، نقشی بسیار مهم دارند. در ادامه به تعدادی از مهم ترینِ آنها اشاره می شود:
- +++Reasoning = الزام به ارائۀ توضیح دقیق در مورد منطق مندرج در پاسخ.
- +++StepByStep = تقسیم پاسخ به مراحل منطقی به صورت شماره گذاری شده.
- +++Socratic = اتخاذ رویکرد سقراطی شامل پرسشگری، تحلیل و ایجاد فضای تفکر.
- +++Debate = اِعمال تحلیل دیدگاههای مختلف پیش از نتیجهگیری.
- +++Critique = رعایت نقد متوازن شامل نکات قوت، ضعف و ارائۀ پیشنهادهای برای بهبود.
همچنین تزیینکنندههایی وجود دارند که بر فرمتینگ یا قالب بندی برونداد یا بر لحنِ پاسخ تأثیر میگذارند، مانندِ:
- +++OutputFormat(format=JSON/YAML/…) = الزام به فرمتبندی مشخص مانندِ فرمتِ JSON، YAML و Markdown که سه فرمت مختلف برای اهداف متفاوت هستند به شرح زیر:
- JSON = (JavaScript Object Notation) یک قالب برنامهنویسی وب برای انتقال داده بین سرور و کلاینت است که بر اساس نحو شیءگرای جاوا اسکریپت طراحی شده، و دارای ویژگی خوانا بودن و پشتیبانی کردن از انواع دادههای مختلف (مانند رشته، عدد، بولی، آرایه و اشیاء) است که از محبوبیت بالا در بین زبانهای برنامهنویسی برخوردار است. یک فایل JSON ممکن است شامل اطلاعات کاربری مانند نام کاربر، ایمیل و شماره تلفن وی باشد.
- YAML یا (YAML Ain’t Markup Language) که یک فرمت خوانا برای انسان است برای نمایش دادهها و پیکربندی آنها، دارای کاربرد گسترده در فایلهای پیکربندی نرم افزارها، اسناد و اتوماسیون با ویژگی خوانایی بالا، ساختاردهی ساده و استفاده از تورفتگی برای نمایش سلسله مراتب دادهها. یک فایل YAML میتواند شامل تنظیمات یک وبسایت مانند آدرسِ سرور، پورت و نام پایگاه داده باشد.
- و Markdown نیز یک زبان نشانهگذاری سبک است که برای نوشتن محتوای متنی با قالببندی ساده برای نوشتن مستندات، یادداشتها، مقالات و محتوای وب با ویژگیهایی چون نحو ساده و قابل فهم، تبدیل آسان به HTML و سایر فرمتها استفاده میشود؛ یک فایل Markdown میتواند شامل عنوان، پاراگراف، فهرستها و لینکها باشد که با استفاده از نشانهگذاریهای ساده ایجاد می شوند.
- +++Tone(style=formal/technical/humorous/…) = تعیین سبک و لحن نگارش.
- مدیریت دامنه و حافظه
دیگر تزیینکنندههای مهم برای تأثیرگذاری بر مدیریت دامنۀ و حافظه پلتفرم در حین گفت وگو عبارتند از:
- +++ChatScope = اِعمال دستورالعملها در سطح کل گفتوگو تا زمان پاکسازی.
- +++MessageScope = اِعمال دستورالعملها فقط در همان پیام به معنی موقتی بودن تأثیر.
- +++Clear = پاکسازی تمام یا برخی از تزیینکنندههای فعال.
- +++ActiveDecs = درخواستِ فهرستِ تزیینکنندههای فعال فعلی.
- +++AvailableDecs = نمایش جدول کلیۀ تزیینکنندهها و وضعیت فعلی آنها.
- چرا تزئینکنندهها ابزاری بااهمیت هستند؟
در عصر هوش مصنوعیِ مولد، کاربر پلتفرم هوش مصنوعی نیازمند اِعمال کنترل بیشتر روی نحوۀ تولید محتواست. تزیینکنندهها به کاربران حرفهای، پژوهشگران و خبرنگاران ابزارهایی را میدهند تا محتوای برونداد نه فقط درست، بلکه منطبق بر چارچوبهای فکری، منطقی یا زبانی دلخواهِ کاربرِ مربوط باشد.
این قابلیتها میتوانند در زمینههایی چون آموزش، روزنامهنگاری گزارشنویسی تحلیلی، تحقیقات علمی، تولید محتوای ساختاریافته و حتی طراحی مکالمات شخصیسازی شده میان انسان و ماشین، تحولی بنیادین ایجاد کنند.
به این ترتیب: تزیینکنندههای پرسند نه صرفاً ابزارهایی فنی، بلکه نشاندهندۀ ورود کاربران سیستمهای هوش مصنوعی به مرحلهای جدید از تعامل پیشرفته و آگاهانه با مدل زبانی هستند؛ مرحلهای که در آن، کاربران نه فقط سؤالات بهتری میپرسند، بلکه پاسخهایی را دریافت میکنند که کاملاً با نیاز و اهداف ایشان منطبق هستند.
«تزیینکنندههای پُرسند» به شکلی که در بالا تعریف و ارائه شدند، یک ساختار صریح، رسمی و منظم است که در حال حاضر فقط در چارچوب پلتفرمهایی از نوع ChatGPT (و دیگر سامانههای مبتنی بر GPT از شرکتOpenAI ) به صورت کاملاً ساختاریافته استفاده میشود.
سایر پلتفرمهای مدلهای زبانی بزرگ ممکن است چیزی شبیه به تزئینکنندههای موجود در معماریChatGPT را داشته باشند، اما آنها معمولاً به صورت غیررسمی و در قالب کنترلهای موجود در سطح میانای برنامه کاربردی (API-level controls ) پیادهسازی شده اند و در سطح کاربر.
- بررسی مقایسهای ایزارِ مشابهِ تزئینکنندههای پُرسند در چند پلتفورم
- در پلتفرمِ Claude
نام این پلتفرم هوش مصنوعی ( Claude) برگرفته از اسم کوچک «شانون» است که شرکت Anthropic آن را ایجاد و عرضه کرده است. این پلتفرم بجای «دکوراتور» از «Constitutional AI» برای راهنمایی رفتار مدل زبانی استفاده میکند، که شبیه به برخی تزیینکنندهها مثل +++Critique یا +++Socratic است، اما کاربر معمولاً مستقیماً آنها را بهصورت دستوری وارد نمیکند، بلکه توسط توسعه دهنده، اِعمال میشوند.
- در پلتفرم Google Gemini (پیشتر Bard)
پلتفرمGoogle Gemini بجای دکوراتورهای پیشبینی شده در معماری چت جیپیتی، از پُرسندهای سیستمی (system prompts ) استفاده میکند که میتواند دستوراتی مشابه با +++Tone یا +++OutputFormat را اعمال کنند.
این پُرسندهای سیستمی اما بیشتر در تنظیمات توسعه دهنده یا API فعال هستند، نه در گفتوگوی کاربر عادی با پلتفرم.
- در پلتفرم + Meta LLaMA Mistral models
در این مدلها، استفاده از ابزارهای تزئینکننده تنها برای مهندسان پرسند (prompt engineers) پیشبینی شده است و امکان کنترل و راهبری پاسخها از طریق کاربر وجود ندارد؛ مگر این که خود کاربر آن قدر وارد باشد که بتواند چیزی مشابه دکوراتورهای ساختاریافته (مانند +++StepByStep یا +++Debate ) را شبیهسازی کند.
- در پلتفرمهای Cohere, AI21 (Jurassic), xAI (Grok)
در این سیستمها نیز تواناییهای کنترل پاسخ به کمک قالب بندی پرسند و در فاز fine-tuning توسط مهندسان پرسند انجام میشود. اما هیچکدام از این پلتفرمها، دکوراتورهای از پیش تعریفشدۀ استاندارد، آن طور که ChatGPT دارد، ندارند.
بنابراین: تنها انواع پلتفرمهایChatGPT هستند که دارای تزئینکنندههای پرسند در قالبهایی صریح مانند +++Debate یا +++FactCheck هستند. سایر پلتفرمها، مفهومی مشابه دکوراتور را در سطحهای زیرین (system-level prompts، API parameters یا alignment tuning) پیادهسازی میکنند، به طوری که دسترسی مستقیم کاربر به این ابزار ممکن نیست.
به همین دلیل، تزیینکنندههای پرسند را میتوان یکی از نوآوریهای مهم در طراحی میانای انسان و ماشین در انواع پلتفرمهای ChatGPT دانست. (منبع:عصرارتباط)