جهان

متن‌های هوش مصنوعی از انسانی قابل تشخیص است؟

پژوهش‌های تازه زبان‌شناسی نشان می‌دهد هرچند تشخیص نوشتار تولیدشده توسط سامانه‌های هوش مصنوعی از متن انسانی به‌سادگی ممکن نیست، اما الگوهای زبانی، واژگانی و سبکی مشخصی در حال شکل‌گیری است که می‌تواند امکان تمایز میان این دو نوع نوشتار را فراهم کند؛ موضوعی که پیامدهای مهمی برای روزنامه‌نگاری و تولید محتوا دارد.

سایت موسسه رویترز در گزارش نوشت، بررسی‌های تازه نشان می‌دهد نثر تولیدشده توسط هوش مصنوعی، به‌ویژه سامانه‌هایی مانند «چت‌جی‌پی‌تی»، به‌تدریج از نوشتار انسانی فاصله گرفته و در عین حال بر شیوه استفاده انسان‌ها از زبان اثر می‌گذارد؛ روندی که می‌تواند پیامدهایی مهم برای روزنامه‌نگاری، تولید محتوا و حتی تحول زبان انگلیسی داشته باشد.

در سال‌های اخیر، برخی واژه‌ها با لحن نیمه‌رسمی و دانشگاهی با افزایش محسوسی در متون انگلیسی روبه‌رو شده‌اند؛ واژه‌هایی که بسیاری از کاربران آن‌ها را از نشانه‌های شاخص نثر تولیدشده توسط «چت‌جی‌پی‌تی» می‌دانند. ناظران متعدد به الگوهای تکرارشونده در متون تولیدشده با هوش مصنوعی اشاره کرده‌اند؛ از رواج سریع واژه‌هایی که پیش‌تر کمتر به کار می‌رفتند تا ساختارهای جمله‌ای قالبی که بارها در یک متن تکرار می‌شوند.

در شبکه‌های اجتماعی، تشخیص متون تولیدشده با هوش مصنوعی به نوعی سرگرمی تبدیل شده است. در بریتانیا، برخی نمایندگان مجلس و خبرنگاران سیاسی از افزایش سخنرانی‌هایی خبر داده‌اند که با عبارت‌هایی رسمی و قالبی آغاز می‌شوند؛ موضوعی که به استفاده از سامانه‌های هوش مصنوعی در نگارش نطق‌ها نسبت داده می‌شود. حتی کاربران برنامه‌های دوست‌یابی نیز درباره اصالت متن معرفی افراد تردیدهایی مطرح می‌کنند. در این میان، تفاوت‌های ظریف در نشانه‌گذاری نیز به‌عنوان نشانه‌ای از متن ماشینی مطرح شده و همین موضوع واکنش مدافعان برخی علائم نگارشی را برانگیخته است.

بخش قابل توجهی از متونی که امروز در فضای مجازی با تردید به آن‌ها نگریسته می‌شود، ممکن است واقعاً توسط هوش مصنوعی تولید شده باشند. سامانه «چت‌جی‌پی‌تی» اخیراً به حدود هشتصد میلیون کاربر هفتگی رسیده و بر اساس یک نظرسنجی انجام‌شده در شش کشور، بیست‌ودو درصد پاسخ‌دهندگان اعلام کرده‌اند هر هفته از ابزارهای هوش مصنوعی مولد استفاده می‌کنند. داده‌های یک پایگاه بزرگ گردآوری متن‌های اینترنتی نیز نشان می‌دهد که اندکی بیش از نیمی از مقاله‌های تازه منتشرشده در وب توسط سامانه‌های هوش مصنوعی نوشته شده‌اند.

با این حال، فراتر از حدس و گمان و ترفندهای تشخیصی، این پرسش مطرح است که آیا راهی علمی برای تشخیص متون تولیدشده با هوش مصنوعی وجود دارد و مهم‌تر از آن، این فناوری چه تأثیری بر زبان انسان می‌گذارد. در گفت‌وگو با دو زبان‌شناس و یک روزنامه‌نگار متخصص در حوزه هوش مصنوعی و سواد رسانه‌ای، پژوهش‌های موجود، تأثیرات احتمالی بر زبان انگلیسی و پیامدهای آن برای روزنامه‌نگاری بررسی شده است.

این بحث بر زبان انگلیسی متمرکز است؛ زبانی که هم در خط مقدم توسعه مدل‌های بزرگ زبانی قرار دارد و هم بیشترین پژوهش‌ها درباره تأثیر این مدل‌ها بر آن انجام شده است. در مورد زبان‌های دیگر، این مدل‌ها معمولاً در زبان‌هایی عملکرد بهتری دارند که منابع متنی گسترده‌تری در اختیارشان است؛ مسئله‌ای که به زیان زبان‌های کم‌منبع، زبان‌هایی که بیشتر گفتاری هستند یا آن‌هایی که تفاوت چشمگیری میان شکل گفتاری و نوشتاری دارند، تمام می‌شود.

تام اس. جوزک، استادیار زبان‌شناسی محاسباتی دانشگاه ایالتی فلوریدا، با تأکید بر دشواری اثبات رابطه علّی می‌گوید در گفتمان عمومی اغلب نتیجه‌گیری‌های شتاب‌زده‌ای درباره تأثیر هوش مصنوعی بر زبان مطرح می‌شود، در حالی که نشان دادن این تأثیر به‌صورت علمی کار ساده‌ای نیست. با این حال، یافته‌های پژوهشی نشان می‌دهد سامانه «چت‌جی‌پی‌تی» برخی واژه‌های نیمه‌رسمی و دانشگاهی را بیش از حد به کار می‌برد و همین واژه‌ها در متون علمی و رسانه‌ای انسانی نیز رو به افزایش هستند.

در پژوهشی که جوزک و یکی از همکارانش انجام داده‌اند، واژه‌هایی که بدون دلیل مشخصی با افزایش ناگهانی در متون علمی روبه‌رو شده بودند، با واژه‌های پرتکرار در چکیده‌های علمی تولیدشده توسط هوش مصنوعی مقایسه شد. نتیجه این بررسی شناسایی مجموعه‌ای از واژه‌ها بود که افزایش کاربرد آن‌ها در زبان علمی انگلیسی احتمالاً به استفاده از سامانه‌های هوش مصنوعی مرتبط است. با این حال، پژوهشگران تأکید می‌کنند این موضوع الزاماً به معنای استفاده مستقیم نویسندگان از این ابزارها نیست، زیرا همین واژه‌ها در فضاهایی مانند پادکست‌های گفت‌وگومحور نیز افزایش یافته‌اند؛ فضاهایی که احتمال استفاده از متن ماشینی در آن‌ها کمتر است.

پژوهشی دیگر به سرپرستی هیروما یاکورا در مؤسسه ماکس پلانک برلین نشان می‌دهد واژه‌هایی که سامانه‌های هوش مصنوعی بیش‌ازحد از آن‌ها استفاده می‌کنند، پس از عرضه گسترده این ابزارها در پادکست‌ها و سخنرانی‌های دانشگاهی منتشرشده در فضای مجازی نیز رشد قابل توجهی داشته‌اند. این یافته‌ها نشان می‌دهد انسان‌ها در نتیجه مواجهه مداوم با متون تولیدشده توسط هوش مصنوعی، به‌تدریج این واژه‌ها را در گفتار و نوشتار خود به کار می‌گیرند.

در پروژه‌ای پژوهشی در دانشگاه ایالتی فلوریدا نیز نتایج مشابهی به دست آمده است، هرچند پژوهشگران تأکید می‌کنند که نمی‌توان با قطعیت گفت افزایش این واژه‌ها صرفاً ناشی از هوش مصنوعی است و تغییرات طبیعی زبان نیز می‌تواند در این روند نقش داشته باشد.

در پژوهشی دیگر، پژوهشگران برای نزدیک شدن به رابطه علّی، چکیده‌های علمی را به دو بخش تقسیم کردند و از سامانه‌های زبانی خواستند نیمه دوم متن را تولید کنند. مقایسه این بخش‌ها با نسخه انسانی نشان داد برخی واژه‌ها به‌طور خاص مورد توجه این سامانه‌ها هستند و هم‌زمان در متون انسانی نیز رشد کرده‌اند. با این حال، اثبات قطعی این رابطه نیازمند ابزارهای تشخیص دقیق یا اعلام صریح نویسندگان درباره استفاده از هوش مصنوعی است؛ امری که با چالش‌های جدی همراه است.

کارولینا رودنیتسکا، استاد دانشگاه گدانسک لهستان، معتقد است سامانه‌های زبانی نه‌تنها برخی واژه‌ها را ترویج می‌کنند، بلکه از برخی ساختارهای زبانی نیز پرهیز دارند. به گفته او، این ابزارها هنگام ویرایش متن به ایجاز گرایش دارند، از زبان محاوره و ساختارهای غیررسمی فاصله می‌گیرند و سبک رسمی‌تری را ترجیح می‌دهند. او همچنین نشان داده است که سامانه‌های مختلف هوش مصنوعی، سبک‌های نوشتاری متفاوتی دارند.

یکی از نگرانی‌های اصلی پژوهشگران، شکل‌گیری چرخه بازخورد است؛ به این معنا که بازتولید گسترده متون تولیدشده توسط هوش مصنوعی در سامانه‌های جدید می‌تواند به یکنواختی زبان و کاهش تنوع بیانی منجر شود. هرچند تاکنون شواهد قطعی از تحقق کامل این نگرانی به دست نیامده، اما کارشناسان بر لزوم رصد دقیق این روند تأکید دارند.

در عین حال، پژوهشگران معتقدند هوش مصنوعی به‌تنهایی زبان انگلیسی را دگرگون نمی‌کند، بلکه روندهای پیشین را تسریع می‌کند؛ تغییری که با تحولات بزرگی مانند گسترش سواد همگانی در سده نوزدهم قابل مقایسه است. با گسترش این فناوری، بسیاری از پیش‌فرض‌های تحلیل زبان نیز به چالش کشیده شده‌اند، زیرا دیگر نمی‌توان با اطمینان گفت هر متن مکتوبی الزاماً توسط انسان نوشته شده است.

الکس مهادفن، روزنامه‌نگار و مدیر یکی از برنامه‌های سواد رسانه‌ای دیجیتال، معتقد است تمرکز افراطی بر نشانه‌های ظاهری مانند واژه‌ها یا نشانه‌گذاری، راهی مطمئن برای تشخیص متن تولیدشده با هوش مصنوعی نیست. به گفته او، اصول پایه سواد رسانه‌ای همچنان اهمیت دارند؛ از جمله بررسی منبع و مقایسه محتوا با منابع دیگر.

او هشدار می‌دهد استفاده گسترده از متون تولیدشده توسط هوش مصنوعی می‌تواند به یکنواخت شدن صدای رسانه‌ها بینجامد؛ به‌گونه‌ای که گزارش‌های محلی، اجتماعی و محیط‌زیستی به بیانیه‌های رسمی شباهت پیدا کنند و زبان واقعی جوامع کمتر بازتاب یابد. به باور او، نوشتار هوش مصنوعی اغلب سرشار از جملات کلی و فاقد داده مشخص است؛ امری که با اصول حرفه‌ای روزنامه‌نگاری همخوانی ندارد.

در پایان، پژوهشگران تأکید می‌کنند که با در دسترس قرار گرفتن نثر صیقلی و ظاهراً باکیفیت تولیدشده توسط هوش مصنوعی، باید معیارهای سنجش کیفیت نوشتار بازنگری شود. در عین حال، این فناوری می‌تواند فرصت‌هایی نیز ایجاد کند؛ از جمله کمک به نویسندگان غیربومی برای حضور مؤثرتر در عرصه علمی و رسانه‌ای جهانی، مشروط بر آنکه چارچوب‌های اخلاقی و حرفه‌ای به‌طور جدی رعایت شود.

منبع
ایبنا
عضویت در تلگرام آی تی آنالیز

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا