متنهای هوش مصنوعی از انسانی قابل تشخیص است؟

سایت موسسه رویترز در گزارش نوشت، بررسیهای تازه نشان میدهد نثر تولیدشده توسط هوش مصنوعی، بهویژه سامانههایی مانند «چتجیپیتی»، بهتدریج از نوشتار انسانی فاصله گرفته و در عین حال بر شیوه استفاده انسانها از زبان اثر میگذارد؛ روندی که میتواند پیامدهایی مهم برای روزنامهنگاری، تولید محتوا و حتی تحول زبان انگلیسی داشته باشد.
در سالهای اخیر، برخی واژهها با لحن نیمهرسمی و دانشگاهی با افزایش محسوسی در متون انگلیسی روبهرو شدهاند؛ واژههایی که بسیاری از کاربران آنها را از نشانههای شاخص نثر تولیدشده توسط «چتجیپیتی» میدانند. ناظران متعدد به الگوهای تکرارشونده در متون تولیدشده با هوش مصنوعی اشاره کردهاند؛ از رواج سریع واژههایی که پیشتر کمتر به کار میرفتند تا ساختارهای جملهای قالبی که بارها در یک متن تکرار میشوند.
در شبکههای اجتماعی، تشخیص متون تولیدشده با هوش مصنوعی به نوعی سرگرمی تبدیل شده است. در بریتانیا، برخی نمایندگان مجلس و خبرنگاران سیاسی از افزایش سخنرانیهایی خبر دادهاند که با عبارتهایی رسمی و قالبی آغاز میشوند؛ موضوعی که به استفاده از سامانههای هوش مصنوعی در نگارش نطقها نسبت داده میشود. حتی کاربران برنامههای دوستیابی نیز درباره اصالت متن معرفی افراد تردیدهایی مطرح میکنند. در این میان، تفاوتهای ظریف در نشانهگذاری نیز بهعنوان نشانهای از متن ماشینی مطرح شده و همین موضوع واکنش مدافعان برخی علائم نگارشی را برانگیخته است.
بخش قابل توجهی از متونی که امروز در فضای مجازی با تردید به آنها نگریسته میشود، ممکن است واقعاً توسط هوش مصنوعی تولید شده باشند. سامانه «چتجیپیتی» اخیراً به حدود هشتصد میلیون کاربر هفتگی رسیده و بر اساس یک نظرسنجی انجامشده در شش کشور، بیستودو درصد پاسخدهندگان اعلام کردهاند هر هفته از ابزارهای هوش مصنوعی مولد استفاده میکنند. دادههای یک پایگاه بزرگ گردآوری متنهای اینترنتی نیز نشان میدهد که اندکی بیش از نیمی از مقالههای تازه منتشرشده در وب توسط سامانههای هوش مصنوعی نوشته شدهاند.
با این حال، فراتر از حدس و گمان و ترفندهای تشخیصی، این پرسش مطرح است که آیا راهی علمی برای تشخیص متون تولیدشده با هوش مصنوعی وجود دارد و مهمتر از آن، این فناوری چه تأثیری بر زبان انسان میگذارد. در گفتوگو با دو زبانشناس و یک روزنامهنگار متخصص در حوزه هوش مصنوعی و سواد رسانهای، پژوهشهای موجود، تأثیرات احتمالی بر زبان انگلیسی و پیامدهای آن برای روزنامهنگاری بررسی شده است.
این بحث بر زبان انگلیسی متمرکز است؛ زبانی که هم در خط مقدم توسعه مدلهای بزرگ زبانی قرار دارد و هم بیشترین پژوهشها درباره تأثیر این مدلها بر آن انجام شده است. در مورد زبانهای دیگر، این مدلها معمولاً در زبانهایی عملکرد بهتری دارند که منابع متنی گستردهتری در اختیارشان است؛ مسئلهای که به زیان زبانهای کممنبع، زبانهایی که بیشتر گفتاری هستند یا آنهایی که تفاوت چشمگیری میان شکل گفتاری و نوشتاری دارند، تمام میشود.
تام اس. جوزک، استادیار زبانشناسی محاسباتی دانشگاه ایالتی فلوریدا، با تأکید بر دشواری اثبات رابطه علّی میگوید در گفتمان عمومی اغلب نتیجهگیریهای شتابزدهای درباره تأثیر هوش مصنوعی بر زبان مطرح میشود، در حالی که نشان دادن این تأثیر بهصورت علمی کار سادهای نیست. با این حال، یافتههای پژوهشی نشان میدهد سامانه «چتجیپیتی» برخی واژههای نیمهرسمی و دانشگاهی را بیش از حد به کار میبرد و همین واژهها در متون علمی و رسانهای انسانی نیز رو به افزایش هستند.
در پژوهشی که جوزک و یکی از همکارانش انجام دادهاند، واژههایی که بدون دلیل مشخصی با افزایش ناگهانی در متون علمی روبهرو شده بودند، با واژههای پرتکرار در چکیدههای علمی تولیدشده توسط هوش مصنوعی مقایسه شد. نتیجه این بررسی شناسایی مجموعهای از واژهها بود که افزایش کاربرد آنها در زبان علمی انگلیسی احتمالاً به استفاده از سامانههای هوش مصنوعی مرتبط است. با این حال، پژوهشگران تأکید میکنند این موضوع الزاماً به معنای استفاده مستقیم نویسندگان از این ابزارها نیست، زیرا همین واژهها در فضاهایی مانند پادکستهای گفتوگومحور نیز افزایش یافتهاند؛ فضاهایی که احتمال استفاده از متن ماشینی در آنها کمتر است.
پژوهشی دیگر به سرپرستی هیروما یاکورا در مؤسسه ماکس پلانک برلین نشان میدهد واژههایی که سامانههای هوش مصنوعی بیشازحد از آنها استفاده میکنند، پس از عرضه گسترده این ابزارها در پادکستها و سخنرانیهای دانشگاهی منتشرشده در فضای مجازی نیز رشد قابل توجهی داشتهاند. این یافتهها نشان میدهد انسانها در نتیجه مواجهه مداوم با متون تولیدشده توسط هوش مصنوعی، بهتدریج این واژهها را در گفتار و نوشتار خود به کار میگیرند.
در پروژهای پژوهشی در دانشگاه ایالتی فلوریدا نیز نتایج مشابهی به دست آمده است، هرچند پژوهشگران تأکید میکنند که نمیتوان با قطعیت گفت افزایش این واژهها صرفاً ناشی از هوش مصنوعی است و تغییرات طبیعی زبان نیز میتواند در این روند نقش داشته باشد.
در پژوهشی دیگر، پژوهشگران برای نزدیک شدن به رابطه علّی، چکیدههای علمی را به دو بخش تقسیم کردند و از سامانههای زبانی خواستند نیمه دوم متن را تولید کنند. مقایسه این بخشها با نسخه انسانی نشان داد برخی واژهها بهطور خاص مورد توجه این سامانهها هستند و همزمان در متون انسانی نیز رشد کردهاند. با این حال، اثبات قطعی این رابطه نیازمند ابزارهای تشخیص دقیق یا اعلام صریح نویسندگان درباره استفاده از هوش مصنوعی است؛ امری که با چالشهای جدی همراه است.
کارولینا رودنیتسکا، استاد دانشگاه گدانسک لهستان، معتقد است سامانههای زبانی نهتنها برخی واژهها را ترویج میکنند، بلکه از برخی ساختارهای زبانی نیز پرهیز دارند. به گفته او، این ابزارها هنگام ویرایش متن به ایجاز گرایش دارند، از زبان محاوره و ساختارهای غیررسمی فاصله میگیرند و سبک رسمیتری را ترجیح میدهند. او همچنین نشان داده است که سامانههای مختلف هوش مصنوعی، سبکهای نوشتاری متفاوتی دارند.
یکی از نگرانیهای اصلی پژوهشگران، شکلگیری چرخه بازخورد است؛ به این معنا که بازتولید گسترده متون تولیدشده توسط هوش مصنوعی در سامانههای جدید میتواند به یکنواختی زبان و کاهش تنوع بیانی منجر شود. هرچند تاکنون شواهد قطعی از تحقق کامل این نگرانی به دست نیامده، اما کارشناسان بر لزوم رصد دقیق این روند تأکید دارند.
در عین حال، پژوهشگران معتقدند هوش مصنوعی بهتنهایی زبان انگلیسی را دگرگون نمیکند، بلکه روندهای پیشین را تسریع میکند؛ تغییری که با تحولات بزرگی مانند گسترش سواد همگانی در سده نوزدهم قابل مقایسه است. با گسترش این فناوری، بسیاری از پیشفرضهای تحلیل زبان نیز به چالش کشیده شدهاند، زیرا دیگر نمیتوان با اطمینان گفت هر متن مکتوبی الزاماً توسط انسان نوشته شده است.
الکس مهادفن، روزنامهنگار و مدیر یکی از برنامههای سواد رسانهای دیجیتال، معتقد است تمرکز افراطی بر نشانههای ظاهری مانند واژهها یا نشانهگذاری، راهی مطمئن برای تشخیص متن تولیدشده با هوش مصنوعی نیست. به گفته او، اصول پایه سواد رسانهای همچنان اهمیت دارند؛ از جمله بررسی منبع و مقایسه محتوا با منابع دیگر.
او هشدار میدهد استفاده گسترده از متون تولیدشده توسط هوش مصنوعی میتواند به یکنواخت شدن صدای رسانهها بینجامد؛ بهگونهای که گزارشهای محلی، اجتماعی و محیطزیستی به بیانیههای رسمی شباهت پیدا کنند و زبان واقعی جوامع کمتر بازتاب یابد. به باور او، نوشتار هوش مصنوعی اغلب سرشار از جملات کلی و فاقد داده مشخص است؛ امری که با اصول حرفهای روزنامهنگاری همخوانی ندارد.
در پایان، پژوهشگران تأکید میکنند که با در دسترس قرار گرفتن نثر صیقلی و ظاهراً باکیفیت تولیدشده توسط هوش مصنوعی، باید معیارهای سنجش کیفیت نوشتار بازنگری شود. در عین حال، این فناوری میتواند فرصتهایی نیز ایجاد کند؛ از جمله کمک به نویسندگان غیربومی برای حضور مؤثرتر در عرصه علمی و رسانهای جهانی، مشروط بر آنکه چارچوبهای اخلاقی و حرفهای بهطور جدی رعایت شود.
