چگونه سرقت ادبی ChatGPT را تشخیص دهیم و چرا اینقدر دشوار است


در حال حاضر چت ربات ها چیزهای داغی هستند و ChatGPT در میان آنها مهم است. اما به لطف پاسخ‌های قدرتمند و انس، آن، دانشگاهیان، مربیان و ویراستاران همگی با موج فزاینده سرقت ادبی و تقلب ناشی از هوش مصنوعی سروکار دارند. ابزارهای قدیمی تشخیص سرقت ادبی شما ممکن است برای تشخیص واقعی از جعلی کافی نباشد.

در این مقاله، من کمی در مورد این جنبه کابوس‌وار چت ربات‌های هوش مصنوعی صحبت می‌کنم، چند ابزار آنلاین تشخیص سرقت ادبی را بررسی می‌کنم و بررسی می‌کنم که وضعیت تا چه حد وخیم شده است.

لو،ای ChatGPT و OpenAI.

بسیاری از گزینه های تشخیص

آ،ین نسخه استارتاپ در نوامبر 2022 ChatGPT OpenAI اساساً قدرت چت بات را در کانون توجه قرار داد. این به هر جو معمولی (یا هر حرفه ای) اجازه می داد تا مقالات یا مقالات هوشمند و قابل فهمی تولید کند و مسائل ریاضی مبتنی بر متن را حل کند. برای خواننده ناآگاه یا بی‌تجربه، محتوای ایجاد شده با هوش مصنوعی می‌تواند به راحتی به ،وان یک نوشته قانونی منتقل شود، به همین دلیل است که دانش‌آموزان آن را دوست دارند – و معلمان از آن متنفرند.

یک چالش بزرگ با ابزارهای نوشتن هوش مصنوعی، توانایی شمشیر دو لبه آنها برای استفاده از زبان طبیعی و دستور زبان برای ساختن محتوای منحصر به فرد و تقریباً فردی است، حتی اگر خود محتوا از یک پایگاه داده گرفته شده باشد. این بدان م،است که رقابت برای ش،ت دادن تقلب مبتنی بر هوش مصنوعی در جریان است. در اینجا چند گزینه وجود دارد که من پیدا کردم و در حال حاضر به صورت رایگان در دسترس هستند.

آشکارساز ،وجی GPT-2 مستقیماً از OpenAI توسعه دهنده ChatGPT می آید تا نشان دهد که دارای یک ربات است که می تواند متن چت بات را تشخیص دهد. استفاده از آشکارساز ،وجی آسان است – کاربران فقط باید متن را در یک فیلد متنی وارد کنند و این ابزار بلافاصله ارزیابی خود را از احتمال اینکه متن از یک انسان باشد یا نه ارائه می دهد.

دو ابزار دیگر که دارای رابط کاربری تمیز هستند هستند Writer AI Content Detector و محتوا در مقیاس. می تو،د یک URL برای اسکن محتوا (فقط نویسنده) یا به صورت دستی متن اضافه کنید. به نتایج درصدی از میزان احتمال اینکه محتوا توسط انسان تولید شده باشد، داده می شود.

GPTZero یک ابزار بتای خانگی است که در Streamlit میزب، شده و توسط دانشجوی دانشگاه پرینستون ادوارد ذن ایجاد شده است. این تفاوت در نحوه ارائه مدل “algiarism” (سرقت علمی به کمک هوش مصنوعی) با بقیه است. GPTZero معیارها را به گیجی و انفجاری تبدیل می کند. Burstiness تصادفی کلی را برای همه جملات یک متن اندازه گیری می کند، در حالی که گیجی تصادفی بودن یک جمله را اندازه گیری می کند. این ابزار یک عدد را به هر دو معیار اختصاص می دهد – هر چه این عدد کمتر باشد، احتمال بیشتری وجود دارد که متن توسط یک ربات ایجاد شده باشد.

اسکرین شات از GPTZero.

فقط برای سرگرمی، من اضافه کردم اتاق آزمون مدل زبان غول پیکر (GLTR)، توسط محققان آزمایشگاه هوش مصنوعی MIT-IBM Watson و گروه پردازش زبان طبیعی هاروارد توسعه یافته است. مانند GPTZero، نتایج نهایی خود را به ،وان یک تمایز واضح “انسان” یا “ربات” ارائه نمی کند. GLTR اساساً از ربات‌ها برای شناسایی متن نوشته شده توسط ربات‌ها استفاده می‌کند، زیرا ربات‌ها به احتمال کمتری کلمات غیرقابل پیش‌بینی را انتخاب می‌کنند. بنابراین، نتایج به‌،وان یک هیستوگرام با کد رنگی ارائه می‌شوند که متن تولید شده توسط هوش مصنوعی را در مقابل متن تولید شده توسط انسان رتبه‌بندی می‌کند. هرچه مقدار متن غیرقابل پیش بینی بیشتر باشد، احتمال اینکه متن از یک انسان باشد بیشتر است.

آنها را در معرض آزمایش قرار می دهند

،وجی از آشکارساز GPT-2.

همه این گزینه‌ها ممکن است باعث شود فکر کنید که با تشخیص هوش مصنوعی در موقعیت خوبی هستیم. اما برای آزمایش اثربخشی واقعی هر یک از این ابزارها، می‌خواستم آن را برای خودم امتحان کنم. بنابراین من چند پاراگراف نمونه را اجرا کردم که در پاسخ به سؤالاتی نوشتم که در این مورد ChatGPT نیز مطرح کردم.

اولین سوال من یک سوال ساده بود: چرا ،ید یک رایانه شخصی از پیش ساخته شده بدبین است؟ در اینجا نحوه پاسخ های خودم در مقایسه با پاسخ ChatGPT آمده است.


نوشته واقعی من ChatGPT
آشکارساز ،وجی GPT-2 1.18 درصد جعلی 36.57٪ جعلی
هوش مصنوعی نویسنده 100% انسان 99 درصد انسان
محتوا در مقیاس 99 درصد انسان 73 درصد انسان
GPTZero 80 سردرگمی 50 گیجی
GLTR 12 از 66 کلمه احتمالا توسط انسان 15 یا 79 کلمه به احتمال زیاد توسط انسان

همانطور که می بینید، بیشتر این برنامه ها می توانستند بگویند که کلمات من واقعی هستند و سه مورد اول دقیق ترین هستند. اما ChatGPT بسیاری از این برنامه های آشکارساز را با پاسخ خود نیز فریب داد. برای شروع، در برنامه Writer AI Content Detector امتیاز ۹۹ درصد انسان را ،ب کرد و توسط آشکارساز مبتنی بر GPT فقط ۳۶ درصد جعلی مشخص شد. GLTR بزرگترین متخلف بود و ادعا می کرد که کلمات خود من به همان اندازه به احتمال زیاد توسط یک انسان نوشته می شود که کلمات ChatGPT.

،وجی با Write AI Detector.

تصمیم گرفتم یک بار دیگر به آن ضربه بزنم، و این بار، پاسخ ها به طور قابل توجهی بهبود یافتند. من از ChatGPT خواستم خلاصه ای از تحقیقات موسسه فناوری فدرال سوئیس در مورد ضد مه با استفاده از ذرات طلا ارائه دهد. در این مثال، برنامه‌های آشکارساز در تأیید پاسخ خودم و تشخیص ChatGPT کار بسیار بهتری انجام دادند.


نوشته واقعی من ChatGPT
آشکارساز ،وجی GPT-2 9.28٪ جعلی 99.97٪ جعلی
هوش مصنوعی نویسنده 95 درصد انسان 2 درصد انسان
محتوا در مقیاس 92 درصد انسان 0% (بدیهی است هوش مصنوعی)
GPTZero 41 گیجی 23 گیجی
GLTR 15 از 79 کلمه احتمالا توسط انسان 4 از 98 کلمه احتمالا توسط انسان

سه آزمون برتر واقعاً قدرت خود را در این پاسخ نشان دادند. و در حالی که GLTR هنوز به سختی می‌توانست نوشته‌های من را انسان ببیند، حداقل این بار توانسته بود ChatGPT را جلب کند.

بسته شدن

از نتایج هر پرس و جو واضح است که آشکارسازهای سرقت ادبی آنلاین کامل نیستند. برای پاسخ‌های پیچیده‌تر یا تکه‌های نوشتاری (مثلاً در مورد درخواست دوم)، تشخیص نوشته‌های مبتنی بر هوش مصنوعی برای این برنامه‌ها کمی آسان‌تر است، در حالی که استنباط پاسخ‌های ساده‌تر بسیار دشوارتر است. اما واضح است که این چیزی نیست که من آن را قابل اعتماد بنامم. گاهی اوقات، این ابزارهای آشکارساز مقالات یا مقالات را به‌،وان تولید شده توسط ChatGPT طبقه‌بندی می‌کنند، که برای معلمان یا ویراستار، که می‌خواهند برای دستگیری متقلبان به آن‌ها تکیه کنند، مشکل ایجاد می‌کند.

توسعه‌دهندگان دائماً دقت و نرخ‌های مثبت کاذب را تنظیم می‌کنند، اما آن‌ها همچنین برای ورود GPT-3 آماده می‌شوند که مجموعه داده‌ای به‌طور قابل‌توجهی بهبود یافته و قابلیت‌های پیچیده‌تری نسبت به GPT-2 (که ChatGPT از آن آموزش دیده است) را به نمایش می‌گذارد.

در این مرحله، برای شناسایی محتوای تولید شده توسط هوش مصنوعی، ویراستاران و مربیان باید ،دمندی و کمی شهود انس، را با یک (یا چند) از این آشکارسازهای هوش مصنوعی ،یب کنند. و برای کاربران چت بات که یا وسوسه شده اند از چت ربات هایی مانند Chatsonic، ChatGPT، Notion یا YouChat استفاده کنند تا “کار” خود را قانونی اعلام کنند – لطفاً این کار را نکنید. استفاده مجدد از محتوای ایجاد شده توسط یک ربات (منابع از منابع ثابت در پایگاه داده خود) صرف نظر از اینکه چگونه به آن نگاه کنید همچنان سرقت ادبی است.

اخبار فناوری امروز که برای صندوق ورودی شما تنظیم و فشرده شده است


صندوق ورودی خود را بررسی کنید!

لطفاً برای ادامه یک آدرس ایمیل معتبر ارائه دهید.

این آدرس ایمیل در حال حاضر در پرونده است. اگر خبرنامه دریافت نمی کنید، لطفاً پوشه اسپم خود را بررسی کنید.

با عرض پوزش، در حین اشتراک خطایی رخ داد. لطفاً بعداً دوباره امتحان کنید.

توصیه های سردبیران







منبع: https://www.di،altrends.com/computing/،w-to-detect-chatgpt-plagiarism/