@ai_new_ir

راه‌اندازی پروتکل جدید برای لایسنس داده‌ها در AI


پس از توافق ۱.۵ میلیارد دلاری حل‌وفصل کپی‌رایت توسط Anthropic، صنعت هوش مصنوعی با معضل بزرگ داده‌های آموزشی روبرو شده است. تعداد زیادی پرونده در حال بررسی‌اند که می‌خواهند از داده‌های بدون مجوز خسارت بگیرند - از جمله پرونده‌ای که Midjourney را به دادگاه کشانده است به دلیل ساخت تصاویر سوپرمن.

اکنون یک گروه از تکنولوژیست‌ها و ناشران وب سیستمی را راه‌اندازی کرده‌اند که کردن داده‌ها را در مقیاس بزرگ ممکن می‌سازد - به شرطی که شرکت‌های هوش مصنوعی این سیستم را قبول کنند. سیستم Real Simple Licensing (RSL) توسط ناشران بزرگی مثل Reddit، Quora و یاهو پشتیبانی می‌شود. اکنون پرسش این است که آیا این کشش کافی خواهد بود تا آزمایشگاه‌های بزرگ هوش مصنوعی را به میز مذاکره بیاورد.

به گفته ایکارت والتز، یکی از بنیان‌گذاران RSL که همچنین در ایجاد استاندارد RSS نقش داشته است، هدف ایجاد یک سیستم لایسنس داده‌های آموزشی است که بتواند در سراسر اینترنت مقیاس‌پذیر باشد.

از نظر فنی، پروتکل RSL شرایط لایسنس مشخصی را که یک ناشر می‌تواند برای محتوای خود تعیین کند، تشریح می‌کند. وب‌سایت‌های شرکت‌کننده شرایط را به‌صورت بخشی از فایل 'robots.txt' خود می‌آورند تا تشخیص این که کدام داده تحت کدام شرایط قرار دارد ساده باشد.

از نظر قانونی، تیم RSL سازمانی برای لایسنس جمعی تشکیل داده‌اند که می‌تواند شرایط را مذاکره کرده و حق امتیازها را جمع‌آوری کند، مشابه ASCAP برای موسیقی یا MPLC برای فیلم‌ها.

تعدادی از ناشران وب قبلاً به این جمع ملحق شده‌اند، از جمله Yahoo، Reddit، Medium، O’Reilly Media، Ziff Davis، Internet Brands، People Inc. و The Daily Beast. دیگرانی همچون Fastly، Quora و Adweek از این استاندارد پشتیبانی می‌کنند بدون این که به جمع ملحق شوند.

این سیستم به ناشران کوچک‌تر امکان می‌دهد به اصطلاح معاملات خود را انجام دهند. چالشی جدی این است که چگونه می‌توان تأیید کرد چه وقت برای یک قطعه داده خاص حق امتیاز پرداخت شده است. این موضوع زمانی ساده‌تر است که یک محصول مانند Google AI Search Abstracts معمولاً داده را از وب می‌گیرد و برای هر حقیقت تعیین‌کننده‌ای اعتبار حفظ می‌کند.

اما اگر در زمان وقوع آموزش لاگ ثبت نشده باشد، تقریباً غیرممکن است که تأیید شود یک سند خاص وارد یک مدل زبانی بزرگ شده است. تحمل این مسئله دشوار است، زیرا یه صورت خاص ناشران درخواست می‌کنند که پرداخت به‌ازای هر پرس‌وجو باشد نه این که مقتضباً صورت بگیرد.

با این حال، خالقان RSL باور دارند شرکت‌های هوش مصنوعی می‌توانند با این دشواری کنار بیایند. آنها به نظرات اخیر رهبران هوش مصنوعی اشاره می‌کنند که برای سیستمی مانند RSL تلاش می‌کردند - به‌ویژه از سندر پیچای. این که آیا درخواست‌هایی برای چنین سیستمی واقعی است یا خیر، تیم RSL قصد دارند آنها را به این سیستم ملزم کنند.