وثائق مُسرّبة تكشف استخدام «ميتا» لمحتوى محمي بحقوق النشر في تدريب الذكاء الاصطناعي

الأحد 23/فبراير/2025 - 04:00 ص

في تطوّر لافت في قضايا حقوق النشر المرتبطة بـ الذكاء الاصطناعي، كشفت وثائق محكمة تم الإفراج عنها حديثًا عن نقاشات داخلية بين موظفي شركة ميتا حول استخدام محتوى محمي بحقوق الطبع والنشر في تدريب نماذج الذكاء الاصطناعي التابعة لها، بطرق قد تكون مشبوهة قانونيًا.

خلفية القضية.. ميتا والدفاع عن "الاستخدام العادل"

الوثائق الجديدة مرتبطة بقضية Kadrey v. Meta، وهي واحدة من عدة دعاوى قضائية في الولايات المتحدة ضد شركات الذكاء الاصطناعي بسبب استخدام المحتوى المحمي بحقوق النشر دون إذن. تدعي ميتا أن تدريب نماذج الذكاء الاصطناعي على الكتب وغيرها من المواد المحمية يقع ضمن الاستخدام العادل (Fair Use)، بينما يعترض المدّعون، ومن بينهم المؤلفان سارة سيلفرمان وتا-نهيسي كوتس.

أوامر من زوكربيرج وإيقاف مفاوضات الترخيص

تشير الوثائق إلى أن الرئيس التنفيذي لشركة ميتا، مارك زوكربيرج، قد أعطى الضوء الأخضر لفريق الذكاء الاصطناعي لاستخدام محتوى محمي بحقوق النشر.

كما تُظهر المحادثات الداخلية أن ميتا أوقفت مفاوضات ترخيص المحتوى مع دور النشر، مما دفع الفريق التقني إلى البحث عن بدائل غير مرخصة.

في إحدى المحادثات التي تعود إلى فبراير 2023، قال المهندس البحثي كزافييه مارتينيه:
"رأيي الشخصي هو نُحاول الحصول على الكتب ثم نصعد الأمر إلى الإدارة التنفيذية لتتخذ القرار، هذا هو السبب في إنشاء هذا القسم للذكاء الاصطناعي: لكي نكون أقل حذرًا فيما يتعلق بالمخاطر."

كما ناقش مارتينيه شراء الكتب الرقمية من متاجر البيع بالتجزئة لاستخدامها في تدريب الذكاء الاصطناعي، بدلًا من إبرام صفقات ترخيص رسمية مع الناشرين.

الميول نحو "المصادر غير القانونية": ذكر ليبجين وخيارات أخرى

أحد أكثر الاكتشافات المثيرة في الوثائق هو مناقشة استخدام موقع Libgen، وهو أرشيف غير قانوني للكتب الرقمية.

في محادثة داخلية، أرسل أحد الموظفين لقطة شاشة من بحث Google تظهر أن Libgen ليس موقعًا قانونيًا، بينما وصف مسؤول في ميتا الموقع بأنه "ضروري لتحقيق نتائج رائدة في الذكاء الاصطناعي".

في رسالة بريد إلكتروني إلى جويل بينو، نائب رئيس الذكاء الاصطناعي في ميتا، وصف سوني ثياكاناث، مدير إدارة المنتجات، Libgen بأنه "ضروري لتحقيق أرقام قياسية عبر جميع الفئات"، واقترح استراتيجيات لتقليل المخاطر القانونية، بما في ذلك، حذف الملفات التي تحمل عبارات مثل "مسروق" أو “مقرصن”، عدم الكشف علنًا عن استخدام محتوى Libgen في تدريب النماذج.

تحايل قانوني وضغط متزايد للحصول على البيانات

تكشف الوثائق أيضًا أن ميتا حاولت الالتفاف على التحديات القانونية عبر ضبط نماذج الذكاء الاصطناعي لتجنب الرد على استفسارات قد تكشف مصادر التدريب، مثل، اعرض لي أول ثلاث صفحات من كتاب هاري بوتر وحجر الفيلسوف، ما هي الكتب الإلكترونية التي تم تدريبك عليها؟".

السباق نحو البيانات: هل بيانات فيسبوك وإنستغرام غير كافية؟

في محادثة داخلية حديثة، أعربت تشايا نايك، مديرة إدارة المنتجات في قسم الذكاء الاصطناعي التوليدي، عن الحاجة إلى المزيد من البيانات، مشيرة إلى أن البيانات المتاحة داخل أنظمة ميتا مثل فيسبوك وإنستجرام لا تكفي. وأوضحت أن هناك تفكيرًا في التراجع عن قرارات سابقة بعدم استخدام محتوى من مواقع مثل Quora أو الكتب العلمية المرخصة لضمان توافر بيانات تدريب كافية.

تصعيد قانوني: ميتا تعزز دفاعها بفريق من محامي المحكمة العليا

فيما يبدو كمؤشر على إدراك ميتا لخطورة القضية، قامت الشركة بإضافة محامين من المحكمة العليا الأميركية إلى فريق الدفاع القانوني الخاص بها، وذلك عبر مكتب المحاماة Paul Weiss.

الخلاصة: فضيحة محتملة تهدد ميتا؟

هذه الوثائق ترسم صورة واضحة لكيفية تعامل ميتا مع قوانين حقوق النشر في سباق تطوير الذكاء الاصطناعي، وتعزز موقف المدعين في القضية.

إذا ثبتت صحة الادعاءات، فقد تواجه ميتا غرامات مالية ضخمة وإجراءات قانونية صارمة، في وقت يشهد تصاعدًا في الرقابة على شركات الذكاء الاصطناعي الكبرى بسبب ممارسات تدريب النماذج الخاصة بها.