नई दिल्ली: दिल्ली उच्च न्यायालय के पास ओपनई के खिलाफ समाचार एजेंसी एनी के कॉपीराइट मुकदमे में परिणाम तय करने का अधिकार क्षेत्र है, ने कहा कि उनके लिखित प्रस्तुतियाँ में मामले में अदालत द्वारा नियुक्त दो एमिसी क्यूरिया ने कहा।
उन्होंने कहा कि भारतीय कॉपीराइट अधिनियम के तहत, क्षेत्राधिकार वादी के व्यवसाय के स्थान से निर्धारित होता है, जो इस मामले में नई दिल्ली है। हालांकि, वे इस बात पर भिन्न थे कि क्या OpenAI के ANI के डेटा के उपयोग ने कॉपीराइट उल्लंघन का गठन किया था और उन्हें “उचित उपयोग” के रूप में अनुमति दी गई थी।
एनी के कॉपीराइट उल्लंघन का मुकदमा अमेरिकी आर्टिफिशियल इंटेलिजेंस दिग्गज ओपनई के खिलाफ इस महीने की शुरुआत में दायर किया गया था, ने कहा कि ओपनई ने अपने सॉफ्टवेयर को सदस्य-प्रकाशकों द्वारा प्रकाशित कॉपीराइट साहित्यिक कार्यों पर प्रशिक्षित किया।
अधिकार क्षेत्र का मुद्दा यह है कि ओपनई ने कहा है कि ओपनआई ने कहा है कि चूंकि इसके सर्वरों को ट्रेन और स्टोर डेटा भारत के भीतर स्थित नहीं है, दिल्ली एचसी का कोई अधिकार क्षेत्र नहीं है।
एनी का मुकदमा, कि पुस्तक प्रकाशकों का एक उद्योग निकाय, और हिंदुस्तान टाइम्स सहित लिगेसी न्यूज मीडिया के डिजिटल हथियार, भारत में अपनी तरह का पहला है और एआई कंपनियों के खिलाफ दुनिया भर में दायर इसी तरह के मुकदमों का एक स्लेट का अनुसरण करता है।
18 नवंबर को, न्यायमूर्ति अमित बंसल की एकल-न्यायाधीश बेंच ने इस मामले में अदालत की सहायता के लिए अकादमिक अरुल जॉर्ज स्कारिया और वकील अदरश रामानजुन को एमिसी क्यूरिया के रूप में नियुक्त किया था। स्कारिया और रामानुजन ने सोमवार को अदालत में अपनी रिपोर्ट प्रस्तुत की।
स्कारिया ने कहा कि भले ही ओपनई के सर्वर यूएसए में स्थित हैं, लेकिन यह भारत में उपयोगकर्ताओं के लिए अपनी “इंटरैक्टिव सेवाएं” उपलब्ध करा रहा है, जिसमें दिल्ली में शामिल हैं, जहां एएनआई का मुख्यालय स्थित है। “इसी तरह की परिस्थितियों में, भारत में अदालतों ने अधिकार क्षेत्र ग्रहण किया है,” उनके सबमिशन ने पढ़ा।
रामंजुआन ने कहा कि वादी (एएनआई) व्यवसाय का प्रमुख स्थान नई दिल्ली है, इसलिए दिल्ली एचसी अधिकार क्षेत्र को बरकरार रखता है। उन्होंने कहा कि ओपनईआई के सर्वरों का स्थान “प्राइमा फेशियल अप्रासंगिक” है जहां तक भारतीय कॉपीराइट अधिनियम के तहत कॉपीराइट उल्लंघन के लिए अधिकार क्षेत्र की स्थापना की है।
दोनों एमिसी ने कहा कि अदालत को यह जांचना होगा कि क्या ओपनईआई का “ऑप्ट आउट” विकल्प उन लोगों के लिए है जो नहीं चाहते हैं कि उनकी सामग्री का उपयोग प्रशिक्षण के लिए किया जाए और प्रभावी और उपयोग में आसान हो।
स्कारिया ने सुझाव दिया कि परीक्षण के दौरान, एएनआई और ओपनई दोनों यह भी जवाब दे सकते हैं कि क्या प्रशिक्षण के दौरान इस्तेमाल की जाने वाली सामग्री से जानकारी “तकनीकी रूप से और व्यावहारिक रूप से व्यवहार्य” थी।
रामानुजन ने कहा कि ओपाई की ऑप्ट-आउट नीति स्पष्ट नहीं थी और उसने उल्लंघन को छूट नहीं दी। उन्होंने कहा कि यह नीति केवल भविष्य की घटनाओं को रोक देगी, और चूंकि ओपनईआई तीसरे पक्ष के वेब क्रॉलर पर निर्भर करता है, केवल Openai के वेब क्रॉलर को सीमित करना भी इस मुद्दे को हल नहीं कर सकता है, उन्होंने कहा।
नवंबर के आदेश में, अदालत ने उचित अधिकार क्षेत्र के अलावा कानून के तीन अन्य प्रश्न पूछे थे — सबसे पहले, अगर ओपनई के सॉफ्टवेयर को प्रशिक्षित करने के लिए एएनआई के समाचार डेटा का भंडारण कॉपीराइट उल्लंघन था; दूसरा, यदि प्रतिक्रियाएं उत्पन्न करने के लिए इस कॉपीराइट किए गए डेटा का उपयोग करना कॉपीराइट उल्लंघन था; और तीसरा, यदि ओपनआईए के एएनआई के डेटा का उपयोग “उचित उपयोग” के रूप में योग्य है।
स्कारिया ने कहा कि सभी प्रकार की कॉपीराइट सामग्री का भंडारण — समाचार संबंधित या अन्यथा-प्रशिक्षण के हिस्से के रूप में बड़े भाषा मॉडल (एलएलएम) को कॉपीराइट अधिनियम के तहत अनुमति दी जाती है। हालांकि, अदालत को यह आकलन करना होगा कि क्या Openai स्टोर सीखने के अलावा अन्य उद्देश्यों के लिए कॉपीराइट सामग्री है, और यदि इस तरह के उद्देश्यों को अधिनियम के तहत अनुमति दी जाती है, तो उन्होंने कहा। उन्होंने कहा कि “अस्थायी या स्थायी भंडारण को सीखने के लिए” को रोकना एक कॉपीराइट कानून के व्यापक कोयले को कम कर सकता है, जो “नए कार्यों के निर्माण और प्रसार को बढ़ावा देने के लिए” है।
दूसरी ओर, रामानुजन ने कहा कि प्रशिक्षण प्रक्रिया के दौरान Openai द्वारा “प्रजनन” अधिनियम की धारा 52 (1) (b) के तहत संरक्षित नहीं किया गया था। उन्होंने प्रस्तुत किया, “प्रशिक्षण डेटा का पुनरावृत्ति प्रजनन, चाहे वह मूल पाठ में हो या इसके संगत संख्यात्मक अभ्यावेदन, प्रजनन द्वारा उल्लंघन के लिए मात्रा”।
प्रतिक्रियाओं को उत्पन्न करने के लिए एएनआई की सामग्री का उपयोग करने पर क्या इसका कॉपीराइट का उल्लंघन था, स्कारिया ने कहा कि सबसे पहले, एएनआई को यह स्थापित करना होगा कि यह प्रश्न में कार्यों पर कॉपीराइट का मालिक है, विशेष रूप से “समाचार संबंधी सामग्री का एक पर्याप्त हिस्सा कॉपीराइट संरक्षण से बाहर हो सकता है भारत”। उन्होंने कहा कि एक समाचार एजेंसी के रूप में एएनआई की स्थिति, एक समाचार पत्र, पत्रिका, या एक आवधिक के बजाय, की जांच करने की आवश्यकता होगी, जहां लेखक/योगदानकर्ताओं को जरूरी एएनआई कर्मचारी नहीं हैं और इस प्रकार एएनआई और योगदानकर्ताओं के बीच एक लाइसेंस या कॉपीराइट असाइनमेंट मौजूद हो सकता है ।
दूसरा, उन कार्यों के लिए जिस पर एएनआई का कॉपीराइट स्थापित किया गया है, अदालत को यह आकलन करना चाहिए कि कॉपीराइट संरक्षण किस हद तक दावा किया जा सकता है। स्कारिया ने कहा कि तीसरा, “कॉपीराइट किए गए कार्यों के गैर-एक्सप्रेसिव उपयोग”, अर्थात्, एएनआई द्वारा बताए गए तथ्यों को विरोध करते हुए, “संकेतों का उपयोग करने के लिए अधिक इष्टतम प्रतिक्रियाएं प्रदान करने के लिए” कॉपीराइट उल्लंघन नहीं हो सकता है, स्कारिया ने कहा।
यहां तक कि ऐसे मामलों में जहां सटीक वाक्यांशों का उपयोग चैटगिप्ट की प्रतिक्रियाओं में किया गया है, उन्होंने कहा, कि अदालत ने इस बात की जांच की होगी कि क्या वे उद्देश्यों के लिए जिनके लिए इस तरह की प्रतिक्रियाएं वर्बेटिम में उत्पन्न हुई थीं, उन्हें कॉपीराइट अधिनियम और भारतीय न्यायशास्त्र के तहत अनुमति दी गई थी। उदाहरण के लिए, उन्होंने कहा, “उद्धरण का अधिकार” भारत में कुछ संदर्भों में अनुमति है।
दूसरी ओर, रामानुजन ने तर्क दिया कि आउटपुट में एएनआई की सामग्री का उपयोग करते हुए, अर्थात्, “आउटपुट चरण में जनता के लिए संचार”, एक कॉपीराइट उल्लंघन होगा।
उन्होंने कहा कि अदालत को यह आकलन करने के लिए एक परीक्षण की आवश्यकता हो सकती है कि क्या एलएलएम वास्तव में सभी “कच्चे डेटा” को स्थायी रूप से संग्रहीत करते हैं, लेकिन अधिकांश तकनीकी साहित्य ने संकेत दिया कि एलएलएम ने नहीं किया। चूंकि एएनआई की सामग्री कई प्रकाशनों में सिंडिकेटेड है, इसलिए एलएलएम ने “कच्चे डेटा” के डुप्लिकेट का उत्पादन करने के लिए अन्य प्रकाशनों से इसे “याद” किया हो सकता है, अर्थात्, एएनआई लेख स्वयं, उन्होंने प्रस्तुत किया।
रामानुजन ने कहा कि ओपनईआई के एएनआई की सामग्री के उपयोग को भारतीय अधिनियम के तहत “निष्पक्ष व्यवहार” के रूप में अनुमति नहीं दी गई थी क्योंकि कंपनी एक समाचार एजेंसी या वर्तमान घटनाओं या मामलों पर रिपोर्टिंग करने वाली एक समाचार पत्र नहीं है, और न ही यह आलोचना/समीक्षा के लिए एएनआई की सामग्री का उपयोग कर रही है। उन्होंने कहा कि एक वाणिज्यिक मकसद के लिए सामग्री का उपयोग करके, इसे “निजी या व्यक्तिगत उपयोग” के रूप में या तो अनुमति नहीं दी जा सकती है।
स्कारिया ने, हालांकि, यह प्रस्तुत किया कि एलएलएमएस के लिए सीखने की प्रक्रिया ने मुश्किल से “बाहरी मानव प्राणियों” तक पहुंच दी, और “सीखना मुख्य रूप से अनुसंधान को बढ़ावा देने के उद्देश्य के साथ किया जाता है”, ओपनईआई के एएनआई सामग्री के भंडारण को उचित व्यवहार/निष्पक्ष के रूप में अनुमति दी जा सकती है उपयोग। उन्होंने कहा कि चूंकि उपयोगकर्ता “घटनाओं और तथ्यों के बारे में जानकारी” इकट्ठा करने के लिए CHATGPT जैसी सेवाओं का उपयोग कर रहे हैं, इसलिए इस “एलएलएम के उभरते कार्य” को पूरा करने के लिए स्रोत सामग्री का उपयोग उचित व्यवहार माना जा सकता है।
रामानुजन ने कहा कि अदालत इस बात पर विचार कर सकती है कि क्या ओपनई के एएनआई के कार्यों के उपयोग ने समाचार एजेंसी को कोई “प्रमुख आर्थिक खतरा” पेश किया है, जिससे समाचार पत्र और समाचार चैनल एएनआई की सदस्यता ले सकते हैं और इसके बजाय चैटगेट से प्रतिक्रियाओं का विकल्प चुन सकते हैं।
स्कारिया ने चेतावनी दी कि अदालत को तीन बातों को ध्यान में रखना चाहिए: सबसे पहले, अदालत का फैसला भारत में एआई विकास और तैनाती के भविष्य को प्रभावित करेगा; दूसरा, यह देखते हुए कि एलएलएम से कई बार विघटन होता है और एलएलएम का दुरुपयोग उस अंत तक किया जा सकता है, कॉपीराइट सामग्री सहित वैध जानकारी तक पहुंच, महत्वपूर्ण है; तीसरा, चूंकि LLMS को गलत तरीके से विशेषताएं हैं, इसलिए अदालत Openai को इस तरह की शिकायतों को तुरंत संबोधित करने के लिए निर्देशित कर सकती है। ANI के लिए, CHATGPT द्वारा झूठी विशेषता एक प्रमुख प्रतिष्ठा चिंता थी।