Published : 15 Dec 2022, 03:59 PM
টানা কয়েক সপ্তাহ ধরে সামাজিক মাধ্যমে আলোচনায় আছে লেনসা ফটো-ভিডিও এডিটিং অ্যাপ। এতে এআই নির্ভর ডিজিটাল পোর্ট্রেইট তৈরির ফিচার যোগ হওয়ার পর পরই প্রশ্ন উঠেছে; লেনসার এআই কি মানব শিল্পীদের শিল্পকর্ম চুরি করছে?
সমসায়ময়িক শিল্প শৈলির ধাঁচে ডিজিটাল পোর্ট্রেইট নির্মাণের জন্য নিজের ১০ থেকে ২০টি ছবি আপলোড করতে হয় ব্যবহারকারীকে। তবে, এতে ছোট্ট একটা ফি দেওয়ার বিষয়ও আছে।
২০২২ সালে এসে লিখে দেওয়া নির্দেশনা থেকে মিডিয়া কনটেন্ট নির্মাণের এআই প্রযুক্তি ল্যাবরেটরির গন্ডি পেরিয়ে সাধারণ ব্যবহারকারীদের হাতে নাগালে এসেছে।
বিজ্ঞান ও প্রযুক্তিবিষয়ক সাইট সায়েন্সঅ্যালার্টের ভাষ্যে, কার্যত হালের ভিজুয়াল সংস্কৃতিতে ঔপনিবেশিক শক্তির মতো উপস্থিতি গড়ে নিয়েছে এআই; আর এর সবচেয়ে কৌশলী বাণিজ্যিক ব্যবহারটি করেছে লেনসা।
সামাজিক মাধ্যমে ভিন্ন আঙ্গিকে নিজের উপস্থিতি জানান দিতে চান– এমন ইনফ্লুন্সোরদের মধ্যে অ্যাপটি যেমন আলোড়ন তুলেছে; ঠিক তেমনি আলোড়ন সৃষ্টি হয়েছে ডিজিটাল শিল্পীদের মধ্যে। অস্ট্রেলিয়ার শিল্পী কিম লুটওয়াইলার ব্রিটিশ দৈনিক দ্য গার্ডিয়ানকে বলেছেন, এআই তৈরি পোট্রেইটে কেবল ভিন্ন ভিন্ন শিল্পীর আঁকার ধরন খুঁজে পাননি তিনি; নিজের কাজের নকলও খুঁজে পেয়েছেন।
বছরের শুরুতেই মিডজার্নি, ওপেনএআই-এর ডাল-ই এবং স্টেবল ডিফিউশনের মতো এআইগুলো দৃশ্যপটে আসার পর থেকেই এ প্রযুক্তির মাধ্যমে ভিন্ন ভিন্ন শিল্পীর কাজের ধরন সহজে নকল করার সক্ষমতা নিয়ে চলছে তুমুল বিতর্ক।
শিল্পীদের অনেকেই মনে করছেন তাদের বুদ্ধিবৃত্তিক সম্পদ এবং সৃজনশীলতার অপব্যবহার করছে এআই প্রযুক্তি।
কিন্তু পশ্চিমা বাজারের কপিরাইট আইন বলছে ভিন্ন কথা।
যদি সরাসরি চুরি না হয়, তবে হচ্ছেটা কী?
লিখে দেওয়া নির্দশনা থেকে মিডিয়া কনটেন্ট নির্মাণ করে যে এআইগুলো, তার কার্যপ্রণালী খুবই জটিল; কিন্তু চেষ্টা করলে কম্পিউটার প্রুযুক্তিতে সিদ্ধহস্ত নন এমন মানুষকেও বোঝানো সম্ভব বিষয়টি।
তবে, তার আগে লেনসার কার্যপ্রণালী বোঝা প্রয়োজন। লেনসা কার্যত স্টেবল ডিফিউশনের ডিপ লার্নিং মডেলের একটি সোজাসাপ্টা সংস্করণ।
স্টেবল ডিফিউশন নির্মাণের সময় এআইটিকে লাখ লাখ ছবি আর টেক্সট দিয়ে প্রশিক্ষণ দিয়েছিলেন এর নির্মাতারা। আর এভাবেই ছবি আর ক্যাপশনের মধ্যে অসংখ্য উপায়ে যোগসূত্র টানতে শিখেছিল এআইটি।
এটাই স্টেবল ডিফিউশনের ‘শিল্প জ্ঞানের আধার’; যার সিংহভাগ একা একজন মানষের বোধগম্য হওয়া সম্ভব নয়। একজন শিল্পকলার ভক্ত দর্শক হয়ত ছবিতে ‘মডার্নিজম’-এর চিহ্ন দেখবেন বা রঙের মোটা দাগ দেখে কোনো শিল্পীর শিল্পকর্মের সঙ্গে যোগসূত্র টানবেন; কিন্তু এআই কেবল এক-দুটি যোগসূত্র দেখে না; বরং এমন অসংখ্য যোগসূত্র দেখে।
আর এর সব আসে জটিল গাণিতিক হিসাব থেকে; যে হিসাবের সংখ্যাগুলো এসেছে অসংখ্য ছবি আর টেক্সট বিশ্লেষণ করে। এআই টেক্সট এবং ছবি দুটোই বিশ্লেষণ করে খুঁটিনাটি তথ্য সংগ্রহ করে বলেই অর্থবহ নির্দেশনার ভিত্তিতে অসংখ্যা সম্ভাব্য আউটপুট থেকে কয়েকটি নির্দিষ্ট ফলাফল বেছে নিয়ে মানুষকে দেখাতে পারে।
এক্ষেত্রে নির্দিষ্ট কোনো সূত্রের নাম, শিল্পকর্মের ধরন, সময়, এমনকি ওয়েবসাইটের নাম উল্লেখ করে দিলেও এআইয়ের কাজ অনেক সহজ হয়ে যায়; নির্দেশনার কাছাকাছি ছবি বানিয়ে দেখাতে পারে এআই। তাই, বহুল পরিচিতি শিল্প শৈলি বা নির্দিষ্ট কোনো শিল্পীর সৃজনশীলতার ছাপ হরহামেশাই চলে আসে এআইয়ের তৈরি ছবিতে।
লেনসা কেন গুরুত্ব পাচ্ছে?
স্টেবল ডিফিউশনের মূল প্ল্যাটফর্মের সঙ্গে লেনসার পার্থক্য হচ্ছে, স্টেবল ডিফিউশন লিখে দেওয়া নির্দেশনার ভিত্তিতে ছবি বানালেও লেনসা ছবি বানায় ব্যবহারকারীর আপলোড করা ছবি বিশ্লেষণ করে। ‘টেক্সুয়াল ইনভার্সশন’ প্রক্রিয়াকে সহজ করতে পারা লেনসার সবচেয়ে বড় উদ্ভাবনী কাজগুলোর একটি ছিল বলে মন্তব্য করেছে সায়েন্স অ্যালার্ট।
ব্যবহারকারীর ছবি নিয়ে স্টেবল ডিফিউশনের বিদ্যমান ডেটাবেইজে সরবরাহ করে লেনসা; এর মধ্যে ছবি থেকে ব্যবহারকারীর মুখের খুঁটিনাটি নানা বৈশিষ্ট কীভাবে চিহ্নিত করতে হবে, সেটাও স্টেবল ডিফউশনের ডিপ লার্নিং মডেলকে শিখিয়ে দেয় অ্যাপটি।
স্টেবল ডিফিউশনের মূল প্ল্যাটফর্মেও সরাসরি এ কাজটি করার সুযোগ আছে; তবে, তা বেশ জটিল প্রক্রিয়া।
লেনসায় নিজের প্রয়োজন মতো নির্দিষ্ট কোনো ধাঁচের ছবি বানানোর সুযোগ নেই; কিন্তু এর বিপরীত দিক হচ্ছে, ব্যবহারকারী এতো বৈচিত্রময় ছবি পান যাতে চমকে যাওয়ার সুযোগই বেশি। এই ছবিগুলো অন্যান্য শিল্পীর শিল্পকর্ম থেকে সৃজনশীল ভাবনা ধার করলেও সরাসরি কোনো কিছু চুরি করে না।
এমনকি অস্ট্রেলিয়ার কপিরাইট আইনেও স্পষ্ট বলা আছে; একক শিল্পকর্মের ওপর কপিরাইট থাকতে পারে; কিন্তু শিল্প শৈলির ওপর এবং ভাবনার ওপর কারও কপিরাইট হতে পারে না।
শিল্পীর কী হবে?
কিন্তু আঁকার ধরন আর কৌশলগুলো যে এত সহজেই এআই নকল করতে পারছে– এ বিষয়গুলো নিয়েই খেপেছেন শিল্পীরা। লেনসার মতো প্রযুক্তি মূল ধারায় যতোই গ্রহণযোগ্যতা পাচ্ছে, ততোই তাদের অসহায়ত্বের সুযোগ নেওয়া হচ্ছে বলে ভাবছেন শিল্পীরা। এ পরিস্থিতিতে কপিরাইট আইনে বড় পরিবর্তনের দাবি উঠলেও তাতে অবাক হওয়ার কিছু থাকবে না।
বিশেষ করে ছোট পরিসরে ডিজিটাল ইলাস্ট্রেশন বানিয়ে জীবিকা নির্বাহ করেন যে শিল্পীরা, তাদের জন্য ভবিষ্যৎ অনেক বেশি অনিশ্চিত বলে লিখেছে সায়েন্স অ্যালার্ট।
তবে এখানে খেয়াল রাখার বিষয় হচ্ছে, এআই শিল্পকর্ম তৈরি একেবারেই সহজ হলেও, নির্দিষ্ট কোনো ভাবনার দৃশ্যায়ন চাইলে সেখানেই বিপত্তি। এআইকে মূল বিষয় এবং পারিপার্শিক খুঁটিনাটি বাতলে দিলেও, ব্যবহারকারী ঠিক যা ভাবছেন, এআই যে ঠিক সেটাই বানিয়ে দেখাতে পারবে না, তা একশ ভাগ নিশ্চিত।
তবে, দৃশ্যপটে এআই প্রযুক্তির কেবল অভিষেক হয়েছে। সামনের এক দশকে এক্ষেত্রে আরও অনেক পরিবর্তন আসবে; শিল্পের স্রষ্টা আর ভোক্তা উভয়ের জন্যই নতুন অনেক কিছু অপেক্ষা করছে সামনের দিনগুলোতে।