Microsoft VALL-E: ৩ সেকেন্ডে কপি হবে আপনার কন্ঠসর, মাইক্রোসফটের নতুন আবিষ্কার নিয়ে বিতর্ক
এই পৃথিবীতে সবথেকে কঠিন কাজ হল মানুষ চেনা। অনেক সময় বহুদিন ধরে পাশে থাকা কাছের মানুষটিকেও যেন অচেনা মনে হয়। সেক্ষেত্রে আপাতদৃষ্টিতে কোনো ব্যক্তিকে তার মুখ দেখেই শনাক্ত করা যায়। তবে মুখের পাশাপাশি অন্য যে জিনিসটি কোনো মানুষকে চিনতে সাহায্য করে, তা হল তার কণ্ঠস্বর। এই কারণেই বিশ্বের তাবড় তাবড় কিছু ব্যক্তিত্বের গলার স্বর একেবারে জগদ্বিখ্যাত। অনেকেই মনে করেন যে, প্রতিটি মানুষের কণ্ঠস্বরই অনন্য, তাই এটির মাধ্যমে খুব সহজেই যে কাউকে চেনা সম্ভব। তবে আপনারা কি জানেন যে, একটি বিশেষ প্রযুক্তির সাহায্যে অতি অনায়াসে যে-কোনো ব্যক্তির গলার স্বরকে কপি (অনুলিপি) করা যায়? আজ্ঞে হ্যাঁ, ঠিকই বলছি; একটি বিশেষ টেকনোলজির সহায়তায় মাত্র তিন সেকেন্ডের অডিও ক্লিপের সাহায্যে যে-কারোর ভয়েস অনুলিপি করা যেতে পারে। আর্টিফিশিয়াল ইন্টেলিজেন্স বা এআই (AI)-এর সাথে সম্পর্কিত একটি প্রযুক্তির দৌলতে এই অসম্ভবকে সম্ভব করে ফেলা যায়৷
মাত্র ৩ সেকেন্ডে হুবহু কপি হয়ে যাবে যে কারোর ভয়েস, মার্কেটে এসে গেল এই চমকপ্রদ টেকনোলজি
উল্লেখ্য যে, বর্তমান ডিজিটাল যুগে অত্যাধুনিক প্রযুক্তিকে হাতিয়ার করে বিভিন্ন চমকপ্রদ প্রোডাক্ট তৈরি করার জন্য আর্টিফিশিয়াল ইন্টেলিজেন্স ব্যাপকভাবে ব্যবহৃত হচ্ছে। নতুন নতুন নানারকম অসাধারণ জিনিস তৈরি করার জন্য বিশ্বের সর্বত্র এই টেকনোলজিকে নিয়ে ক্রমাগত পরীক্ষা-নিরীক্ষা চালিয়ে যাচ্ছেন বিশেষজ্ঞরা। সেক্ষেত্রে হালফিলে জনপ্রিয় সফটওয়্যার কোম্পানি মাইক্রোসফট (Microsoft) এটির সহায়তায় একটি নতুন VALL-E প্রযুক্তি তৈরি করেছে, যার অপব্যবহারের ভয় এখন আপামর জনসাধারণকে তাড়া করে বেড়াচ্ছে। জানা গিয়েছে যে, মাইক্রোসফটের এই এআই প্রযুক্তি মাত্র ৩ সেকেন্ডে যে কারোর ভয়েস কপি করতে পারে, যেটিকে পরবর্তীতে যে-কোনো উদ্দেশ্যে ব্যবহার করা যাবে।
সবচেয়ে বড়ো কথা হল, VALL-E শুধুমাত্র একটি ভয়েসই কপি করে না, বরং সেই ভয়েসে বিভিন্ন আবেগও যুক্ত করার ক্ষমতা রাখে। ফলে আচমকা এই প্রযুক্তি মারফত নির্মিত অডিও ক্লিপ শুনলে যে কেউ ভাববেন যে, নিশ্চয়ই কোনো ব্যক্তি কথা বলছেন; যদিও আদতে ব্যাপারটি একেবারেই তা নয়। অর্থাৎ, ইউজাররা পরিচিত কারোর কণ্ঠস্বরকে কাজে লাগিয়ে এই প্রযুক্তির সাহায্যে অনায়াসেই যে কাউকে প্রতারণা করতে পারেন। সেক্ষেত্রে এই চমকপ্রদ টেকনোলজির অপব্যবহারের দরুন বর্তমান ডিজিটাল যুগে যে-কোনো সময়ে বড়োসড়ো বিপদের সম্মুখীন হতে পারেন আপামর জনগণ।
কীভাবে কাজ করে Microsoft-এর VALL-E?
কারোর ভয়েস কপি করার জন্য এআই টুল VALL-E -এর শুধুমাত্র ৩ সেকেন্ডের একটি অডিও ক্লিপের প্রয়োজন পড়ে। অর্থাৎ, কারোর ভয়েস তিন সেকেন্ড শোনার পরেই সেটিকে কপি করে ফেলতে পারে এই টুল। উল্লেখ্য, এই টুলটিকে প্রায় ৬০,০০০ ঘণ্টা ইংরেজি স্পিচ ডেটার সাহায্যে প্রশিক্ষিত করা হয়েছে, যার দৌলতে এটি খুব সহজেই অডিও কন্টেন্ট তৈরি করতে পারে।
আপনাদেরকে জানিয়ে রাখি, VALL-E -এর সাহায্যে তৈরি করা কিছু অডিও স্যাম্পেলকে হালফিলে Github-এ শেয়ার করা হয়েছে। বহু সংখ্যক ইউজার একেবারে হলফ করে জানিয়েছেন যে, এই টেকনোলজির সাহায্যে কারোর ভয়েস কপি করা হলে ঘুনাক্ষরেও টের পাওয়া যাবে না যে, সেটি আদতে কোনো ব্যক্তির কণ্ঠস্বর নয়। ফলে এটির অপব্যবহার অতি অনায়াসেই করা যেতে পারে। তবে কেউ যাতে অসৎ উদ্দেশ্যে এই প্রযুক্তিকে ব্যবহার না করে, তার জন্য বিশেষ কার্যকর পদক্ষেপ গ্রহণ করার পরিকল্পনা করেছে Microsoft। উপরন্তু, ভবিষ্যতে এই টেকনোলজিকে যাতে আরও উন্নত করে তোলা যায়, তার জন্য সংস্থাটি বর্তমানে জোরকদমে কাজ চালিয়ে যাচ্ছে।