Microsoft VALL-E: ৩ সেকেন্ডে কপি হবে আপনার কন্ঠসর, মাইক্রোসফটের নতুন আবিষ্কার নিয়ে বিতর্ক
এই পৃথিবীতে সবথেকে কঠিন কাজ হল মানুষ চেনা। অনেক সময় বহুদিন ধরে পাশে থাকা কাছের মানুষটিকেও যেন অচেনা মনে হয়। সেক্ষেত্রে...এই পৃথিবীতে সবথেকে কঠিন কাজ হল মানুষ চেনা। অনেক সময় বহুদিন ধরে পাশে থাকা কাছের মানুষটিকেও যেন অচেনা মনে হয়। সেক্ষেত্রে আপাতদৃষ্টিতে কোনো ব্যক্তিকে তার মুখ দেখেই শনাক্ত করা যায়। তবে মুখের পাশাপাশি অন্য যে জিনিসটি কোনো মানুষকে চিনতে সাহায্য করে, তা হল তার কণ্ঠস্বর। এই কারণেই বিশ্বের তাবড় তাবড় কিছু ব্যক্তিত্বের গলার স্বর একেবারে জগদ্বিখ্যাত। অনেকেই মনে করেন যে, প্রতিটি মানুষের কণ্ঠস্বরই অনন্য, তাই এটির মাধ্যমে খুব সহজেই যে কাউকে চেনা সম্ভব। তবে আপনারা কি জানেন যে, একটি বিশেষ প্রযুক্তির সাহায্যে অতি অনায়াসে যে-কোনো ব্যক্তির গলার স্বরকে কপি (অনুলিপি) করা যায়? আজ্ঞে হ্যাঁ, ঠিকই বলছি; একটি বিশেষ টেকনোলজির সহায়তায় মাত্র তিন সেকেন্ডের অডিও ক্লিপের সাহায্যে যে-কারোর ভয়েস অনুলিপি করা যেতে পারে। আর্টিফিশিয়াল ইন্টেলিজেন্স বা এআই (AI)-এর সাথে সম্পর্কিত একটি প্রযুক্তির দৌলতে এই অসম্ভবকে সম্ভব করে ফেলা যায়৷
মাত্র ৩ সেকেন্ডে হুবহু কপি হয়ে যাবে যে কারোর ভয়েস, মার্কেটে এসে গেল এই চমকপ্রদ টেকনোলজি
উল্লেখ্য যে, বর্তমান ডিজিটাল যুগে অত্যাধুনিক প্রযুক্তিকে হাতিয়ার করে বিভিন্ন চমকপ্রদ প্রোডাক্ট তৈরি করার জন্য আর্টিফিশিয়াল ইন্টেলিজেন্স ব্যাপকভাবে ব্যবহৃত হচ্ছে। নতুন নতুন নানারকম অসাধারণ জিনিস তৈরি করার জন্য বিশ্বের সর্বত্র এই টেকনোলজিকে নিয়ে ক্রমাগত পরীক্ষা-নিরীক্ষা চালিয়ে যাচ্ছেন বিশেষজ্ঞরা। সেক্ষেত্রে হালফিলে জনপ্রিয় সফটওয়্যার কোম্পানি মাইক্রোসফট (Microsoft) এটির সহায়তায় একটি নতুন VALL-E প্রযুক্তি তৈরি করেছে, যার অপব্যবহারের ভয় এখন আপামর জনসাধারণকে তাড়া করে বেড়াচ্ছে। জানা গিয়েছে যে, মাইক্রোসফটের এই এআই প্রযুক্তি মাত্র ৩ সেকেন্ডে যে কারোর ভয়েস কপি করতে পারে, যেটিকে পরবর্তীতে যে-কোনো উদ্দেশ্যে ব্যবহার করা যাবে।
সবচেয়ে বড়ো কথা হল, VALL-E শুধুমাত্র একটি ভয়েসই কপি করে না, বরং সেই ভয়েসে বিভিন্ন আবেগও যুক্ত করার ক্ষমতা রাখে। ফলে আচমকা এই প্রযুক্তি মারফত নির্মিত অডিও ক্লিপ শুনলে যে কেউ ভাববেন যে, নিশ্চয়ই কোনো ব্যক্তি কথা বলছেন; যদিও আদতে ব্যাপারটি একেবারেই তা নয়। অর্থাৎ, ইউজাররা পরিচিত কারোর কণ্ঠস্বরকে কাজে লাগিয়ে এই প্রযুক্তির সাহায্যে অনায়াসেই যে কাউকে প্রতারণা করতে পারেন। সেক্ষেত্রে এই চমকপ্রদ টেকনোলজির অপব্যবহারের দরুন বর্তমান ডিজিটাল যুগে যে-কোনো সময়ে বড়োসড়ো বিপদের সম্মুখীন হতে পারেন আপামর জনগণ।
কীভাবে কাজ করে Microsoft-এর VALL-E?
কারোর ভয়েস কপি করার জন্য এআই টুল VALL-E -এর শুধুমাত্র ৩ সেকেন্ডের একটি অডিও ক্লিপের প্রয়োজন পড়ে। অর্থাৎ, কারোর ভয়েস তিন সেকেন্ড শোনার পরেই সেটিকে কপি করে ফেলতে পারে এই টুল। উল্লেখ্য, এই টুলটিকে প্রায় ৬০,০০০ ঘণ্টা ইংরেজি স্পিচ ডেটার সাহায্যে প্রশিক্ষিত করা হয়েছে, যার দৌলতে এটি খুব সহজেই অডিও কন্টেন্ট তৈরি করতে পারে।
আপনাদেরকে জানিয়ে রাখি, VALL-E -এর সাহায্যে তৈরি করা কিছু অডিও স্যাম্পেলকে হালফিলে Github-এ শেয়ার করা হয়েছে। বহু সংখ্যক ইউজার একেবারে হলফ করে জানিয়েছেন যে, এই টেকনোলজির সাহায্যে কারোর ভয়েস কপি করা হলে ঘুনাক্ষরেও টের পাওয়া যাবে না যে, সেটি আদতে কোনো ব্যক্তির কণ্ঠস্বর নয়। ফলে এটির অপব্যবহার অতি অনায়াসেই করা যেতে পারে। তবে কেউ যাতে অসৎ উদ্দেশ্যে এই প্রযুক্তিকে ব্যবহার না করে, তার জন্য বিশেষ কার্যকর পদক্ষেপ গ্রহণ করার পরিকল্পনা করেছে Microsoft। উপরন্তু, ভবিষ্যতে এই টেকনোলজিকে যাতে আরও উন্নত করে তোলা যায়, তার জন্য সংস্থাটি বর্তমানে জোরকদমে কাজ চালিয়ে যাচ্ছে।