Microsoft VALL-E: ৩ সেকেন্ডে কপি হবে আপনার কন্ঠসর, মাইক্রোসফটের নতুন আবিষ্কার নিয়ে বিতর্ক

এই পৃথিবীতে সবথেকে কঠিন কাজ হল মানুষ চেনা। অনেক সময় বহুদিন ধরে পাশে থাকা কাছের মানুষটিকেও যেন অচেনা মনে হয়। সেক্ষেত্রে...
techgup 11 Jan 2023 1:53 PM IST

এই পৃথিবীতে সবথেকে কঠিন কাজ হল মানুষ চেনা। অনেক সময় বহুদিন ধরে পাশে থাকা কাছের মানুষটিকেও যেন অচেনা মনে হয়। সেক্ষেত্রে আপাতদৃষ্টিতে কোনো ব্যক্তিকে তার মুখ দেখেই শনাক্ত করা যায়। তবে মুখের পাশাপাশি অন্য যে জিনিসটি কোনো মানুষকে চিনতে সাহায্য করে, তা হল তার কণ্ঠস্বর। এই কারণেই বিশ্বের তাবড় তাবড় কিছু ব্যক্তিত্বের গলার স্বর একেবারে জগদ্বিখ্যাত। অনেকেই মনে করেন যে, প্রতিটি মানুষের কণ্ঠস্বরই অনন্য, তাই এটির মাধ্যমে খুব সহজেই যে কাউকে চেনা সম্ভব। তবে আপনারা কি জানেন যে, একটি বিশেষ প্রযুক্তির সাহায্যে অতি অনায়াসে যে-কোনো ব্যক্তির গলার স্বরকে কপি (অনুলিপি) করা যায়? আজ্ঞে হ্যাঁ, ঠিকই বলছি; একটি বিশেষ টেকনোলজির সহায়তায় মাত্র তিন সেকেন্ডের অডিও ক্লিপের সাহায্যে যে-কারোর ভয়েস অনুলিপি করা যেতে পারে। আর্টিফিশিয়াল ইন্টেলিজেন্স বা এআই (AI)-এর সাথে সম্পর্কিত একটি প্রযুক্তির দৌলতে এই অসম্ভবকে সম্ভব করে ফেলা যায়৷

মাত্র ৩ সেকেন্ডে হুবহু কপি হয়ে যাবে যে কারোর ভয়েস, মার্কেটে এসে গেল এই চমকপ্রদ টেকনোলজি

উল্লেখ্য যে, বর্তমান ডিজিটাল যুগে অত্যাধুনিক প্রযুক্তিকে হাতিয়ার করে বিভিন্ন চমকপ্রদ প্রোডাক্ট তৈরি করার জন্য আর্টিফিশিয়াল ইন্টেলিজেন্স ব্যাপকভাবে ব্যবহৃত হচ্ছে। নতুন নতুন নানারকম অসাধারণ জিনিস তৈরি করার জন্য বিশ্বের সর্বত্র এই টেকনোলজিকে নিয়ে ক্রমাগত পরীক্ষা-নিরীক্ষা চালিয়ে যাচ্ছেন বিশেষজ্ঞরা। সেক্ষেত্রে হালফিলে জনপ্রিয় সফটওয়্যার কোম্পানি মাইক্রোসফট (Microsoft) এটির সহায়তায় একটি নতুন VALL-E প্রযুক্তি তৈরি করেছে, যার অপব্যবহারের ভয় এখন আপামর জনসাধারণকে তাড়া করে বেড়াচ্ছে। জানা গিয়েছে যে, মাইক্রোসফটের এই এআই প্রযুক্তি মাত্র ৩ সেকেন্ডে যে কারোর ভয়েস কপি করতে পারে, যেটিকে পরবর্তীতে যে-কোনো উদ্দেশ্যে ব্যবহার করা যাবে।

সবচেয়ে বড়ো কথা হল, VALL-E শুধুমাত্র একটি ভয়েসই কপি করে না, বরং সেই ভয়েসে বিভিন্ন আবেগও যুক্ত করার ক্ষমতা রাখে। ফলে আচমকা এই প্রযুক্তি মারফত নির্মিত অডিও ক্লিপ শুনলে যে কেউ ভাববেন যে, নিশ্চয়ই কোনো ব্যক্তি কথা বলছেন; যদিও আদতে ব্যাপারটি একেবারেই তা নয়। অর্থাৎ, ইউজাররা পরিচিত কারোর কণ্ঠস্বরকে কাজে লাগিয়ে এই প্রযুক্তির সাহায্যে অনায়াসেই যে কাউকে প্রতারণা করতে পারেন। সেক্ষেত্রে এই চমকপ্রদ টেকনোলজির অপব্যবহারের দরুন বর্তমান ডিজিটাল যুগে যে-কোনো সময়ে বড়োসড়ো বিপদের সম্মুখীন হতে পারেন আপামর জনগণ।

কীভাবে কাজ করে Microsoft-এর VALL-E?

কারোর ভয়েস কপি করার জন্য এআই টুল VALL-E -এর শুধুমাত্র ৩ সেকেন্ডের একটি অডিও ক্লিপের প্রয়োজন পড়ে। অর্থাৎ, কারোর ভয়েস তিন সেকেন্ড শোনার পরেই সেটিকে কপি করে ফেলতে পারে এই টুল। উল্লেখ্য, এই টুলটিকে প্রায় ৬০,০০০ ঘণ্টা ইংরেজি স্পিচ ডেটার সাহায্যে প্রশিক্ষিত করা হয়েছে, যার দৌলতে এটি খুব সহজেই অডিও কন্টেন্ট তৈরি করতে পারে।

https://youtu.be/uEZDVsEj5Ew

আপনাদেরকে জানিয়ে রাখি, VALL-E -এর সাহায্যে তৈরি করা কিছু অডিও স্যাম্পেলকে হালফিলে Github-এ শেয়ার করা হয়েছে। বহু সংখ্যক ইউজার একেবারে হলফ করে জানিয়েছেন যে, এই টেকনোলজির সাহায্যে কারোর ভয়েস কপি করা হলে ঘুনাক্ষরেও টের পাওয়া যাবে না যে, সেটি আদতে কোনো ব্যক্তির কণ্ঠস্বর নয়। ফলে এটির অপব্যবহার অতি অনায়াসেই করা যেতে পারে। তবে কেউ যাতে অসৎ উদ্দেশ্যে এই প্রযুক্তিকে ব্যবহার না করে, তার জন্য বিশেষ কার্যকর পদক্ষেপ গ্রহণ করার পরিকল্পনা করেছে Microsoft। উপরন্তু, ভবিষ্যতে এই টেকনোলজিকে যাতে আরও উন্নত করে তোলা যায়, তার জন্য সংস্থাটি বর্তমানে জোরকদমে কাজ চালিয়ে যাচ্ছে।

Show Full Article
Next Story