Google Veo: ভিডিও এডিটের সবচেয়ে সেরা এআই টুল আনল গুগল
Google তাদের বার্ষিকী 'Google I/O' ডেভেলপার কনফারেন্স চলাকালীন Veo এবং Imagen 3 নামের নতুন AI ভিডিও এবং ইমেজ জেনারেটরের...Google তাদের বার্ষিকী 'Google I/O' ডেভেলপার কনফারেন্স চলাকালীন Veo এবং Imagen 3 নামের নতুন AI ভিডিও এবং ইমেজ জেনারেটরের ঘোষণা করেছে। মূলত AI ভবিষ্যতে কিরকম প্রভাব ফেলতে পারে তার আভাস দিতেই টেক জায়ান্টটি ইভেন্টে এই প্রযুক্তি ঘোষণার উপর অধিক প্রাধান্য দিয়েছে। Google Veo এবং Imagen 3 উভয়ই হল জেনারেটিভ AI টুল। যার মধ্যে Veo টেক্সট প্রম্পট থেকে ভিডিও তৈরি করতে ব্যবহার করা যাবে। আবার Imagen 3 -কে সংস্থার সবচেয়ে অত্যাধুনিক 'টেক্সট-টু-ইমেজ' মডেল হিসাবে লঞ্চ করা হয়েছে।
এবিষয়ে গুগল মন্তব্য করেছে যে - "গত এক বছরের মধ্যে আমরা জেনারেটিভ মিডিয়া প্রযুক্তির গুণমান বৃদ্ধির ক্ষেত্রে অবিশ্বাস্য অগ্রগতি দেখেছি। এর জন্য আমরা ক্রিয়েটিভ কমিউনিটির সাথে ঘনিষ্ঠভাবে কাজ চালিয়ে গিয়েছি, যাতে জেনারেটিভ এআই কীভাবে সৃজনশীল প্রক্রিয়াকে সর্বোত্তমভাবে সমর্থন করতে পারে তা অন্বেষণ করতে পারি। পাশাপাশি আমাদের বিকশিত AI টুলগুলি বিভিন্ন ক্ষেত্রে কার্যকরী ভূমিকা পালন করছে কিনা তাও নিশ্চিত করেছি। আজ আমরা আমাদের সর্বশেষ তথা সবচেয়ে উন্নত ভিডিও জেনারেশন মডেল Veo এবং সর্বোচ্চ মানের টেক্সট-টু-ইমেজ মডেল Imagen 3 -এর সাথে হাজির হয়ে গেছি। এক্ষেত্রে আমরা চলচ্চিত্র নির্মাতা ডোনাল্ড গ্লোভার এবং তার ক্রিয়েরিভ স্টুডিও 'গিলগা' -এর সাথে অংশীদারিত্বের তৈরী প্রজেক্ট শেয়ার করেছি। শিল্পী উইক্লেফ জিন, মার্ক রিবিলেট এবং গীতিকার জাস্টিন ট্রান্টারের দ্বারা প্রকাশিত নতুন ডেমো রেকর্ডিং আমাদের মিউজিক এআই স্যান্ডবক্সের সহায়তায় তৈরি হয়েছে।"
'Veo' ভিডিও জেনারেশন মডেল :
গুগল -এর দাবি অনুসারে, এতদিন লঞ্চ করা ভিডিও জেনারেশন মডেলগুলির মধ্যে Veo সবচেয়ে উন্নত। এটি বিভিন্ন স্টাইল বা শৈলীতে ১০৮০ পিক্সেলের হাই-রেজোলিউশনে ভিডিও তৈরি করতে সক্ষম। এই এআই প্রযুক্তি - 'টাইমল্যাপস', 'এরিয়াল শট' -এর মতো সিনেম্যাটিক কনসেপ্ট অনুধাবন করতে পারে। আবার এটি এমন ভিডিও তৈরি করার অনুমতি দেয়, যা একজন চলচ্চিত্র নির্মাতার দৃষ্টিভঙ্গি হুবহু অনুসরণ করে। উদাহরণস্বরূপ, গুগল হালফিলে বিখ্যাত চলচ্চিত্র নির্মাতা ডোনাল্ড গ্লোভারের সাথে হাত মিলিয়ে তার ক্রিয়েটিভ স্টুডিও 'গিলগা' -এ নির্মিত একটি প্রজেক্ট শেয়ার করেছিল। যা প্রমান করে দিয়েছে, Veo পেশাদারি মানের চলচ্চিত্র নির্মাণে কতটা পারদর্শী।
'Imagen 3' টেক্সট-টু-ইমেজ মডেল :
Imagen 3 প্রযুক্তি টেক্সটের মাধ্যমে নির্দেশ পেয়ে উচ্চ মানের ছবি তৈরি করতে পারে। গুগল দাবি করেছে যে, এই 'টেক্সট-টু-ইমেজ' মডেলটি উল্লেখযোগ্য লিপ ফরোয়ার্ডের সুবিধা প্রদান করে, যা জটিল বিবরণ এবং ন্যূনতম ভিজ্যুয়াল ডিস্ট্রাকশন সহ বাস্তবসম্মত ছবি তৈরিতে সাহায্য করে। জানা গেছে, Imagen 3 টেক্সট প্রম্পটের সূক্ষ্মতা বুঝতে এবং ব্যাখ্যা করতে পারদর্শী। যেকারণে এটি ব্যবহারকারী প্রদত্ত বিবরণের সাথে মেলে এমন হুবহু চিত্র তৈরি করতে পারে। আবার Imagen 3 মডেলের বর্ধিত টেক্সট রেন্ডারিং ফিচার এর উপযোগিতাকে আরো প্রসারিত করে। পাশাপাশি পার্সোনালাইজড মেসেজিং অভিজ্ঞতা এবং পেশাদারি উপস্থাপনার গুণাবলীও উন্নত করে।
গুগল, আজ থেকে Imagen 3 মডেলের জন্য ইমেজএফএক্স (ImageFX) -এ একটি ব্যক্তিগত প্রিভিউ ইভেন্টের আয়োজন করছে। যেখানে নির্বাচিত ক্রিয়েটারদের যোগদানের জন্য আহ্বান করা হচ্ছে। Imagen 3 শীঘ্রই ভারটেক্সএআই (Vertex AI) -তে আসবে বলে আস্বস্ত করেছে টেক জায়ান্টটি।