হোম > প্রযুক্তি

গুগলের নতুন এআই ভিডিও টুল তৈরি করছে বাস্তবসদৃশ ভিডিও

আজকের পত্রিকা ডেস্ক­

সাধারণত এআই দিয়ে তৈরি ভিডিওগুলোতে যেসব ত্রুটি ধরা পড়ে—ভিও ৩-এ সেগুলোর অনেকটাই অনুপস্থিত। ছবি: গুগল

নতুন এক প্রযুক্তির হাত ধরে বাস্তবতা ও কল্পনার সীমারেখা যেন ধীরে ধীরে মুছে যাচ্ছে। গুগলের নতুন ভিডিও জেনারেটর ভিও ৩ দিয়ে তৈরি কিছু ভিডিও এখন ইন্টারনেটজুড়ে ছড়িয়ে পড়েছে, যেগুলো এতটাই বাস্তব সদৃশ যে অনেক দর্শকই বিভ্রান্ত হয়ে পড়ছেন। ভিডিওগুলো এতটাই বাস্তব যে তা দেখে বিস্ময়ের পাশাপাশি শঙ্কিত হচ্ছেন অনেকেই। বাস্তব আর কৃত্রিমের সীমারেখা কোথায়, তা নিয়ে প্রশ্ন উঠছে।

গত ডিসেম্বরে উন্মুক্ত হওয়া ওপেনএআইয়ের ভিডিও জেনারেটর ‘সোরা’র তুলনায় গুগল ডিপমাইন্ডের ভিও ৩ আরও এক ধাপ এগিয়ে। এতে সংলাপ, সাউন্ডট্র্যাক এবং সাউন্ড ইফেক্ট যোগ করা যায়। জটিল প্রম্পট অনুসরণ করে বিস্তারিত বর্ণনাকে নিখুঁত ভিডিওতে রূপান্তর করতে সক্ষম এই এআই।

ভিডিওগুলো বাস্তব জগতের পদার্থবিজ্ঞান মেনে চলে, ঠোঁটের গতির সঙ্গে সংলাপ মিলে যায়, ধারাবাহিকতায় বিচ্যুতি থাকে না এবং প্রতিটি চরিত্রকে দেওয়া হয় স্বাভাবিক গড়নের। বেশির ভাগ এআই মানুষের আঙুলগুলো ভুলভাবে উপস্থাপন করে। তবে এই অ্যাপটি মানুষের পাঁচটি আঙুল সঠিক ভাবে তুলে ধরে।

গুগল এবং ইন্টারনেট ব্যবহারকারীদের শেয়ার করা উদাহরণগুলো বিশ্লেষণ করলে দেখা যায়, সাধারণত এআই দিয়ে তৈরি ভিডিওগুলোতে যেসব ত্রুটি ধরা পড়ে—ভিও ৩-এ সেগুলোর অনেকটাই অনুপস্থিত।

ভিডিও এডিটিং অ্যাপ এবং ক্যামেরা প্রযুক্তির উন্নতি বহু বছর ধরেই হলিউডকে পাল্টে দিয়েছে। তবে ভিও ৩-এর মতো এআই ভিডিও জেনারেটর চলচ্চিত্র নির্মাতাদের জন্য এক নতুন চ্যালেঞ্জ হয়ে উঠছে।

গুগলের নতুন ভিডিও ‘টুল ফ্লো’-এর প্রোমো ভিডিওতে একাধিক চলচ্চিত্র নির্মাতা ভিও ৩ নিয়ে নিজের অভিজ্ঞতা শেয়ার করেছেন। তাদের ভাষ্যমতে, এআই যেন নিজেই নিজেকে আরও উন্নত করে নিচ্ছে।

পরিচালক ডেভ ক্লার্ক বলেন, ‘এটি এমনভাবে কাজ করছে, যেন নিজেই নিজের ওপর ভিত্তি করে তৈরি হচ্ছে।’

গুগল আই/ও সম্মেলনে ভিও ৩-এর ঘোষণা দেওয়া হয় এবং এখন এটি যুক্তরাষ্ট্রে মাসে ২৪৯ ডলারের গুগল আলট্রা সাবস্ক্রিপশনের অংশ হিসেবে পাওয়া যাচ্ছে।

গুগলের দাবি, ভিও ৩ নির্মাণে তারা নির্মাতাদের সঙ্গে কাজ করেছে এবং কিছু নির্মাতা এই এআই টুলকে ইতিবাচকভাবে গ্রহণ করেছেন। তবে অনলাইনে ভিডিও ছড়িয়ে পড়ায় অনেক ভিডিও পেশাদার এবং শিল্পীরা হতাশ হচ্ছেন।

অনেকেই এআই দিয়ে তৈরি ভিডিওকে নিকৃষ্ট বলে উড়িয়ে দিচ্ছেন। এআই বিশ্লেষক ইথান মোলিকের মতে, এই টুলটি বাণিজ্যিক মার্কেটিং ও মিডিয়ার কাজে কার্যকর হতে পারে।

তবে এখনো স্পষ্ট নয়, গুগল কীভাবে ভিও ৩-কে প্রশিক্ষিত করেছে এবং সেটি এই এআইয়ের সৃজনশীলতাকে কতটা প্রভাবিত করতে পারে।

অনুসন্ধানে দেখা যায়, একজন মানুষকে দিয়ে স্ট্যান্ড-আপ কমেডি ভিডিও বানাতে বললে ভিও ৩ একাধিক ব্যবহারকারীর জন্য একই রসিকতা তৈরি করেছে।

এমনকি ইউটিউবার মার্কেস ব্রাউনলি গত বছর সোরাকে ‘একজন টেক রিভিউয়ার ডেস্কে বসে আছে’ এমন একটি ভিডিও বানাতে বলেন। সেই ভিডিওতে যে কৃত্রিম গাছ দেখা যায়, তা অবিকল ব্রাউনলির ডেস্কে থাকা গাছের মতো—যা ইঙ্গিত দেয়, হয়তো এই টুলটি তার ভিডিও থেকেই প্রশিক্ষণ পেয়েছে।

তথ্যসূত্র: অ্যাক্সিওস

গুগলের নতুন ফিচার: সাধারণ হেডফোনই হবে রিয়েল–টাইম অনুবাদক

ডিজিটাল উদ্যোক্তা প্রকল্প: পাঁচ বছরে অর্ধেক কাজ, ব্যয় বাড়ল ১৭৮ কোটি

যুক্তরাষ্ট্রে মাকে হত্যার পর ছেলের আত্মহত্যা, চ্যাটজিপিটির বিরুদ্ধে অভিযোগ পরিবারের

মিসড কল মেসেজ ও ছবি থেকে অ্যানিমেশনসহ যেসব ফিচার আনল হোয়াটসঅ্যাপ

অস্ট্রেলিয়ায় ২ লাখ অ্যাকাউন্ট বন্ধ: ‘এটা কাজ করছে না ব্রো’— প্রধানমন্ত্রীকে কটাক্ষ জেন-জি’দের

সকালে ঘুম ভেঙে অস্ট্রেলিয়ার লাখো শিশু দেখবে তাদের ‘আইডি’ উধাও

ভারতে ১৭.৫ বিলিয়ন ডলার বিনিয়োগ করবে মাইক্রোসফট

ব্যবহৃত মোবাইল ফোন আমদানিতে বিটিআরসির ‘না’, কঠোর আন্দোলনের হুঁশিয়ারি মোবাইল ব্যবসায়ীদের

৩০ মিনিটের বেশি সোশ্যাল মিডিয়া ব্যবহার শিশুদের মনোযোগের ক্ষমতা কমায়, বলছে গবেষণা

ট্রাম্পের নতি স্বীকার, এনভিডিয়ার শক্তিশালী এআই চিপ চীনে বিক্রির অনুমতি