হোম > প্রযুক্তি

লেখা থেকে ভিডিও তৈরির নতুন এআই মডেল ‘সোরা’

টেক্সট থেকে ভিডিও তৈরির নতুন মডেল ‘সোরা’ উন্মোচন করল চ্যাটজিপিটি ও ডাল–ই র নির্মাতা কোম্পানি ওপেনএআই। কৃত্রিম বুদ্ধিমত্তাভিত্তিক (এআই) এই মডেল টেক্সটের নির্দেশনা অনুযায়ী এক মিনিট দৈর্ঘ্যের ভিডিও তৈরি করে দিতে পারবে। সেই সঙ্গে ভিডিওগুলোতে বিভিন্ন নিখুঁত দৃশ্য ও একাধিক চরিত্র যুক্ত করা যাবে। 

মডেলটির ত্রুটি ও সমস্যা খুঁজে বের করতে পরীক্ষা–নিরীক্ষা করেছেন ডেভেলপার বা প্রযুক্তি বিশেষজ্ঞরা। এক ঘোষণায় ওপেনএআই বলেছে, বর্তমানে মডেলটি শুধু নির্দিষ্ট ভিজ্যুয়াল আর্টিস্ট, ডিজাইনার ও চলচ্চিত্র নির্মাতারা ব্যবহার করতে পারবেন। সৃজনশীল পেশাদারদের জন্য মডেলটিকে কীভাবে উন্নত করা যায় সেই সম্পর্কে প্রতিক্রিয়া জানতে এই পদক্ষেপ নেওয়া হয়েছে। 

২০২২ সালের নভেম্বরে চ্যাটজিপিটি চালু করার পর থেকে ওপেনএআই খুব দ্রুত নতুন নতুন এআই বা কৃত্রিম বুদ্ধিমত্তাভিত্তিক টুল নিয়ে হাজির হচ্ছে। ভয়েস ও ইমেজ তৈরির টুল জিপিটি ৪ এবং ডাল–ই ৩ মডেলও নিয়ে আসা হয়েছে। 

এআই শিল্পে অনেক বড় প্রভাব ফেলেছে ওপেনএআইয়ের অ্যাপ্লিকেশন প্রোগ্রামিং ইন্টারফেস বা এপিআই। এর মাধ্যমে বিভিন্ন কোম্পানি ও ডেভেলপাররা নিজস্ব জেনারেটিভ এআই টুল তৈরি করতে পারছে। আর ভিডিও তৈরির ক্ষেত্রে ওপেনএআইয়ের নতুন এই মডেল এআই প্রযুক্তির উন্নয়নে বিশাল ভূমিকা রাখবে। 
 
অনলাইনে বিভিন্ন এআই মডেল পাওয়া যায়। তবে এর মধ্য কোনটিই সোরার মতো বাস্তব ও জটিল ভিডিও তৈরি করতে পারবে না বলে দাবি করছে ওপেনএআই। 

কম দৈর্ঘ্যের ভিডিও তৈরির জন্য মেটার নিজস্ব টুল রয়েছে এবং গুগলের টেক্সট থেকে ভিডিও তৈরির মডেল এখনো গবেষণা পর্যায়ে রয়েছে। 

সোরা উন্মোচনের সময় মডেলটির মাধ্যমে তৈরি কতগুলো ভিডিও প্রকাশ করে ওপেনএআই। একটি ভিডিওতে দেখা যায়, ঊনবিংশ শতকের গোল্ড রাশ যুগে যুক্তরাষ্ট্রের ক্যালিফোর্নিয়া অঙ্গরাজ্যের ‘ঐতিহাসিক’ ফুটেজ। আরেক ভিডিওতে দেখা যায়, একটি এসইউভি মডেলের গাড়ি আঁকাবাঁকা পাহাড়ি রাস্তায় চলছে। 

আসল ও এআইভিত্তিক ভিডিওয়ের মধ্যে পার্থক্য বোঝার জন্য ওপেনএআই লেবেল করার টুলও তৈরি করা হবে। অনুপযুক্ত ও ক্ষতিকর কনটেন্ট তৈরির নির্দেশনা বন্ধে দেওয়ার জন্য ডাল–ই এর মতো সুরক্ষা কৌশলও নেওয়া হবে। 

ওপেনএআই বলছে, নতুন প্রযুক্তিটির ইতিবাচক ব্যবহার ও উদ্বেগগুলো বোঝার জন্য মডেলটির উন্নয়নে বিশ্বব্যাপী নীতিনির্ধারক, শিক্ষাবিদ এবং শিল্পীদের জড়িত করা হয়েছে। বাস্তব জগতে এর ব্যবহার থেকে শেখা এবং সময়ের সঙ্গে সঙ্গে নিরাপদ এআই সিস্টেম তৈরি ও উন্মোচনের জন্য বাস্তব জগতে মডেলটি কীভাবে ব্যবহার করা তা জানা গুরুত্বপূর্ণ। 

তথ্যসুত্র: ম্যাশাবল

গুগলের নতুন ফিচার: সাধারণ হেডফোনই হবে রিয়েল–টাইম অনুবাদক

ডিজিটাল উদ্যোক্তা প্রকল্প: পাঁচ বছরে অর্ধেক কাজ, ব্যয় বাড়ল ১৭৮ কোটি

যুক্তরাষ্ট্রে মাকে হত্যার পর ছেলের আত্মহত্যা, চ্যাটজিপিটির বিরুদ্ধে অভিযোগ পরিবারের

মিসড কল মেসেজ ও ছবি থেকে অ্যানিমেশনসহ যেসব ফিচার আনল হোয়াটসঅ্যাপ

অস্ট্রেলিয়ায় ২ লাখ অ্যাকাউন্ট বন্ধ: ‘এটা কাজ করছে না ব্রো’— প্রধানমন্ত্রীকে কটাক্ষ জেন-জি’দের

সকালে ঘুম ভেঙে অস্ট্রেলিয়ার লাখো শিশু দেখবে তাদের ‘আইডি’ উধাও

ভারতে ১৭.৫ বিলিয়ন ডলার বিনিয়োগ করবে মাইক্রোসফট

ব্যবহৃত মোবাইল ফোন আমদানিতে বিটিআরসির ‘না’, কঠোর আন্দোলনের হুঁশিয়ারি মোবাইল ব্যবসায়ীদের

৩০ মিনিটের বেশি সোশ্যাল মিডিয়া ব্যবহার শিশুদের মনোযোগের ক্ষমতা কমায়, বলছে গবেষণা

ট্রাম্পের নতি স্বীকার, এনভিডিয়ার শক্তিশালী এআই চিপ চীনে বিক্রির অনুমতি