হোম > প্রযুক্তি

লেখা থেকে ভিডিও বানাবে মডেল সোরা

সৈকত দে

অবিশ্বাস্য শোনালেও বিষয়টি এখন বাস্তব। স্ক্রিপ্ট বা চিত্রনাট্য লিখে দিলে সোরা এআই মডেল তা নিয়ে ভিডিও তৈরি করে দিতে পারে। ঠিকঠাক চিত্রনাট্য লিখতে পারলে সোরা কি তবে পুরো সিনেমা বানিয়ে দেবে? তখন পরিচালক হিসেবে কার নাম থাকবে? কৌতুক সরিয়ে রেখে আমরা ওপেন ডটকমের একটি প্রতিবেদন অবলম্বনে সোরাকে আরেকটু ভালো করে চেনার চেষ্টা করি। 

আর্টিফিশিয়াল ইন্টেলিজেন্স যাতে বাস্তব দুনিয়াকে তার গতিসমেত বুঝে উঠতে পারে, সে জন্য বহুদিন ধরে বিভিন্ন মডেলকে শিখিয়ে-পড়িয়ে নেওয়া হচ্ছিল। বাস্তবিক পৃথিবীর সঙ্গে সম্পর্কিত সমস্যাগুলো মানুষকে বুঝতে সাহায্য করবে এআই—এটিই একমাত্র উদ্দেশ্য।

ব্যবহারকারীর নির্দেশনা অনুযায়ী ভিজ্যুয়াল কোয়ালিটি ঠিক রেখে সোরা এক মিনিট পর্যন্ত ভিডিও তৈরিতে সক্ষম। সাইবার নিরাপত্তা সংস্থা রেড ট্রিমার্স এখন অনলাইনে বিশেষ ক্ষতিকর বা ঝুঁকিপূর্ণ অঞ্চলগুলো সোরার সাহায্যে পরীক্ষা করছে। ওপেন এআই অসংখ্য ভিজ্যুয়াল আর্টিস্ট, ডিজাইনার ও চলচ্চিত্র নির্মাতাকে তাদের এআই সিস্টেমে প্রবেশ করতে দিচ্ছে ফিডব্যাকের আশায়। সৃজনশীল মানুষের এসব মতামত আরও কার্যকর মডেল প্রস্তুতে সাহায্য করবে বলে তাদের ধারণা। 

নিজেদের প্রতিষ্ঠানের বাইরের মানুষের সঙ্গেও গবেষণার অগ্রগতি ভাগ করে নেওয়া হচ্ছে। এআই প্রযুক্তিক্ষমতা সম্পর্কে জানাতেই এ ব্যবস্থা নেওয়া হয়েছে। সোরা একাধিক চরিত্রকে যুক্ত করে জটিল দৃশ্য নির্মাণ করতে পারে। নির্দিষ্ট ধরনের গতি, বিষয়ের নিখুঁত ডিটেইলিং এবং প্রেক্ষাপটের স্পষ্ট উপস্থাপনায় রয়েছে তার বিশেষ দক্ষতা। 

সোরা গভীরভাবে ভাষা বোঝার পাশাপাশি ব্যবহারকারীদের নির্দেশনাও বোঝে। একটিমাত্র জেনারেটর ভিডিও থেকে সোরা চরিত্র, ভিজ্যুয়াল স্টাইলনির্ভর একাধিক দৃশ্য নির্মাণ করতে পারে। এখনকার মডেল অবশ্য ফিজিকসের কিছু সূত্র নিয়ে জটিলতায় ভুগছে। কার্যকারণ বুঝতে সোরার সমস্যা হচ্ছে। যেমন দেখা গেল, কেউ বিস্কুট খাচ্ছে। কিন্তু বিস্কুটে হয়তো কামড়ের দাগ নেই। ডান-বাম জ্ঞান, দূরত্বের ধারণা—এসব তার এখনো হয়ে ওঠেনি। 

রেড ট্রিমার্স অনলাইন স্পেসে ভুল তথ্য, হেটফুল কনটেন্ট এবং পক্ষপাতমূলক সংবাদ চিহ্নিতকরণে কাজ করছে এআইয়ের সাহায্যে। সি টু পি এ মেটাডেটা যুক্ত করা হবে যদি ভবিষ্যতে সোরা ওপেন এআই পণ্য হিসেবে বিবেচিত হয়। ডাল ডট ই থ্রি যুক্ত হবে সোরা মডেলে। সেফটি টুল হিসেবে ওপেন এআই অন্যান্য পণ্যে ব্যবহার করে সুফল পাওয়া গেছে। 

অবশ্য টেক্সট ক্ল্যাসিফায়ার্স ব্যবহার করে ভিডিও জেনারেটের জন্য লেখা প্রতিটি টেক্সট বিচার করে দেখা সম্ভব। মানুষের জন্য ক্ষতিকর কিছু থাকলে বাদ দেওয়াটা সময়ের ব্যাপার। এমনকি ইমেজ ক্ল্যাসিফায়ার্স প্রযুক্তি সোরা জেনারেটেড ভিডিওর প্রতিটি ফ্রেম পরীক্ষা করে তবেই ব্যবহারকারীকে দেখাবে। পলিসি নির্মাতা, শিল্পী, শিক্ষাবিদ—সবাইকে যুক্ত করা হচ্ছে নতুন এ প্রযুক্তির সর্বোচ্চ সুফল পেতে। আশা করা হচ্ছে, জ্ঞানবিজ্ঞানের চর্চা ভবিষ্যতের পৃথিবীতে প্রযুক্তির বদান্যতায় আরেকটু সহজ হয়ে উঠবে। 

প্রযুক্তির দখল কার হাতে

গুগলের নতুন এআই টুল

বৈদ্যুতিক জাহাজ নির্মাণশিল্পে চীনের আধিপত্য

পাসওয়ার্ডের নিরাপত্তা কতটুক: জেনে নিন বিশ্বে সর্বাধিক ব্যবহৃত পাসওয়ার্ড

ভুয়া ওয়েবসাইট চেনার উপায়

আগুনের ঝুঁকিমুক্ত ব্যাটারি বানালেন বিজ্ঞানীরা

উসকানিমূলক কনটেন্ট বন্ধে কঠোর অবস্থানে সরকার

উসকানিমূলক কনটেন্টের বিরুদ্ধে ব্যবস্থা নিতে মেটাকে বিটিআরসির চিঠি

বিবিএসের জরিপ: ইন্টারনেটের আওতার বাইরে দেশের ৪৪% পরিবার

ডিজিটাল রূপান্তর মানে শুধু অ্যাপ নয়, রাষ্ট্রের ভিত্তি পুনর্গঠনের প্রক্রিয়া: ফয়েজ আহমদ তৈয়্যব