হোম > প্রযুক্তি

এখন ছবি ও অডিও তৈরি করবে গুগলের এআই মডেল জেমিনি

জেমিনির মডেলের একটি পরীক্ষামূলক সংস্করণ হলো—২.০ ফ্ল্যাশ। ছবি: অ্যাপেলসফেরা

অন্যান্য প্রযুক্তির কোম্পানির মতো গুগলও তার মালিকানাধীন প্রায় প্রতিটি পণ্যতে কৃত্রিম বুদ্ধিমত্তা বা এআই অন্তর্ভুক্ত করার জন্য জোরালো প্রচেষ্টা চালাচ্ছে। এরই ধারাবাহিকতায় জেমিনি ২.০ ফ্ল্যাশ নিয়ে হাজির হলো কোম্পানিটি। টেক্সটের পাশাপাশি ছবি ও অডিও তৈরি করতে পারবে জেমিনির নতুন সংস্করণটি।

গুগল বলছে, জেমিনি ২.০ ফ্ল্যাশ থার্ড পার্টি অ্যাপ এবং সেবাগুলোতেও ব্যবহার করা যাবে। অর্থাৎ, এটি অন্যান্য ডেভেলপার বা কোম্পানির তৈরি অ্যাপ বা সেবায় ব্যবহার করা যাবে। এ ছাড়া নতুন সংস্করণটি গুগল সার্চ থেকেও উত্তর দিতে পারবে এবং এটি প্রোগ্রামিং কোড চালাতে পারবে, যা বিভিন্ন ধরনের টাস্ক বা কাজ সম্পাদনে সাহায্য করবে।

গুগল জানিয়েছে, জেমিনির মডেলের একটি পরীক্ষামূলক সংস্করণ হলো—২.০ ফ্ল্যাশ। এটি আগামী বুধবার থেকে জেমিনি অ্যাপে এবং গুগলের কৃত্রিম বুদ্ধিমত্তা (এআই) ডেভেলপার প্ল্যাটফর্ম, এআই স্টুডিও এবং ভারটেক্স এআই এর মাধ্যমে ব্যবহার করা যাবে। তবে প্রাথমিকভাবে নির্দিষ্ট কিছু গ্রাহকদের জন্য অডিও এবং ছবি তৈরির ফিচারগুলো পরীক্ষামূলকভাবে চালু করা হবে। আগামী জানুয়ারি মাস থেকে অন্যান্য ব্যবহারকারীদের জন্যও সংস্করণটি চালু করা হবে।

গুগল বলছে, প্রথম প্রজন্মের ১ দশমিক ৫ ফ্ল্যাশ শুধুমাত্র টেক্সট তৈরি করতে পারত। তবে এই নতুন মডেলটি আরও বহুমুখী। কারণ এটি গুগল সার্চ এর মতো টুল ব্যবহার করতে পারে এবং বাইরের অ্যাপ্লিকেশন প্রোগ্রামিং ইন্টারফেস (এপিএআই) এর সঙ্গে কাজ করতে পারে।

এ ছাড়া জেমিনি ১ দশমিক ৫ প্রো মডেলের তুলনায় নির্দিষ্ট কিছু বেঞ্চমার্কে বা মানদণ্ডে দ্বিগুণ দ্রুত কাজ করে নতুন সংস্করণটি। জেমিনি ২.০ ফ্ল্যাশ মডেলটির কোডিং ও ছবি বিশ্লেষণের মতো কার্যক্রম আরও উন্নত হয়েছে।

এ ছাড়া গুগল সিনথেটিক আইডি প্রযুক্তি ব্যবহার করে ২.০ ফ্ল্যাশের মাধ্যমে তৈরি করা সমস্ত অডিও এবং ছবিতে ওয়াটারমার্ক বা জলছাপ যুক্ত করা হবে। যেসব সফটওয়্যার বা প্ল্যাটফর্ম সিনথেটিক আইডি সমর্থন করে, সেগুলোতে মডেলটির আউটপুটগুলোকে ‘কৃত্রিম’ হিসেবে চিহ্নিত করা হবে।

উল্লেখ্য, সিনথেটিক আইডি প্রযুক্তি গুগলের একটি প্রযুক্তি। বিভিন্ন এআই কনটেন্টে জলছাপ যুক্ত করতে এটি ব্যবহার করা হয়। ফলে কৃত্রিমভাবে তৈরি করা কনটেন্টকে চিহ্নিত করতে এই প্রযুক্তি সাহায্য করে।

সম্প্রতি লেখা থেকে ভিডিও বানানোর টুল সোরা এআই নিয়ে এল ওপেনএআই। এটি এখন চ্যাটজিপিটি প্লাস এবং প্রো সাবস্ক্রাইবারদের জন্য উন্মুক্ত। সোরা ওয়েবসাইট থেকে যুক্তরাষ্ট্রসহ বিভিন্ন দেশে ব্যবহার করা যাবে। এই এআই ভিডিও প্রস্তুতকারক টুলটি গত ফেব্রুয়ারিতে প্রদর্শিত মডেলের একটি আপগ্রেডেড সংস্করণ। একে বলা হচ্ছে সোরা টারবো। এই নতুন মডেলটি আগের তুলনায় দ্রুত এবং উন্নতমানের ভিডিও তৈরি করতে পারে।

তথ্যসূত্র: দ্য ভার্জ ও সিজিটিএন

গুগলের নতুন ফিচার: সাধারণ হেডফোনই হবে রিয়েল–টাইম অনুবাদক

ডিজিটাল উদ্যোক্তা প্রকল্প: পাঁচ বছরে অর্ধেক কাজ, ব্যয় বাড়ল ১৭৮ কোটি

যুক্তরাষ্ট্রে মাকে হত্যার পর ছেলের আত্মহত্যা, চ্যাটজিপিটির বিরুদ্ধে অভিযোগ পরিবারের

মিসড কল মেসেজ ও ছবি থেকে অ্যানিমেশনসহ যেসব ফিচার আনল হোয়াটসঅ্যাপ

অস্ট্রেলিয়ায় ২ লাখ অ্যাকাউন্ট বন্ধ: ‘এটা কাজ করছে না ব্রো’— প্রধানমন্ত্রীকে কটাক্ষ জেন-জি’দের

সকালে ঘুম ভেঙে অস্ট্রেলিয়ার লাখো শিশু দেখবে তাদের ‘আইডি’ উধাও

ভারতে ১৭.৫ বিলিয়ন ডলার বিনিয়োগ করবে মাইক্রোসফট

ব্যবহৃত মোবাইল ফোন আমদানিতে বিটিআরসির ‘না’, কঠোর আন্দোলনের হুঁশিয়ারি মোবাইল ব্যবসায়ীদের

৩০ মিনিটের বেশি সোশ্যাল মিডিয়া ব্যবহার শিশুদের মনোযোগের ক্ষমতা কমায়, বলছে গবেষণা

ট্রাম্পের নতি স্বীকার, এনভিডিয়ার শক্তিশালী এআই চিপ চীনে বিক্রির অনুমতি