হোম > প্রযুক্তি

কণ্ঠস্বর হুবহু নকল করবে মাইক্রোসফটের নতুন কৃত্রিম বুদ্ধিমত্তা

প্রযুক্তি ডেস্ক

নতুন এক ধরনের কৃত্রিম বুদ্ধিমত্তা মডেল নিয়ে গবেষণা করছে মাইক্রোসফট। মানুষের কণ্ঠস্বর হুবহু নকল করবে এই মডেলটি। অন্যান্য পরিষেবা গুলো কণ্ঠস্বর নকল করতে যথেষ্ট পরিমাণে ভয়েস ইনপুট নিলেও মাইক্রোসফটের এই কৃত্রিম বুদ্ধিমত্তা মডেলটি মাত্র ৩ সেকেন্ডের অডিও নমুনা থেকেও কারও কণ্ঠস্বর হুবহু নকল করতে পারে। এআই মডেলটির নাম ‘ভাল-ই’।

প্রযুক্তিবিষয়ক সাইট এনগ্যাজেটের প্রতিবেদন অনুযায়ী, এটি মাইক্রোসফটের ‘টেক্সট-টু-স্পিচ’ ফিচারে ব্যবহার করা যাবে। কৃত্রিম বুদ্ধিমত্তা মডেলটি শুধু কণ্ঠস্বর নকল করতে পারে তা নয়, বক্তার কণ্ঠের আবেগও হুবহু ফুটিয়ে তুলতে পারে।

ভবিষ্যতে কাস্টমাইজ করা বা উচ্চমানের ‘টেক্সট-টু-স্পিচ’ অ্যাপ্লিকেশনে এটি ব্যবহারের সম্ভাবনা থাকলেও, ‘ডিপফেইক’ কৃত্রিম বুদ্ধিমত্তা প্রযুক্তির মতো এটিও অপব্যবহারের ঝুঁকি রয়েছে। ‘ভাল-ই’কে মাইক্রোসফট আখ্যা দিয়েছে একটি ‘নিউরাল কোডেক ল্যাংগুয়েজ মডেল’ হিসেবে। এক গবেষণা পত্রে কৃত্রিম বুদ্ধিমত্তা মডেলটির গবেষকেরা ব্যাখ্যা করেন তারা কীভাবে প্রযুক্তি জায়ান্ট মেটার ‘লিব্রিলাইট’ নামক অডিও লাইব্রেরিতে থাকা সাত হাজারের বেশি বক্তার ৬০ হাজার ঘণ্টা দীর্ঘ ইংরেজি ভাষায় দেওয়া বক্তব্যের মাধ্যমে ‘ভাল-ই’ কে প্রশিক্ষণ দিয়েছেন।

সম্প্রতি, মাইক্রোসফট ওয়ার্ড, পাওয়ার পয়েন্ট এবং আউটলুক সফটওয়্যার গুলিতে মাইক্রোসফট ওপেনএআই-এর কৃত্রিম বুদ্ধিমত্তা প্রযুক্তি পরীক্ষা করছে বলে জানা গিয়েছে। মাইক্রোসফট পরীক্ষা করে দেখছে যে, কীভাবে এই এআই মডেলগুলি ই-মেইলের উত্তরের পরামর্শ দিতে পারে বা ওয়ার্ড ব্যবহারকারীদের লেখার উন্নতিতে পরামর্শ দিতে পারে। ওপেনএআই’ যুক্তরাষ্ট্রভিত্তিক একটি কৃত্রিম বুদ্ধিমত্তা গবেষণা প্রতিষ্ঠান।

এর আগে, নিজস্ব সার্চ ইঞ্জিন ‘বিং’-এর নতুন সংস্করণে কৃত্রিম বুদ্ধিমত্তা (এআই) যুক্ত করার ঘোষণা দিয়েছিল মাইক্রোসফট। এতে ব্যবহার করা হবে ওপেনএআই কোম্পানির চ্যাটবট ‘চ্যাটজিপিটি’। আগামী মার্চের শেষ নাগাদ নতুন এই ফিচার চালু করার সম্ভাবনা রয়েছে।

২০১৯ সালে স্যান ফ্রান্সিসকো ভিত্তিক এআই কোম্পানি ওপেনএআইয়ে ১০০ কোটি ডলার বিনিয়োগ করেছিল মাইক্রোসফট। মাইক্রোসফটের ‘অ্যাজ্যুর’ ক্লাউড কম্পিউটিং সেবায় কৃত্রিম বুদ্ধিমত্তার ‘সুপার কম্পিউটিং’ প্রযুক্তি বানাতে একসঙ্গে কাজ করে কোম্পানি দুটি। একই বছর এক ব্লগ পোস্টে মাইক্রোসফট জানিয়েছিল, ওপেনএআইয়ের ‘ডাল-ই ২’ নামে পরিচিত ‘ইমেজ-জেনারেশন’ সফটওয়্যারকে বিং সার্চ ইঞ্জিনে একীভূত করার পরিকল্পনা করছে প্রতিষ্ঠানটি।

গুগলের নতুন ফিচার: সাধারণ হেডফোনই হবে রিয়েল–টাইম অনুবাদক

ডিজিটাল উদ্যোক্তা প্রকল্প: পাঁচ বছরে অর্ধেক কাজ, ব্যয় বাড়ল ১৭৮ কোটি

যুক্তরাষ্ট্রে মাকে হত্যার পর ছেলের আত্মহত্যা, চ্যাটজিপিটির বিরুদ্ধে অভিযোগ পরিবারের

মিসড কল মেসেজ ও ছবি থেকে অ্যানিমেশনসহ যেসব ফিচার আনল হোয়াটসঅ্যাপ

অস্ট্রেলিয়ায় ২ লাখ অ্যাকাউন্ট বন্ধ: ‘এটা কাজ করছে না ব্রো’— প্রধানমন্ত্রীকে কটাক্ষ জেন-জি’দের

সকালে ঘুম ভেঙে অস্ট্রেলিয়ার লাখো শিশু দেখবে তাদের ‘আইডি’ উধাও

ভারতে ১৭.৫ বিলিয়ন ডলার বিনিয়োগ করবে মাইক্রোসফট

ব্যবহৃত মোবাইল ফোন আমদানিতে বিটিআরসির ‘না’, কঠোর আন্দোলনের হুঁশিয়ারি মোবাইল ব্যবসায়ীদের

৩০ মিনিটের বেশি সোশ্যাল মিডিয়া ব্যবহার শিশুদের মনোযোগের ক্ষমতা কমায়, বলছে গবেষণা

ট্রাম্পের নতি স্বীকার, এনভিডিয়ার শক্তিশালী এআই চিপ চীনে বিক্রির অনুমতি