
কৃত্রিম বুদ্ধিমত্তা বা এআই প্রতিযোগিতায় নিজেদের শক্ত অবস্থান ধরে রাখতে গত শনিবার নতুন মাল্টিমোডাল মডেল লামা ৪ উন্মোচন করেছে মেটা। এর দুই পাবলিক সংস্করণ—লামা ৪ স্কাউট ও লামা ৪ মারভিক ডাউনলোড করে এখনই ব্যবহার করা যাবে। নতুন এআই মডেলগুলো টেক্সট, ছবি, অডিও এবং ভিডিও প্রসেসও তৈরি করতে পারবে। তবে এগুলোর চেয়ে আরও উন্নত সংস্করণ লামা ৪ বেহেমথ এখনো পরীক্ষা–নিরীক্ষামূলক পর্যায়ে রয়েছে।
গত মার্চে মেটার প্রধান পণ্য কর্মকর্তা ক্রিস কক্স বলেন, লামা ৪ মডেল মেটার এআই এজেন্টগুলোকে আরও বুদ্ধিমান ও কার্যকর করে তুলবে। এসব এজেন্ট শুধু যুক্তি বিশ্লেষণের পাশাপাশি ওয়েব ব্রাউজিংসহ বিভিন্ন জটিল কাজও করতে পারবে। এর ফলে ভোক্তা ও ব্যবসা বিভিন্ন সমস্যার কার্যকর সমাধান পাবে।
লামা ৪-এ যা রয়েছে
লামা ৪-এর মধ্যে দুটি প্রধান মডেল রয়েছে। লামা ৪ স্কাউট একটি ছোট ও দক্ষ মডেল, যা একটিমাত্র এনভিডিয়া এইচ ১০০ জিপিইউতে চালানোর জন্য ডিজাইন করা হয়েছে। দীর্ঘ ডকুমেন্ট বা কথোপকথন প্রসেস করার জন্য মডেলটির প্রচুর ধারণক্ষমতা রয়েছে।
স্কাউট-এর ১০ মিলিয়ন টোকেন কনটেক্সট উইন্ডো রয়েছে এবং এটি ১৭ বিলিয়ন প্যারামিটার-বিশিষ্ট একটি মডেল, যাতে ১৬টি এক্সপার্ট (মডেলের ভেতরের সাব নেটওয়ার্ক) রয়েছে, যা মডেলটিকে আরও দক্ষভাবে কাজ করতে সাহায্য করে। স্কাউট মডেলটি লামা ৩-এর তুলনায় দ্বিগুণ শক্তিশালী, যেটির প্যারামিটারের সংখ্যা ছিল ৮ বিলিয়ন। সাধারণভাবে, একটি মডেলের প্যারামিটার যত বেশি, ততই তা ভালো ফলাফল দ্রুত দিতে পারে।
অন্যদিকে, লামা ৪ মারভিক আরও জটিল মডেল। মডেলটি একটিমাত্র এনভিডিয়া এইচ ১০০ ডিজিএক্স সিস্টেম ব্যবহার করা যাবে। মেটা দাবি করছে, কিছু কাজের ক্ষেত্রে জিপিটি-৪ ও জেমিনি ২.০-এর মতো নেতৃস্থানীয় এআই সিস্টেমের সঙ্গে কার্যকরী হলেও এই মডেল কম কম্পিউটিং রিসোর্স ব্যবহার করে। এটি একটি মাঝারি আকারের মডেল, যা ১৭ বিলিয়ন প্যারামিটার এবং ১২৮ এক্সপার্ট নিয়ে তৈরি।
স্কাউটের একটি খুব বড় ‘কনটেক্সট উইন্ডো’ রয়েছ। সেটি হলো ১০ মিলিয়ন টোকেন। (‘টোকেন’ হলো টেক্সটের অংশ যেমন—শব্দ, চিহ্ন ইত্যাদি)। স্কাউট শুধু টেক্সট নয়, ছবিও প্রক্রিয়া করতে পারে। অর্থাৎ, স্কাউট এমন একটি এআই মডেল, যা ছবি বিশ্লেষণ এবং এর মধ্যে থাকা তথ্য বুঝতে পারে। ছবির সঙ্গে সম্পর্কিত তথ্য প্রক্রিয়া করতে পারে এবং সেই অনুযায়ী কাজ করতে পারে, যেমন—একটি ছবির বর্ণনা দেওয়া বা ছবি সর্ম্পকিত প্রশ্নের উত্তর দেওয়া। স্কাউটে ছবি গ্রহণ করতে পারে এবং কয়েক মিলিয়ন শব্দ ধারণও করতে পারে, যার মাধ্যমে এটি অত্যন্ত দীর্ঘ ডকুমেন্ট প্রক্রিয়াকরণ করে।
এ ছাড়া, মডেলগুলো মাল্টিমোডাল, অর্থাৎ বিভিন্ন ধরনের ডেটার সঙ্গে কাজ করতে পারে। যেমন—একটি ছবি বিশ্লেষণ করা, ভিডিও সারাংশ তৈরি করা অথবা একটি অডিও ক্লিপের ব্যাপারে প্রশ্নের উত্তর দেওয়া। মেটা দাবি করছে, এই মডেলগুলো আগের সংস্করণগুলো তুলনায় যুক্তি দিয়ে প্রশ্নের উত্তর দিতে ও কোডিং তৈরিতে উন্নত।
লামা ৪-এর নতুন সংস্করণে আরেকটি শক্তিশালী মডেল যুক্ত হয়েছে, যার নাম লামা ৪ বেহিমথ। মেটা দাবি করছে, এটি তাদের তৈরি করা সবচেয়ে শক্তিশালী এআই মডেল এবং বর্তমান সবচেয়ে বুদ্ধিমান মডেলগুলোর মধ্যে একটি। বেহিমথ মূলত একটি ‘শিক্ষক’ মডেল হিসেবে কাজ করে, যা নতুন এআই মডেলগুলোর প্রশিক্ষণে ব্যবহৃত হয়। উল্লেখ্য, ‘ডিস্টিলেশন’ প্রক্রিয়া ব্যবহার করে বেহিমথ মডেলটি দিয়ে লামা ৪ স্কাউট ও লামা ৪ মাভেরিক মডেল দুটিকে প্রশিক্ষণ দেওয়া হয়েছে।
এভাবে, বেহিমথ মডেলটি অন্যান্য মডেলের তুলনায় অনেক বেশি শক্তিশালী ও দক্ষ এবং এটি অন্যান্য এআই মডেলের উন্নয়ন ও কার্যক্ষমতা বাড়াতে সহায়ক।
যেভাবে ব্যবহার করা যাবে মডেলগুলো
এই প্রযুক্তি মেটার বিভিন্ন অ্যাপ যেমন: হোয়াটসঅ্যাপ, মেসেঞ্জার এবং ইনস্টাগ্রামের এআই ফিচার উন্নত করতে সাহায্য করতে পারে। এসব প্ল্যাটফর্মে আরও উন্নত চ্যাটবট বা মিডিয়া ইন্টারপ্রিটেশন টুলস (ছবি বা ভিডিও বিশ্লেষণ ও ব্যাখ্যার টুলস) তৈরি করা যাবে। ডেভেলপাররা এবং ব্যবসায়ীরা এই মডেলগুলো তাদের সফটওয়্যারে কাস্টমার সাপোর্ট, কনটেন্ট মডারেশন বা ডেটা বিশ্লেষণের মতো কাজে ব্যবহার করতে পারবে।
অন্যান্য প্রতিযোগীর তুলনায় মেটা লামা ৪ স্কাউট ও লামা ৪ মারভিক মডেল দুটিকে ওপেনসোর্স সফটওয়্যার হিসেবে প্রকাশ করেছে। ফলে, কেউ চাইলে এই মডেল দুটিকে নিজেদের প্রয়োজন অনুযায়ী বিভিন্ন কাজের উপযোগী করে কাস্টমাইজ করে।
ব্যবহারকারীরা এখনই মেটার ওয়েবসাইট বা হাগিং ফেসের মতো তৃতীয় পক্ষের প্ল্যাটফর্মে মডেলগুলো পরীক্ষা করে দেখবে।
সংবাদ সংস্থা রয়টার্স এবং দ্য ইনফরমেশনের প্রতিবেদন অনুযায়ী, লামা ৪ নির্ধারিত সময়ের কিছু পরে উন্মোচিত হলো। এ বছর এআই অবকাঠামোতে বড় ধরনের বিনিয়োগ করার পরিকল্পনা নিয়েছে মেটা। তবে এটি এখনো স্পষ্ট নয়, এই মডেলগুলো কীভাবে দ্রুত পরিবর্তনশীল বাজারে প্রতিদ্বন্দ্বিতা করবে।
তথ্যসূত্র: টেকক্রাঞ্চ, রয়টার্স

কৃত্রিম বুদ্ধিমত্তায় আগামী সাত বছরে ১১০ বিলিয়ন বা ১১ হাজার কোটি মার্কিন ডলারের বিশাল বিনিয়োগের ঘোষণা দিয়েছে ভারতের রিলায়েন্স গ্রুপ। আজ বৃহস্পতিবার রাজধানী দিল্লিতে অনুষ্ঠিত কৃত্রিম বুদ্ধিমত্তা (এআই) সম্মেলনে এ ঘোষণা দেওয়া হয়।
১৫ ঘণ্টা আগে
সম্প্রতি ‘টক্সফ্রি লাইফ ফর অল’ প্রকল্পের অধীনে পরিচালিত এক গবেষণায় দেখা গেছে, পরীক্ষায় ব্যবহৃত প্রতিটি হেডফোনেই মানবস্বাস্থ্যের জন্য বিপজ্জনক রাসায়নিকের উপস্থিতি রয়েছে। গবেষকেরা সতর্ক করেছেন, হেডফোনে থাকা এসব রাসায়নিক ক্যানসার সৃষ্টি করতে পারে এবং পুরুষদের হরমোনের স্বাভাবিক গতিপ্রকৃতি বদলে দিতে...
১৫ ঘণ্টা আগে
আসছে এপ্রিল মাস থেকে ব্রাউজারে ব্যবহার করতে পারবেন না মেসেঞ্জার। থাকবে না টপের অ্যাপ্লিকেশনটিও। ব্যবহারকারীদের উদ্দেশে দেওয়া এক নোটিসে এ তথ্য জানিয়েছে ফেসবুকের মূল প্রতিষ্ঠান মেটা প্ল্যাটফর্মস।
২ দিন আগে
মঙ্গলবার গভীর রাতে বিশ্বব্যাপী ব্যাপক বিভ্রাটের কবলে পড়েছিল জনপ্রিয় ভিডিও শেয়ারিং প্ল্যাটফর্ম ইউটিউব। কয়েক ঘণ্টা ধরে চলা এই সমস্যার কারণে কয়েক লাখ ব্যবহারকারী সাইটটিতে প্রবেশ করতে বা ভিডিও দেখতে গিয়ে চরম বিড়ম্বনায় পড়েন। তবে ইউটিউব কর্তৃপক্ষ জানিয়েছে, সমস্যাটি এখন সম্পূর্ণ সমাধান করা হয়েছে এবং সব
২ দিন আগে