
বিশ্বের সবচেয়ে বড় অনলাইন বিশ্বকোষ উইকিপিডিয়ার ইংরেজি সংস্করণে আর্টিকেল বা নিবন্ধের সংখ্যা ৭০ লাখের কাছাকাছি। তবে দ্বিতীয় বৃহত্তম সংস্করণটি ফরাসি, স্প্যানিশ বা চীনা ভাষায় নয়—এটি ফিলিপাইনের দক্ষিণাঞ্চলে প্রচলিত স্থানীয় ভাষা সেবুয়ানোয় লেখা হয়েছে। এই সংস্করণের নিবন্ধ সংখ্যা ৬০ লাখেরও বেশি। আর অবাক করা বিষয় হলো সেবুয়ানো উইকিপিডিয়ার অধিকাংশ নিবন্ধ লিখেছেন একজন ব্যক্তি—সুইডিশ ভাষাবিদ সভারকার ইয়োহানসন। তবে হাতে নয়, এক স্বয়ংক্রিয় প্রোগ্রামের মাধ্যমে। এই প্রোগ্রামের নাম এলএসজেবট।
যেভাবে কাজ করে এলএসজেবট
উইকিপিডিয়ায় নানা ধরনের কাজ সহজ করতে বহু বছর ধরেই বট বা স্বয়ংক্রিয় প্রোগ্রাম ব্যবহার হয়ে আসছে। এরা সাধারণত সাইট ঘুরে ডেড লিংক ঠিক করা বা সংক্ষিপ্ত নিবন্ধ তৈরি করার মতো কাজ করে।
২০১০ দশকের শুরুতে, উইকিপিডিয়ায় লিখতেন সভারকার ইয়োহানসন। তখনই তিনি এই স্বয়ংক্রিয় নিবন্ধ-লেখক বটগুলোর সঙ্গে পরিচিত হন।
এরপর তিনি তৈরি করেন এলএসজেবট নামের বিশেষ প্রোগ্রাম। এটি বিভিন্ন অনলাইন ডেটাবেস থেকে তথ্য সংগ্রহ করে নির্দিষ্ট কিছু বাক্য কাঠামোতে বসিয়ে নিবন্ধ তৈরি করে।
উদাহরণস্বরূপ, কোনো প্রাণীর ওপর একটি নিবন্ধের শুরুতে লেখা থাকতে পারে—‘দ্য এক্স ইজ অ্যা ওয়াই বিলংগস টু দ্য জেড ফ্যামিলি’। এখানে এক্স, ওয়াই এবং জেড জায়গাগুলো ফাঁকা থাকে। এখানে এক্স=লাইওন (সিংহ), ওয়াই=ম্যামল (স্তন্যপায়ী), জেড=ক্যাট (বিড়াল)। তাহলে সম্পূর্ণ বাক্যটি দাঁড়ায়–‘দ্য লাইয়ন ইজ অ্যা ম্যামল দ্যাট বিলংগস টু দ্য জেড ক্যাট ফ্যামিলি।’ এভাবে তৈরি হয় লাখ লাখ নিবন্ধ।
ঠিক এইভাবে, এলএসজবট নামের প্রোগ্রামটি একটি নির্দিষ্ট ফরম্যাটে বা টেমপ্লেটে তথ্য বসিয়ে অসংখ্য নিবন্ধ তৈরি করত। এটি মূলত ডেটাবেইস থেকে তথ্য নিয়ে বানানো নির্দিষ্ট বাক্যের ছাঁচে ফেলে লেখা তৈরি করত—কোনো নতুন কথা বা ব্যাখ্যা তৈরি করত না।
বটটি মূলত জীববিজ্ঞান ও ভূগোলভিত্তিক তথ্য ব্যবহার করে উদ্ভিদ ও প্রাণীদের নিয়ে এখন পর্যন্ত প্রায় ২০ লাখ নিবন্ধ এবং ভৌগোলিক স্থান নিয়ে ৪০ লাখ বিভিন্ন নিবন্ধ তৈরি করেছে।
সেবুয়ানো ভাষায় কাজ করার পেছনে ইয়োহানসনের ব্যাখ্যা ছিল ব্যক্তিগত। তাঁর স্ত্রীর মাতৃভাষা সেবুয়ানো। তিনিই বাক্য কাঠামো তৈরিতে সাহায্য করেন।
এলএসজেবট নিয়ে বিতর্ক
সেবুয়ানো উইকিপিডিয়ায় এলএসজেবট ব্যবহার নিয়ে তীব্র বিতর্ক তৈরি হয়। বটের তৈরি অসংখ্য নিবন্ধে ব্যাকরণগত ভুল ও তথ্যগত ত্রুটি পাওয়া যায়। অনুবাদগুলো ছিল অসম্পূর্ণ বা ভুল হওয়ার কারণে এই সমস্যা তৈরি হয়।
অতিরিক্ত সংখ্যক নিবন্ধ তৈরি করাও এই সমস্যার কারণ হয়। এ ছাড়া সম্পাদক স্বল্পতার কারণে এই বিশাল তথ্যভান্ডার ত্রুটিমুক্ত করাও কঠিন হয়ে পড়ে।
এমনকি পুরো সেবুয়ানো উইকিপিডিয়া মুছে ফেলার প্রস্তাবও আসে ২০১৮ সালে, যা পরে বাতিল করা হয়।
ফিলিপাইনের আরেক উইকিপিডিয়ান ইরভিন স্টো. তোমাস জানান, কিছু স্থানীয় স্বেচ্ছাসেবক এখনো চেষ্টা চালিয়ে যাচ্ছেন গুণগত মান উন্নয়নে এবং ড. ইয়োহানসনের সঙ্গেও কাজ করেছেন।
এদিকে উইকিপিডিয়ার লেখক জোশ লিম বলেন—বট ব্যবহারের কারণে আগে থেকেই বিশ্বাসযোগ্যতার সমস্যা তৈরি হয়েছে। সেবুয়ানো উইকিপিডিয়ার প্রাথমিক পর্যায়ে বহু ফরাসি গ্রাম নিয়ে নিবন্ধ ছিল, অথচ স্থানীয় বিষয় ছিল অপ্রতুল। এটি একটি ‘লজ্জাজনক’ বিষয় হয়ে দাঁড়ায়। বটের কারণে ভাষাভিত্তিক উইকিপিডিয়াগুলোর মধ্যে ‘পরিমাণের প্রতিযোগিতা’ শুরু হয়, যাতে গুণমান উপেক্ষিত হয়।
লিম আরও বলেন, সমালোচনা থাকলেও ইয়োহানসনের উদ্দেশ্য ছিল নিষ্ঠার সঙ্গে জ্ঞানের প্রসার ঘটানো। তিনি বলেন, বট বা স্বয়ংক্রিয় প্রযুক্তিকে পুরোপুরি বাদ দেওয়া ঠিক নয় বরং সঠিকভাবে ব্যবহার করতে শিখতে হবে।
২০২১ সাল থেকে এলএসজেবট নিষ্ক্রিয় এবং বিতর্কই এর পেছনে অন্যতম কারণ বলে জানান ইয়োহানসন নিজেই।
উইকিপিডিয়ায় স্থানীয় ভাষার অবমূল্যায়ন ও জেনারেটিভ এআইয়ের চ্যালেঞ্জ
ড. ইয়োহানসনের তৈরি এলএসজেবট বন্ধ হয়ে যায়, কারণ এটি সেবুয়ানো উইকিপিডিয়ায় বেশি পাঠক তৈরি করতে পারেনি। সাইটে লাখো নিবন্ধ থাকলেও, পাঠক ছিল হাজার হাজার। অন্যদিকে, ইংরেজি উইকিপিডিয়া প্রতি মাসে ১০ কোটির বেশি ফিলিপাইনের পাঠক পায়।
উইকিপিডিয়ান জোশ লিম বলেন, এটা ফিলিপাইনের সমাজে ঔপনিবেশিক মানসিকতার প্রতিফলন, যেখানে মাতৃভাষাকে অবমূল্যায়ন করা হয়। এর ফলে স্থানীয় ভাষায় তথ্যের ঘাটতি তৈরি হয়। তবে তিনি মনে করেন, বর্তমানে নিজস্ব ভাষা নিয়ে মানুষের মধ্যে নতুন করে আগ্রহ ও সচেতনতা তৈরি হচ্ছে এবং উইকিপিডিয়া এতে বড় ভূমিকা রাখতে পারে।
অস্ট্রেলিয়ার গবেষক হিদার ফোর্ড বলেছেন, সেবুয়ানো উইকিপিডিয়ার ডেটাভিত্তিক নিবন্ধ এবং ইংরেজি উইকিপিডিয়ার মানুষের দৃষ্টিকোণ থেকে লেখা বর্ণনা তুলনা করলে বোঝা যায় যে, তথ্যের উপস্থাপন ভাষার ভিত্তিতে ভিন্ন হয়।
এদিকে ড. ইয়োহানসন জোর দিয়ে বলেন, এলএসজেবট নতুন কিছু বানায় না, শুধু ডেটা দিয়ে প্রস্তুত ফর্মুলায় তথ্য বসায়। তবে জেনারেটিভ এআই (যেমন চ্যাটজিপিটি) তথ্য ‘উদ্ভাবন’ করে, যা বাস্তব নয় এবং বিশ্বাসযোগ্যতার ঝুঁকি তৈরি করে।
তারপরও তিনি মনে করেন, জেনারেটিভ এআই ভাষাগত সহায়তা ও স্টাইল ঠিক করতে কাজে আসতে পারে। তবে মানব সম্পাদকের যাচাই অপরিহার্য।
গবেষণায় দেখা গেছে, উইকিপিডিয়ার ১-৫ শতাংশ পর্যন্ত এআই দিয়ে তৈরি হতে পারে। তবে যদি এই সংখ্যা বাড়ে, তবে রক্ষণাবেক্ষণ অসম্ভব হয়ে উঠতে পারে, যেমনটা সেবুয়ানোর ক্ষেত্রে হয়েছে।
লিম বলেন, ‘আমরা নির্ভরযোগ্য, তবে ভুল করতে পারি। তাই তথ্য নিয়ে ঈশ্বরসুলভ ক্ষমতার আচরণ করা উচিত নয়।’
তথ্যসূত্র: এবিসি নিউজ

যুক্তরাষ্ট্রের ভিসা পাওয়া অনেকের কাছেই ‘ড্রিম’। আর এই স্বপ্ন পূরণ করতে একেক জন আবেদন করেন একেক যোগ্যতায়। দ্য গার্ডিয়ানের প্রতিবেদনে দেখা গেল দারুণ এক তথ্য। বিশ্বজুড়ে কনটেন্ট ক্রিয়েটর ও ইনফ্লুয়েন্সাররা ঝুঁকছেন দেশটির ভিসা নিতে।
৬ মিনিট আগে
বাংলাদেশ একাডেমি অব সায়েন্সেসের আয়োজনে সম্মেলনে দেশের তরুণ বিজ্ঞানীরা কৃত্রিম বুদ্ধিমত্তা বিষয়ক গবেষণা, উদ্ভাবন ও সম্ভাবনা তুলে ধরবেন। কংগ্রেসে বিভিন্ন সেশন, গবেষণা উপস্থাপনা, প্যানেল আলোচনা এবং প্রযুক্তি প্রদর্শনী অনুষ্ঠিত হবে।
৩ ঘণ্টা আগে
বর্তমান বৈশ্বিক প্রেক্ষাপটে জ্বালানি সংকটের প্রভাব বাংলাদেশেও স্পষ্টভাবে প্রতিফলিত হচ্ছে। এর ফলে দেশের টেলিযোগাযোগ, ইন্টারনেট ও ডেটা সেন্টার সেবাসমূহ মারাত্মক ঝুঁকির মুখে পড়েছে। এই খাতগুলো আধুনিক রাষ্ট্রব্যবস্থা, অর্থনীতি, শিক্ষা, স্বাস্থ্যসেবা এবং ডিজিটাল কার্যক্রমের মূল চালিকাশক্তি হিসেবে কাজ করছ
১৭ ঘণ্টা আগে
কৃত্রিম বুদ্ধিমত্তা বা এআই খাতে বিপুল বিনিয়োগের অংশ হিসেবে বড় আকারের কর্মী ছাঁটাই চালিয়েছে প্রযুক্তি খাতের শীর্ষ প্রতিষ্ঠান ওরাকল। সামাজিক যোগাযোগমাধ্যমে ঊর্ধ্বতন কর্মকর্তারা জানিয়েছেন, এই সংখ্যা ১০ হাজারেরও বেশি হতে পারে।
৩ দিন আগে