কোনো কিছু জানতে, কোড তৈরি করতে এবং ছবি ও ভিডিওর মতো কনটেন্ট তৈরিসহ নানা কাজে কৃত্রিম বুদ্ধিমত্তা বা এআই প্রযুক্তি ব্যবহার করা হচ্ছে। তবে মানুষের মতো সারকাজম বা ব্যঙ্গবিদ্রুপ বোঝার মতো ক্ষমতা এখনো আয়ত্ত করতে পারেনি এআই। এবার সেই দিকেই নজর দিলেন নেদারল্যান্ডসের গবেষকেরা। ব্যঙ্গবিদ্রুপ শনাক্তে এআই তৈরি করলেন তাঁরা। দ্য গার্ডিয়ানের প্রতিবেদনে এসব তথ্য জানা যায়।
তরুণদের মধ্যে জনপ্রিয় একটি বিষয় সারকাজম। তবে অনেক মানুষ সারকাজম বুঝতে পারে না। অনেকে আবার রেগেও যান। আলাপ-আলোচনার মধ্যে সূক্ষ্মভাবে বিদ্রুপ করা হয়। তাই এআইয়ের মতো প্রযুক্তিকে সারকাজম বোঝার জন্য প্রশিক্ষণ দেওয়া একটি কঠিন বিষয়।
গ্রোনিংজেনের স্পিচ টেকনোলজি ল্যাব বিশ্ববিদ্যালয়ের ম্যাট কোলার বলেন, ‘আমরা একটি নির্ভরযোগ্য উপায়ে ব্যঙ্গবিদ্রুপ শনাক্তের উপায় বের করেছি এবং একে আরও বিস্তৃত করতে আগ্রহী। এটিকে কত দূর ঠেলে দিতে পারি তা আমরা দেখতে চাই।’
অ্যালগরিদম শেখানোর চেয়ে এই প্রকল্পে আরও অনেক কিছু রয়েছে। কখনো কখনো এমনকি সবচেয়ে কার্যকর মন্তব্যগুলোকে আক্ষরিক অর্থে নেওয়া যায় না ও এর পরিবর্তে সম্পূর্ণ বিপরীতভাবে ব্যাখ্যা করা উচিত।
কোলার বলেন, কোনো আলোচনাকে আমরা যতটা উপলব্ধি করতে পারি, তার চেয়ে বেশি পরিব্যাপ্ত হয় ব্যঙ্গ। তাই মানুষ ও মেশিনের নির্বিঘ্নে যোগাযোগের জন্য এআইয়ের সারকাজম বোঝার ক্ষমতা থাকা অত্যন্ত গুরুত্বপূর্ণ।
তিনি আরও বলেন, ‘আপনি সারকাজম নিয়ে পর্যবেক্ষণ শুরু করলে বুঝতে পারবেন যে, এটি মানুষ সাধারণ যোগাযোগের অংশ হিসেবে কতটা ব্যবহার করে ও সে সম্পর্কে আপনি অতি-সচেতন হয়ে উঠবেন। তবে আমরা ডিভাইসগুলোর সঙ্গে আক্ষরিকভাবে কথা বলি, যেন আমরা একটি রোবটের সঙ্গে কথা বলছি। তবে বিষয়টি এইভাবে চলার কোনো প্রয়োজন নেই।’
মানুষ সাধারণত ব্যঙ্গাত্মক কথা শনাক্ত করতে পারদর্শী। তবে শুধু টেক্সট থেকে সীমিত ইঙ্গিত পেয়ে এগুলো বোঝা কঠিন। কারণ কেউ সামনাসামনি ব্যঙ্গ করলে তার কথার স্বর ও মুখের অভিব্যক্তি দেখে সারকাজম ভালোমতো বোঝা যায়।
গত বৃহস্পতিবার অটোয়ায় অ্যাকোস্টিক্যাল সোসাইটি অব আমেরিকা ও কানাডিয়ান অ্যাকোস্টিক্যাল অ্যাসোসিয়েশনের একটি যৌথ সভায় এই এআই প্রযুক্তি নিয়ে বিস্তারিত তথ্য তুলে ধরা হয়। গবেষক দলটি কীভাবে টেক্সট, ভিডিও, অডিও এবং আবেগগত কনটেন্টের মাধ্যমে একটি নিউরাল নেটওয়ার্ককে প্রশিক্ষণ দেয় তা ল্যাবের পিএইচডি ছাত্র শিয়াউয়ান গাও বর্ণনা করেন। ফ্রেন্ডস, বিগ ব্যাং থিওরির মতো যুক্তরাষ্ট্রের বিভিন্ন জনপ্রিয় কমেডি টিভি সিরিজের ভিডিওয়ের মাধ্যমে এআইকে প্রশিক্ষণ দেওয়া হয়। টিভি সিরিজগুলো ব্যঙ্গাত্মক বিষয়গুলো লেবেল করে ‘মাস্টার্ড’ নামে একটি ডেটাবেজ তৈরি করেন যুক্তরাষ্ট্র ও সিঙ্গাপুরের গবেষকেরা।
টেক্সট ও অডিওর ওপর প্রশিক্ষণে পর অভিনেতাদের আবেগপূর্ণ কনটেন্টকে প্রতিফলিত করে এমন বিষয়সহ সিরিজগুলোর লেবেলবিহীন ব্যঙ্গাত্মক বক্তব্যগুলোও প্রায় ৭৫ শতাংশ শনাক্ত করতে পেরেছে এআই। আরও নির্ভুলভাবে এআইটিকে তৈরি করার জন্য কৃত্রিম ডেটাও ব্যবহার করা হয়েছে। তবে সেই গবেষণা এখনো প্রকাশিত হয়নি।
প্রকল্পের আরেক গবেষক শেখর নায়ক বলেন, এআই অ্যাসিস্ট্যান্টের সঙ্গে কথোপকথনকে আরও সহজ পাশাপাশি একই পদ্ধতি ব্যবহার করে ভাষার নেতিবাচক স্বর, অবমাননাকর ও ঘৃণাত্মক বক্তব্য শনাক্ত করতে এই প্রশিক্ষণ কাজে লাগতে পারে।
গাও বলেন, এআই এর প্রশিক্ষণ ডেটাতে ভ্রু নড়াচড়া ও হাসির মতো বিভিন্ন সংকেত যোগ করার মাধ্যমে প্রযুক্তিটি আরও উন্নতি করা হতে যাবে।
তবে এটি কতটা নির্ভুলভাবে কাজ করবে এমন প্রশ্ন করা হলে গাও প্লাট প্রশ্ন তুলে বলেন, ‘আমাদের কি এমন মেশিন আছে, যা শতভাগ নির্ভুল?’
কোনো কিছু জানতে, কোড তৈরি করতে এবং ছবি ও ভিডিওর মতো কনটেন্ট তৈরিসহ নানা কাজে কৃত্রিম বুদ্ধিমত্তা বা এআই প্রযুক্তি ব্যবহার করা হচ্ছে। তবে মানুষের মতো সারকাজম বা ব্যঙ্গবিদ্রুপ বোঝার মতো ক্ষমতা এখনো আয়ত্ত করতে পারেনি এআই। এবার সেই দিকেই নজর দিলেন নেদারল্যান্ডসের গবেষকেরা। ব্যঙ্গবিদ্রুপ শনাক্তে এআই তৈরি করলেন তাঁরা। দ্য গার্ডিয়ানের প্রতিবেদনে এসব তথ্য জানা যায়।
তরুণদের মধ্যে জনপ্রিয় একটি বিষয় সারকাজম। তবে অনেক মানুষ সারকাজম বুঝতে পারে না। অনেকে আবার রেগেও যান। আলাপ-আলোচনার মধ্যে সূক্ষ্মভাবে বিদ্রুপ করা হয়। তাই এআইয়ের মতো প্রযুক্তিকে সারকাজম বোঝার জন্য প্রশিক্ষণ দেওয়া একটি কঠিন বিষয়।
গ্রোনিংজেনের স্পিচ টেকনোলজি ল্যাব বিশ্ববিদ্যালয়ের ম্যাট কোলার বলেন, ‘আমরা একটি নির্ভরযোগ্য উপায়ে ব্যঙ্গবিদ্রুপ শনাক্তের উপায় বের করেছি এবং একে আরও বিস্তৃত করতে আগ্রহী। এটিকে কত দূর ঠেলে দিতে পারি তা আমরা দেখতে চাই।’
অ্যালগরিদম শেখানোর চেয়ে এই প্রকল্পে আরও অনেক কিছু রয়েছে। কখনো কখনো এমনকি সবচেয়ে কার্যকর মন্তব্যগুলোকে আক্ষরিক অর্থে নেওয়া যায় না ও এর পরিবর্তে সম্পূর্ণ বিপরীতভাবে ব্যাখ্যা করা উচিত।
কোলার বলেন, কোনো আলোচনাকে আমরা যতটা উপলব্ধি করতে পারি, তার চেয়ে বেশি পরিব্যাপ্ত হয় ব্যঙ্গ। তাই মানুষ ও মেশিনের নির্বিঘ্নে যোগাযোগের জন্য এআইয়ের সারকাজম বোঝার ক্ষমতা থাকা অত্যন্ত গুরুত্বপূর্ণ।
তিনি আরও বলেন, ‘আপনি সারকাজম নিয়ে পর্যবেক্ষণ শুরু করলে বুঝতে পারবেন যে, এটি মানুষ সাধারণ যোগাযোগের অংশ হিসেবে কতটা ব্যবহার করে ও সে সম্পর্কে আপনি অতি-সচেতন হয়ে উঠবেন। তবে আমরা ডিভাইসগুলোর সঙ্গে আক্ষরিকভাবে কথা বলি, যেন আমরা একটি রোবটের সঙ্গে কথা বলছি। তবে বিষয়টি এইভাবে চলার কোনো প্রয়োজন নেই।’
মানুষ সাধারণত ব্যঙ্গাত্মক কথা শনাক্ত করতে পারদর্শী। তবে শুধু টেক্সট থেকে সীমিত ইঙ্গিত পেয়ে এগুলো বোঝা কঠিন। কারণ কেউ সামনাসামনি ব্যঙ্গ করলে তার কথার স্বর ও মুখের অভিব্যক্তি দেখে সারকাজম ভালোমতো বোঝা যায়।
গত বৃহস্পতিবার অটোয়ায় অ্যাকোস্টিক্যাল সোসাইটি অব আমেরিকা ও কানাডিয়ান অ্যাকোস্টিক্যাল অ্যাসোসিয়েশনের একটি যৌথ সভায় এই এআই প্রযুক্তি নিয়ে বিস্তারিত তথ্য তুলে ধরা হয়। গবেষক দলটি কীভাবে টেক্সট, ভিডিও, অডিও এবং আবেগগত কনটেন্টের মাধ্যমে একটি নিউরাল নেটওয়ার্ককে প্রশিক্ষণ দেয় তা ল্যাবের পিএইচডি ছাত্র শিয়াউয়ান গাও বর্ণনা করেন। ফ্রেন্ডস, বিগ ব্যাং থিওরির মতো যুক্তরাষ্ট্রের বিভিন্ন জনপ্রিয় কমেডি টিভি সিরিজের ভিডিওয়ের মাধ্যমে এআইকে প্রশিক্ষণ দেওয়া হয়। টিভি সিরিজগুলো ব্যঙ্গাত্মক বিষয়গুলো লেবেল করে ‘মাস্টার্ড’ নামে একটি ডেটাবেজ তৈরি করেন যুক্তরাষ্ট্র ও সিঙ্গাপুরের গবেষকেরা।
টেক্সট ও অডিওর ওপর প্রশিক্ষণে পর অভিনেতাদের আবেগপূর্ণ কনটেন্টকে প্রতিফলিত করে এমন বিষয়সহ সিরিজগুলোর লেবেলবিহীন ব্যঙ্গাত্মক বক্তব্যগুলোও প্রায় ৭৫ শতাংশ শনাক্ত করতে পেরেছে এআই। আরও নির্ভুলভাবে এআইটিকে তৈরি করার জন্য কৃত্রিম ডেটাও ব্যবহার করা হয়েছে। তবে সেই গবেষণা এখনো প্রকাশিত হয়নি।
প্রকল্পের আরেক গবেষক শেখর নায়ক বলেন, এআই অ্যাসিস্ট্যান্টের সঙ্গে কথোপকথনকে আরও সহজ পাশাপাশি একই পদ্ধতি ব্যবহার করে ভাষার নেতিবাচক স্বর, অবমাননাকর ও ঘৃণাত্মক বক্তব্য শনাক্ত করতে এই প্রশিক্ষণ কাজে লাগতে পারে।
গাও বলেন, এআই এর প্রশিক্ষণ ডেটাতে ভ্রু নড়াচড়া ও হাসির মতো বিভিন্ন সংকেত যোগ করার মাধ্যমে প্রযুক্তিটি আরও উন্নতি করা হতে যাবে।
তবে এটি কতটা নির্ভুলভাবে কাজ করবে এমন প্রশ্ন করা হলে গাও প্লাট প্রশ্ন তুলে বলেন, ‘আমাদের কি এমন মেশিন আছে, যা শতভাগ নির্ভুল?’
বিশ্বজুড়ে ভাষা ও সংস্কৃতির ওপর বড় ধরনের প্রভাব ফেলছে কৃত্রিম বুদ্ধিমত্তা (এআই)। বিশেষ করে চ্যাটজিপিটির মতো বড় ভাষা মডেল (এলএলএম) মানুষের দৈনন্দিন কথাবার্তার ধরন বদলে দিচ্ছে এবং একঘেয়ে করে তুলছে বলে সতর্ক করেছে জার্মানির এক গবেষক দল।
১৯ ঘণ্টা আগেবিশ্বের ইন্টারনেট গতির নতুন রেকর্ড গড়েছে জাপান। দেশটির ন্যাশনাল ইনস্টিটিউট অব ইনফরমেশন অ্যান্ড কমিউনিকেশনস টেকনোলজির (এনআইসিটি) গবেষকেরা দাবি করেছে, তাঁরা প্রতি সেকেন্ডে ১ লাখ ২৫ হাজার গিগাবাইট ডেটা স্থানান্তর করতে সক্ষম হয়েছেন, যা প্রায় ১ হাজার ১২০ মাইল (১ হাজার ৮০২ কিলোমিটার) দূরত্ব অতিক্রম...
১ দিন আগেমাইক্রোসফট তাদের কৃত্রিম বুদ্ধিমত্তা ভিত্তিক সহকারী কোপাইলট ভিশনের নতুন আপডেট চালু করেছে, যা এখন ব্যবহারকারীর কম্পিউটারের পুরো স্ক্রিন বা পর্দা স্ক্যান করতে পারবে। আগে এই টুলটি একসঙ্গে দুইটি অ্যাপ দেখতে পারত এবং সে অনুযায়ী বিশ্লেষণ করত। তবে নতুন আপডেটের ফলে এটি এখন সম্পূর্ণ ডেস্কটপ কিংবা নির্দিষ্ট
১ দিন আগেডিজিটাল কনটেন্টের যুগে ইউটিউব কেবল একটি ভিডিও প্ল্যাটফর্ম নয়—এটি এখন এক বড় ক্যারিয়ার অপশন, ব্র্যান্ড তৈরির মাধ্যম, এমনকি অনেকের স্বপ্নপূরণের জায়গা। আপনি যদি ইউটিউবে চ্যানেল খোলার কথা ভাবেন, তবে নিশ্চয়ই অনেক ধরনের আইডিয়া মাথায় ঘুরছে। তবে এতগুলো আইডিয়ার ভিড়ে কোনটা দিয়ে শুরু করবেন, সেটাই সবচেয়ে কঠিন
১ দিন আগে