ভারতে চালু ১২১টি ভাষার মানুষের কাছে অনুবাদের মাধ্যমে পৌঁছে যাবে যে কোনো তথ্য। নির্ভরশীলতা কমবে ইংরেজির উপর। খবর ডয়েচে ভেলের
দক্ষিণ ভারতের রাজ্য কর্ণাটকের একটি গ্রামের মানুষ কয়েক সপ্তাহ ধরে একটার পর একটা বাক্য কন্নড় ভাষায় বলে যাচ্ছিলেন। আর তা একটি অ্যাপে তুলে নেয়া হচ্ছিল। এই অ্যাপটি হলো টিবি-র জন্য দেশের প্রথম কৃত্রিম মেধা বা এআই-ভিত্তিক চ্যাটবট।
ভারতে চার কোটি মানুষ কন্নড় বলেন। দেশের ২২টি স্বীকৃত সরকারি ভাষার মধ্যে কন্নড় একটি। ভারতে এমন ১২১টি ভাষা আছে, যা ১০ হাজার বা তার বেশি মানুষ ব্যবহার করেন। কিন্তু খুব কম ভাষাই ন্যাচরাল ল্যাঙ্গুয়েজ প্রসেসিং (এনএলপি)-তে আছে। ভারতে চালু ১২১টি ভাষার
এনএলপি হলো এআই-এর একটি শাখা, যার মাধ্যমে কম্পিউটার কথ্য ও লিখিত ভাষা বুঝতে পারে। তাই এনএলপি-তে তথ্য না থাকলে সেই ভাষাকে কম্পিউটার বা নেটবাহিত বিভিন্ন মাধ্যম মানুষের কাছে পৌঁছে দিতে পারে না। ফলে কোটি কোটি ভারতীয় নিজের ভাষায় প্রয়োজনীয় তথ্য জানা থেকে বঞ্চিত হচ্ছেন এবং আর্থিক সুবিধাও পাচ্ছেন না।
এবার এই খামতিটুকু দূর করতে উদ্যোগী হয়েছে, মাইক্রোসফট, গুগলের মতো সংস্থাগুলি। তারা ১২১টি ভারতীয় ভাষায় লিখিত ও কথ্য ডেটা সংগ্রহ করছে, যার মাধ্যমে নিজের ভাষায় সব তথ্য ভারতীয়দের কাছে পৌঁছে যায়।
মাইক্রোসফট রিসার্চ ইন্ডিয়ার প্রধান গবেষক কালিকা বালি বলেছেন, ‘‘কৃত্রিম মেধাভিত্তিক টুলগুলিকে যদি সকলের কাছে পৌঁছাতে হয়, তাহলে ইংরেজি, ফরাসি, স্প্যানিশ ভাষার বাইরের মানুষদের কাছে যেতে হবে।
কালিকা বলেন,‘‘ভারতীয় ভাষাগুলির যদি বিশাল ডেটাবেস তৈরি করতে হয়, তাহলে ১০ বছর সময় লেগে যাবে। তাই আমরা পর্যায়ক্রমে কাজটা করতে পারি। চ্যাটজিপিটি ও লামার মতো এআই মডেলের সাহায্যে তা করা সম্ভব।
মাইক্রোসফট বা গুগলের জন্য ডেটা বা তথ্য সংগ্রহ করছে টেক ফার্ম কারিয়া। কর্ণাটকের ওই গ্রামের মানুষের মতো বিভিন্ন জায়গায় মানুষরা তাদের ভাষায় সমানে কথা বলছেন। তা রেকর্ড করা হচ্ছে। পরে শিক্ষা, স্বাস্থ্য ও অন্য পরিষেবার ক্ষেত্রে এই তথ্য ব্যবহার করবে কৃত্রিম মেধা ভিত্তিক টুলগুলি।
