ভাষা সংরক্ষণ: বিপন্নপ্রায় ৪২টি ভাষা এক ওয়েবসাইটে

মাল্টিলিঙ্গুয়াল ক্লাউড পোর্টালের জন্য রেকর্ডিং। ছবি বিসিসির ইবিএলআইসিটি প্রোজেক্ট এর সৌজন্যে প্রাপ্ত। অনুমতিক্রমে প্রকাশিত।

মাল্টিলিঙ্গুয়াল ক্লাউড পোর্টালের জন্য রেকর্ডিং। ছবি বিসিসির ইবিএলআইসিটি প্রোজেক্ট এর সৌজন্যে প্রাপ্ত। অনুমতিক্রমে প্রকাশিত।

বাংলাদেশে বিপন্নপ্রায় ভাষাগুলোর মধ্যে অনেকগুলোই ব্যবহার করেন কয়েকজন মানুষ! এর মধ্যে একটি খাড়িয়া ভাষা। এ ভাষায় কথা বলেন মাত্র পাঁচজন! এদের পর হয়তো আর কেউ এ ভাষায় আর কথা বলবেন না বা বলতে পারবেন না। খাসিয়ার মতো এমন ভাষাগুলোকে ডিজিটাল পদ্ধতিতে সংরক্ষণ করার উদ্যোগ হিসেবেই ‘বাংলাদেশ নৃগোষ্ঠী ভাষা ডিজিটাইজেশন’ নামের একটি প্রকল্প পরিচালনা করছে বাংলাদেশ সরকারের তথ্য ও যোগাযোগ প্রযুক্তি বিভাগ। এ বিভাগের অধীনে গৃহীত ‘গবেষণা ও উন্নয়নের মাধ্যমে তথ্যপ্রযুক্তিতে বাংলা ভাষা সমৃদ্ধকরণ‘ প্রকল্পের আওতায় ভাষা সংরক্ষণের এই কার্যক্রম চলছে। গত জুলাই মাসে এ উদ্যোগের অংশ হিসেবে আনুষ্ঠানিক ভাবে ৪২টি ভাষার ডিজিটাল সংরক্ষণ নিয়ে প্রকাশিত হয়েছে মাল্টিলিঙ্গুয়াল ক্লাউড নামের এ একটি ওয়েবসাইট।

সাইটটির বিষয়ে ইবিএলআইসিটি প্রোজেক্ট এর কন্সাল্ট্যান্ট ও জাহাঙ্গীরনগর বিশ্ববিদ্যালয়ের শিক্ষক মোঃ মামুন অর রশীদ টেলিফোনে এক প্রশ্নের উত্তরে গ্লোবাল ভয়েসকে বলেন “বাংলাদেশের বিপন্ন ভাষাগুলো টিকিয়ে রাখার জন্য এই প্ল্যাটফর্মটি যথাযথভাবে লিখিত ও অলিখিত উভয় ধরনের ভাষা সংগ্রহ ও সংরক্ষণ করেছে।”

এ বিষয়টি নিয়ে গত ৯ই আগস্ট আন্তর্জাতিক আদিবাসী দিবসে তিনি নিজের ফেসবুক পোস্টে উল্লেখ করেন:

‘আজকে ওয়ার্ল্ড'স ইনডেজেনাস পিপল ডে। আমি যতগুলো কাজ করতে পেরেছি তার মধ্যে যেগুলো সবচেয়ে ইমপেক্টফুল তারমধ্যে একটা হলো, এই দেশের ৪২টি ভাষা ডিজিটাইজ করে সংরক্ষণের কাজ করা। বাংলাদেশের বিপন্ন ভাষাগুলো টিকিয়ে রাখার জন্য আমরা মাল্টিলিংঙ্গুয়াল ক্লাউড (multiling.cloud) তৈরি করেছি। এই প্ল্যাটফর্মটি যথাযথভাবে লিখিত ও অলিখিত উভয় ধরনের ভাষা সংগ্রহ ও সংরক্ষণ করেছে। এখানে ৪২টি ভাষার শব্দভাণ্ডার, বাক্যাংশ, ধ্বনিতাত্ত্বিক বর্ণমালা, ব্যাকরণ, IPA ট্রান্সক্রিপশন, এবং অডিও ডেটা সংরক্ষিত রয়েছে।

প্ল্যাটফর্মটিতে ৭,১৭৭টি টপিক রয়েছে, যা প্রতিটি ভাষার সংরক্ষণের নমুনা হিসেবে কাজে লাগছে। এছাড়া, এখানে IPA-এর মাধ্যমে ৯৭,৭৮২টি বাক্যের সঠিক উচ্চারণ সংরক্ষিত হয়েছে এবং ২১৪ জন নেটিভ স্পিকারের কাছ থেকে সংগৃহীত ১২,৬৪৬ মিনিটের অডিও রেকর্ড করা হয়েছে। এর মাধ্যমে বিপন্ন ও স্বল্পপরিচিত ভাষাগুলো শুধু ভাষাগত নয়, বরং সাংস্কৃতিক বৈশিষ্ট্যও সংরক্ষিত হয়েছে। সবাইকে শুভেচ্ছা।’

এ উদ্যোগে সংরক্ষিত একটি ভাষা খাসি। এটি মূলত খাসিয়া বা খাসি জাতিগোষ্ঠীর ভাষা। এ ভাষার পরিবার অস্ট্রো-এশিয়াটিক। খাসি ভাষা ব্যবহারকারীরা বাংলাদেশের মৌলভীবাজার জেলার শ্রীমঙ্গল, কমলগঞ্জ, কুলাউড়া, জুরি, বড়লেখা এবং রাজনগর উপজেলার পাশাপাশি সিলেটের গোয়াইনঘাট, কানাইঘাট ও জৈন্তা উপজেলা, সুনামগঞ্জ জেলার তাহিরপুর উপজেলায় এবং হবিগঞ্জ জেলার বাহুবল ও চুনারুঘাট উপজেলায় বসবাস করেন। এ ভাষার নিজস্ব কোন বর্নমালা নেই। উনবিংশ শতক এর দশকের গোড়ার দিক থেকে খাসি ভাষা রোমান হরফে লেখা হয়ে আসছে এবং ১৮১৪ সালে ধর্মপ্রচারক উইলিয়াম কেরি এই ভাষায় প্রথম বইটি প্রকাশ করেন।

বাংলাদেশের বিভিন্ন খাসিয়া পুঞ্জিতে শিশুদের জন্য দ্বিতীয় শ্রেণি পর্যন্ত বেশ কয়েকটি খাসিয়া ভাষার স্কুল চালু আছে। এ সমস্ত স্কুলের মাধ্যমে তরুণ প্রজন্মের খাসিভাষীরা তাঁদের মাতৃভাষা শিক্ষা, সংরক্ষণ ও সমৃদ্ধির কাজ চালিয়ে যাচ্ছে।

মাল্টিলিঙ্গুয়াল ক্লাউড পোর্টালের জন্য গ্রাম থেকে তথ্য সংগ্রহ। ছবি বিসিসির ইবিএলআইসিটি প্রোজেক্ট এর সৌজন্যে প্রাপ্ত। অনুমতিক্রমে প্রকাশিত।

মাল্টিলিঙ্গুয়াল ক্লাউড পোর্টালের জন্য গ্রাম থেকে তথ্য সংগ্রহ। ছবি বিসিসির ইবিএলআইসিটি প্রোজেক্ট এর সৌজন্যে প্রাপ্ত। অনুমতিক্রমে প্রকাশিত।

ভাষা সংরক্ষণের উদ্যোগের অংশ হিসেবে মাল্টিলিঙ্গুয়াল ক্লাউড ওয়েবসাইটে এ ভাষাটির ভয়েস ডেটা এবং ভিডিও ডকুমেন্টেশন যুক্ত করা হয়েছে। ইতিমধ্যে খাসি ভাষায় সবমিলিয়ে ১৫১টি বিষয়ে ২১৭০ বাক্যের মাধ্যমে প্রায় ৩০০ মিনিটের বেশি অডিও ডিজিটালাইজেশন করা হয়েছে যেখানে রয়েছে ৭ জনের কন্ঠ। তথ্য ও যোগাযোগ প্রযুক্তি বিভাগের কনসাল্টেন্ট মোঃ মামুনুর রশিদের সাথে ফোনে কথা বলে জানা যায় যে খাসি ভাষার কন্টেন্টগুলো সম্পাদনার কাজটিতে একজন খাসি ভাষায় অভিজ্ঞ ব্যক্তি যুক্ত ছিলেন। এর মধ্যে যেমন রয়েছে খাসি ভাষায় নিজের গ্রামের কথা তেমনি আছে পুরাতন ও বর্তমান প্রজন্মের পার্থক্য, লোকগল্প, ঐতিহ্যবাহী গান, প্রচলিত চিকিৎসা পদ্ধতি, গৃহপালিত প্রাণী নিয়ে স্মৃতিও স্বপ্ন, করোনাকালীন অভিজ্ঞতার কথা, কৃষি, স্কুল যাওয়ার গল্প ইত্যাদি।

সারাবিশ্বের ভাষার অবস্থান

পৃথিবী থেকে অনেক জাতিগোষ্ঠীর ভাষা চিরতরে হারিয়ে গেছে। জাতিসংঘের সাংস্কৃতিক সংস্থা ইউনেস্কোর এক পরিসংখ্যানে বলা হয়েছে, প্রতি ১৪ দিনে বিশ্বে একটি ভাষার মৃত্যু ঘটছে। বাংলাদেশের ঢাকায় অবস্থিত আন্তর্জাতিক মাতৃভাষা ইনস্টিটিউট পরিচালিত ২০১৮ সালের সবশেষ জরিপ অনুযায়ী, বাংলাদেশে বাংলাসহ ৪১টি ভাষা টিকে আছে। এর মধ্যে ১৪টি ভাষা বিপন্নপ্রায়

২০২২ সালে ক্ষুদ্র নৃগোষ্ঠীসহ দেশীয় ভাষা সংরক্ষণের কাজ শুরু হয়। প্রকল্পের আওতায় জাতীয় পর্যায়ে ক্ষুদ্র নৃগোষ্ঠী ভাষাসহ দেশের সব ভাষা সংরক্ষণে ভাষাবিষয়ক ডিজিটাল রিসোর্স রিপোজিটোরি (তথ্যভান্ডার) তৈরি করার উদ্যোগ নেয়া হয়। এই প্রকল্পের সর্বশেষ নৃতাত্ত্বিক এবং প্রকল্প সংশ্নিষ্ট জরিপের তথ্য-উপাত্ত অনুযায়ী দেশের ১৪টি বিপন্নপ্রায় ভাষাগুলোর মধ্যে রয়েছে কন্দ, খারিয়া, কোডা, সাওরিয়া, মুন্ডা, কোল, মালতো, খুমি, পাংখোয়া, রেংমিটচা, চাক, খিয়াং, লুসাই ও লালেং।

দেশের ২৬টি ভাষা বিভিন্ন লিপিতে লেখা হয়। সেগুলো হচ্ছে- আবেং, আত্তং, মিগাম, বম, লুসাই, পাংখোয়া, খিয়াং, খুমি, ককবরক, ম্রো, মারমা, রাখাইন, চাক, বিষুষ্ণপ্রিয়া মণিপুরি, মৈতৈ মণিপুরি, হাজং, চাকমা, তঞ্চঙ্গ্যা, সাদরি, উর্দু, মাহালি, কোল, কোডা, খাসিয়া ও লিংগাম। লিখিত রূপ থাকা ভাষাগুলোর মধ্যে বাংলা বর্ণমালা ব্যবহার করে চারটি। এগুলো হলো, হাজং, সাদরি, কোডা ও বিষুষ্ণপ্রিয়া মণিপুরি। এছাড়া আটটি ভাষায় রয়েছে নিজস্ব লিপি। এগুলো হচ্ছে, মৈতৈ মণিপুরি, চাক, চাকমা, তঞ্চঙ্গ্যা, মারমা, রাখাইন, উর্দু ও ম্রো। যে ১৪টি ভাষা রোমান লিপি ব্যবহার করে সেগুলো হলো- বম, কোল, ককবরক, খাসিয়া, গারো, লুসাই, মাহালি, পাংখোয়া, আবেং, আত্তং, মিগাম, কোচ, খিয়াং ও খুমি।

মাল্টিলিঙ্গুয়াল ক্লাউড পোর্টালের জন্য তথ্য সংগ্রহ। ছবি বিসিসির ইবিএলআইসিটি প্রোজেক্ট এর সৌজন্যে প্রাপ্ত। অনুমতিক্রমে প্রকাশিত।

মাল্টিলিঙ্গুয়াল ক্লাউড পোর্টালের জন্য তথ্য সংগ্রহ। ছবি বিসিসির ইবিএলআইসিটি প্রোজেক্ট এর সৌজন্যে প্রাপ্ত। অনুমতিক্রমে প্রকাশিত।

ভাষার ডিজিটাইজেশন এর প্রধান সমস্যাগুলো

শিক্ষাবিদ রিতেশ কর্মকারের করা ২০২৫ সালের একটি গবেষণা অনুযায়ী, বাংলাদেশের ক্ষুদ্র জাতিগোষ্ঠীর ভাষাগুলো দ্রুত বিলীন হচ্ছে। এর মূল কারণ স্কুল এবং অনলাইন মাধ্যমসহ অন্যান্য পাবলিক ডোমেইনে এসব ভাষার অনুপস্থিতি – যা বিপন্ন করে তুলছে এসব জাতিগোষ্ঠীর সাংস্কৃতিক পরিচয় এবং সেইসাথে সামাজিক বন্ধনকেও। বাংলা ভাষাকে স্কুল, সরকার এবং জনজীবনে একমাত্র ভাষা হিসেবে প্রাধান্য দেওয়ার যে রাষ্ট্রীয় নীতি, মূলতঃ সেখান থেকেই এসব ভাষার পরিসর সঙ্কুচিত হয়ে আসছে।

সম্প্রতি এ উদ্যোগের অংশ হিসেবে আয়োজিত একটি সেমিনারে জানানো হয়, বাংলাদেশে বসবাসরত ৫০টির অধিক ক্ষুদ্র জাতিগোষ্ঠীর মানুষের ৪২টি ভিন্ন ভিন্ন ভাষা টিকে থাকার জন্য সংগ্রাম করে যাচ্ছে। নিজস্ব ভাষার পাশাপাশি ক্ষুদ্র জাতিগোষ্ঠীর প্রায় সবাইকে দ্বিতীয় ভাষা হিসেবে বাংলা শিখতে হয়। সরকারি উদ্যোগে পাঁচটি জাতিগোষ্ঠীর মাতৃভাষায় প্রাথমিক শিক্ষার ব্যবস্থা নেওয়া হলেও বিভিন্ন জটিলতায় তা এখনো সেভাবে কাজ করছে না

জাতিগোষ্ঠীদের ভাষায় লিপি সমস্যাও একটি বড় বিষয়। কারণ, অধিকাংশ ভাষারই নিজস্ব লিপি নেই। যেগুলোর আছে, প্রচলন না থাকায় সেগুলো গ্রহণযোগ্য হয়নি। ক্ষুদ্র জাতিগোষ্ঠীগুলোর ভাষা সংরক্ষণের জন্য প্রচলিত ভাষাগুলোর ব্যাকরণ রচনা, শব্দকোষ তৈরির পাশাপাশি সেগুলো অনলাইন ও অফলাইনে সংরক্ষণে মাধ্যমে সবার ব্যবহারের উপযোগী করতে হবে। সরকারের পাশাপাশি বেসরকারি প্রতিষ্ঠান এগিয়ে এলে জাতিগোষ্ঠী ভাষার ডিজিটালাইজেশন করা সম্ভব হবে।

দেশীয় ৪২টি ভাষা ডিজিটাল তথ্যভান্ডারের আওতায় সংরক্ষণের এ উদ্যোগটির পরবর্তী কার্যক্রম হচ্ছে প্রযুক্তি ব্যবহারের মাধ্যমে আরো গবেষণা করা। পাশাপাশি ভাষাগুলোকে টিকিয়ে রাখতে মুদ্রণ মাধ্যমের পাশাপাশি ওয়েবে ব্যবহার প্রচলনের জন্য আপডেটেড অপারেটিং সিস্টেমে কার্যকর ফন্ট ও কি-বোর্ড ব্যবহার করা যাবে। এ ছাড়া নৃতাত্ত্বিক ভাষাভাষীরা কি-বোর্ডে নিজ মাতৃভাষা ব্যবহারের মাধ্যমে ডিজিটাল জগতে নিজেদের উপস্থিতি এবং এর মধ্য দিয়ে আত্মপরিচয়ে সুপ্রতিষ্ঠিত হওয়ার সুযোগ পাবেন।

এক সাইটে অনেক কিছু

বহুভাষিক ক্লাউড- বাংলাদেশের ভাষাগুলির জন্য ডিজিটাল রিসোর্স। প্রথম পেইজের স্ক্রিনশট। ন্যায্য ব্যবহার।

বহুভাষিক ক্লাউড – বাংলাদেশের ভাষাগুলির জন্য ডিজিটাল রিসোর্স। প্রথম পেইজের স্ক্রিনশট। ন্যায্য ব্যবহার।

মাল্টিলিঙ্গুয়াল ক্লাউড সাইটে শুরুতেই রাখা হয়েছে ল্যাঙ্গুয়েজ ম্যাপ। যেখানে বাংলাদেশের মানচিত্রে জেলা ভিত্তিক এলাকায় বিভিন্ন ভাষার অবস্থান অনুযায়ী রাখা হয়েছে যাতে ক্লিক করেই নির্দিষ্ট ভাষার এলাকা, ডিজিটাল ডেটা সংরক্ষণ করা হয়েছে। রয়েছে বিষয়ভিত্তিক আলাদা আলাদা সেগমেন্ট। ভাষাগুলো বিভিন্ন এলাকার মানুষদের কন্ঠে সংরক্ষণ করা হয়েছে। প্রতিটি ভাষার ক্ষেত্রেই রয়েছে ভিজুয়ালাইজেশন আকারে নির্দিষ্ট ভাবে তুলে ধরা হয়েছে কতগুলা বাক্য, কতজন ব্যক্তির কন্ঠ, কত মিনিটের ডেটা ইত্যাদি বিষয়গুলো। এছাড়া প্রতিটি ভাষার নির্দিষ্ট অংশে উক্ত বিষয়ে কাজ করা প্রদায়কদেরও বিস্তারিত রাখা হয়েছে। ভাষাগুলোর ক্ষেত্রেও রয়েছে আলাদা ডিকশেনারীর ব্যবস্থা।

ভাষা সংরক্ষণের এ বিষয়টি আদিবাসী অনেক ব্যবহারকারীদের মধ্যেও বেশ সাড়া জাগিয়েছে। সাঁওতাল ভাষা নিয়ে দীর্ঘদিন ধরে কাজ করা সমর সরেন গ্লোবাল ভয়েসকে জানিয়েছেনঃ

বাংলাদেশের বহুভাষিক বৈচিত্র্য সংরক্ষণ ও প্রসারে multiling.cloud একটি গুরুত্বপূর্ণ ডিজিটাল রিপোজিটরি। এখানে বিভিন্ন আদিবাসী ভাষার বিভিন্ন ডোমেইনের নমুনা ভয়েস সংরক্ষিত করা হয়েছে, যা ভাষার পরিধি বা ল্যাংগুয়েজ স্পেস ও ব্যবহার বাড়াতে সহায়তা করবে। শুধু গবেষক ও ভাষাকর্মীরাই নন, সাধারণ মানুষও এই প্ল্যাটফর্ম ব্যবহার করে দেশের যেকোনো আদিবাসী ভাষায় ন্যূনতম প্রাথমিক কথোপকথন শিখতে পারবেন।

আলোচনা শুরু করুন

লেখকেরা, অনুগ্রহ করে লগ ইন »

নীতিমালা

  • অনুগ্রহ করে অপরের মন্তব্যকে শ্রদ্ধা করুন. যেসব মন্তব্যে গালাগালি, ঘৃণা, অবিবেচনা প্রসূত ব্যক্তিগত আক্রমণ থাকবে সেগুলো প্রকাশের অনুমতি দেয়া হবে না .