ওড়িয়া ভাষায় উইকটিওনারি প্রকল্প ক্রাউডসোর্স করার জন্য এক নতুন অডিও টুল আপলোড করা হয়েছে

উইকশনারি প্রকল্প কথাভিধানার জন্য হোম রেকর্ডিং সেটআপ। ছবি শুভাশিস পাণিগ্রাহীর মাধ্যমে উইকিমিডিয়া কমন্স থেকে নেওয়া। সিসি বাই এস-এ ৪.০। ।

উইকিপিডিয়ার বহুভাষিক প্রকল্প উইকশনারি দারুণ কিছু করার প্রতিশ্রুতি প্রদান করছে। বর্তমানে অবশ্য এতে যথেষ্ট পরিমাণ ওপেন লাইসেন্স (উন্মুক্ত লাইসেন্স) অডিও রেকর্ডিং বা উচ্চারিত শব্দ নেই যা আপনি শুনতে বা ডাউনলোড করতে পারেন-বিশেষ করে যদি আপনার মাতৃভাষা কোন প্রধান ভাষা গোষ্ঠীর না হয়ে থাকে। বিভিন্ন ভাষা নিয়ে উইকশনারি অবশ্য কাজ করে যাচ্ছে,এছাড়াও শব্দের অর্থ, অনেক উচ্চারণ গত চিহ্ন (ফনেটিক নোটেশন) যোগ করেছে–আন্তর্জাতিক উচ্চারণ যুক্ত বর্ণমালা দিয়ে এটি করা হয়েছে (আইপিএ)–যা এখন এই প্রকল্পে সহজলভ্য। এখন ওড়িয়া উইকশনারি প্রকল্পে যে সমস্ত স্বেচ্ছাসেবী অবদান রাখছে তাদের কাজ সহজ অনেকটা সহজ হয়ে গেছে।

কথাভিধানা হচ্ছে গ্লোবাল ভয়েসেস এবং ওড়িয়া উইকিপিডিয়ার কন্ট্রিবিউটর শুভাশিস পাণিগ্রাহীর নেতৃত্বে পরিচালিত এক কমিউনিটি প্রকল্প, যা ওপেন সোর্স সমাধান হিসেবে বড় বড় শব্দসমূহ রেকর্ড করে থাকে। এরপর ওপেন লাইসেন্স মাধ্যমে এগুলোকে আপলোড করা হয়, যার ফলে এগুলো উইকশনারির মত প্রকল্পের জন্য অর্থবহ হয়ে উঠতে পারে।

ওড়িয়া হচ্ছে ভারতের অন্যতম এক রাষ্ট্রভাষা, যা ইন্দো ইউরোপীয় ভাষা গোষ্ঠীর অন্তর্ভুক্ত। মূলত পূর্ব ভারতের উড়িষ্যা রাজ্যের বেশীরভাগ নাগরিকদের মাতৃভাষা হচ্ছে ওড়িয়া যে ভাষায় প্রায় ৪ কোটি মানুষ কথা বলে থাকে, যার সাহিত্যের ইতিহাস প্রায় ৫০০০ বছরের পুরোনো। দক্ষিণ এশিয়ার অন্যতম এক প্রাচীন ভাষা হিসেবে স্বীকৃত ওড়িয়াকে ভারত সরকার ঐতিহ্যবাহী ভাষার মর্যাদা প্রদান করেছে।

ইউনিকোড নয় এমন টাইপিং পদ্ধতির কারণে ওড়িয়া ভাষায় এই উদ্যোগ গ্রহণ করা হয়, অনলাইনে যে ভাষার উপস্থিতি এখনো অনেক কম। এই বিষয়ের সমাধানে একগুচ্ছ অক্ষর এনকোডিং কনভার্টার তৈরি করা হয়, যা ইউনিকোড নয় এমন অক্ষর দিয়ে লেখা বাক্যকে ইউনিকোডে রূপান্তরিত করে ফেলা এই প্রকল্প ওড়িয়া উইকিপিডিয়ার সাথে সংযুক্ত; এখন এর প্রায় ১২,০০০ শব্দ যুক্ত করা হয়েছে। অন্যদিকে ওড়িয়া উইকশনারি উন্মুক্ত, বিনামূল্যের, অনলাইন ভিত্তিক এবং পরিপূর্ণভাবে ওড়িয়া ভাষার ক্রাউডসোর্স (সামস্টিকভাবে তৈরি) অভিধান, যা এই শূন্যতা পূরণের চেষ্টা করছে।

অন্য এক ওপেন সোর্স সফটওয়ার থেকে এই প্রকল্প উৎসাহ লাভ করেছে যার সৃষ্টিকর্তা টি শ্রীনিবাসন, যিনি এই প্রক্রিয়াকে স্বয়ংক্রিয় ও সহজ করার জন্য পাইথন নামক প্রোগ্রাম ব্যবহার করেন। তিনি ইউটিউবে এই টিউটোরিয়ালটি পোস্ট করেছেন:

কাথাভিধানা প্রকল্পের পেছনে পানিগ্রাহীর উৎসাহর কারণ বিদ্যমান বিরক্তিকর পদ্ধতিসমূহ, যে পদ্ধতিতে একজনকে এই শব্দগুলো উচ্চারণ ও রেকর্ড করতে হত। একবার আপলোড করার পর এই শব্দ উইকশনারি প্রকল্পে যুক্ত করা হয়। উচ্চারণগুলো ম্যানুয়েল পদ্ধতিতে রেকর্ড করা ছাড়াও একটি ওপেন সোর্স পাঠ্য থেকে বাক্য উচ্চারণ প্রকল্প রয়েছে যাকে বলা হচ্ছে ধাভানি, এটি বেশীর ভাগ ভারতীয় ভাষার ক্ষেত্রে কাজ করে থাকে।

এর বিপরীতে, উইকশনারি রেকর্ড করা অডিও ভিন্ন ভাষীদের এই ভাষা শিখতে সাহায্য করার পাশাপাশি সে সমস্ত ব্যক্তি দেখতে অক্ষম তারা এর মাধ্যমে ভিন্ন ভিন্ন শব্দের উচ্চারণ শুনতে পারে। শব্দের লাইব্রেরি বেশ কয়েক ধরনের প্রাকৃতিক ভাষা প্রক্রিয়া প্রকল্পে ব্যবহার করা যেতে পারে, যেমন লেখা থেকে উচ্চারণে রুপান্তর করা অথবা উচ্চারণ থেকে উচ্চারণ ইঞ্জিন তৈরি করা।

আপনি কথাভিধানার একটি কপি ডাউনলোড করতে পারেন এবং এই সফটওয়্যার ব্যবহার করে এর সকল অডিও রেকডিং বের করতে পারেন।

আলোচনা শুরু করুন

লেখকেরা, অনুগ্রহ করে লগ ইন »

নীতিমালা

  • অনুগ্রহ করে অপরের মন্তব্যকে শ্রদ্ধা করুন. যেসব মন্তব্যে গালাগালি, ঘৃণা, অবিবেচনা প্রসূত ব্যক্তিগত আক্রমণ থাকবে সেগুলো প্রকাশের অনুমতি দেয়া হবে না .