Category: বাংলা ভাষা ও সাহিত্য

Bengali language and literature

  • স্বাভাবিক ভাষা উৎপাদন

    স্বাভাবিক ভাষা উৎপাদন (ইংরেজি: Natural language generation, অথবা, সংক্ষেপে NLG) হচ্ছে স্বাভাবিক ভাষা প্রক্রিয়াজাতকরণের একটি কাজ যেখানে যন্ত্র উপস্থাপন ব্যবস্থা (জ্ঞানভিত্তিক অথবা যৌক্তিকরুপ) থেকে স্বাভাবিক ভাষা উৎপাদন করা হয়। মানসিক উপস্থাপনার (mental representations) জন্য যখন এরকম আনুষ্ঠানিক উপস্থাপনা (formal representations) আদর্শ হিসেবে ব্যাখ্যা করা হয়, মনোভাষাবিদরা তখন ভাষা উৎপাদন শব্দটিকে অগ্রাধিকার দেন।

    যেহেতু স্বাভাবিক ভাষা উৎপাদন কম্পিউটার ভিত্তিক উপস্থাপনাকে স্বাভাবিক ভাষায় রূপান্তর করে উপস্থাপন করে, তাই একে একজন অনুবাদকও বলা যেতে পারে। তবে স্বাভাবিক ভাষার সহজাত স্পষ্টতার জন্য চূড়ান্ত ভাষা উৎপাদন পদ্ধতি সংকলনকারী (compiler) থেকে ভিন্ন। যদিও স্বাভাবিক ভাষা উৎপাদন অনেক আগে থেকেই বিদ্যমান ছিল, কিন্তু বর্তমানে এ প্রযুক্তির বাণিজ্যিক ব্যবহার অধিকহারে পরিলক্ষিত হচ্ছে।

    এটা স্বাভাবিক ভাষা উপলব্ধির বিপরীত হিসেবে দেখা যেতে পারে: যেখানে স্বাভাবিক ভাষা উপলব্ধি পদ্ধতিকে মেশিন উপস্থাপিত (machine representation) ভাষা উৎপাদনে যোগান (input) বাক্যের দ্ব্যর্থতা নিরসন করতে হয়, সেথানে স্বাভাবিক ভাষা উৎপাদন পদ্ধতিকে কিভাবে একটি ধারণাকে শব্দের মাধ্যমে প্রকাশ করা যায় তার সিদ্ধান্ত নিতে হয়।

    সহজ উদাহরণ হচ্ছে সেসব পদ্ধতি যেগুলো গঠন অক্ষর উৎপন্ন করে। এগুলো সাধারনত কোন ব্যাকরণের নিয়ম অন্তর্ভুক্ত করেনা, কিন্তু কোন ভোক্তার জন্য বার্তা উৎপন্ন করতে পারে, যেমন, ভোক্তার ক্রেডিট কার্ডের খরচের সীমা পার হয়ে গিয়েছে জানিয়ে দেওয়া। আরো জটিল স্বাভাবিক ভাষা উৎপাদন পদ্ধতি যোগাযোগের লক্ষ্য পূরণের জন্য পরিবর্তনশীলভাবে লিখন তৈরি করতে পারে। স্বাভাবিক ভাষা প্রক্রিয়াজাতকরণের অন্যান্য ক্ষেত্রে, হয় ভাষার স্পষ্ট নকশা (যেমন, ব্যাকরন) ও অন্যান্য কার্যক্ষেত্রের ব্যবহারের মাধ্যমে, অথবা, মানব-লিখিত লিখন বিশ্লেষণ করে আহরিত পরিসংখ্যানগত নকশা ব্যবহার করার মাধ্যম হিসেবে ব্যবহার করা যায়

  • স্বাভাবিক ভাষা উপলব্ধি

    স্বাভাবিক ভাষা উপলব্ধি (ইংরেজি: natural language understanding, অথবা, সংক্ষেপে NLU) কৃত্রিম বুদ্ধিমত্তার অন্তর্ভুক্ত স্বাভাবিক ভাষা প্রক্রিয়াজাতকরণের একটি উপক্ষেত্র, যেখানে কোন পাঠ্যবস্তু (text) পঠন, প্রক্রিয়াজাতকরণ ও তার অর্থ উপলব্ধি করা নিয়ে গবেষণা করা হয়।

    এটাকে একটি পূর্ণ কৃত্রিম বুদ্ধিমত্তা (AI-complete/hard) বা কঠিন কৃত্রিম বুদ্ধিমত্তার সমস্যা হিসেবে বিবেচনা করা হয়। স্বাভাবিক ভাষা উৎপাদনে বিপরীত প্রক্রিয়া একত্রীকরণ উৎপাদন (reverse process of assembling output) অবতরণ করার প্রক্রিয়া (process of disassembling) ও পদান্বয় যোগান (parsing input) থেকে অনেক জটিল। এর কারণ হচ্ছে, যোগানে অজানা ও অপ্রত্যাশিত বৈশিষ্ট্য সংঘটন এবং প্রয়োগে উপযুক্ত বাক্যগঠনসংক্রান্ত (syntactic) ও শব্দার্থিক (semantic) পদ্ধতি নির্ধারণ, যা ভাষা উৎপাদনের সময় পূর্বনির্ধারিত গুণক।

    সংবাদ সংগ্রহ, পাঠ্যবস্তু শ্রেণীবদ্ধকরণ, কণ্ঠস্বর-সক্রিয়করণ, সংরক্ষণ এবং বড় মাপের বিষয়বস্তু বিশ্লেষণে প্রায়োগিক ব্যবহারের জন্য এর যথেষ্ট বাণিজ্যিক আগ্রহ রয়েছে।

  • সৃষ্টিশীল ভাষাবিজ্ঞান

    সৃষ্টিশীল ভাষাবিজ্ঞান বা সঞ্জননী ভাষাবিজ্ঞান (ইংরেজি: Generative linguistics) ভাষাবিজ্ঞানের একটি ধারা যেখানে সৃষ্টিশীল ব্যাকরণের ধারণাকে কাজে লাগানো হয়।

    সৃষ্টিশীল ব্যাকরণ হল কতগুলি নিয়মের একটি সসীম সেট, যে নিয়মগুলি ব্যবহার করে কোন প্রদত্ত ভাষার সমস্ত বাক্য সৃষ্টি বা সঞ্জনন (generate) করা সম্ভব। ভাষাবিজ্ঞানী নোম চম্‌স্কি এই ধারণাটি ভাষাবিজ্ঞানে প্রথম উপস্থাপন করেন। আরও সঠিকভাবে বলতে গেলে সঞ্জননী ব্যাকরণ কোন ভাষার প্রতিটি বাক্যের জন্য একটি গাঠনিক বর্ণনা প্রদানে সক্ষম। [১])

  • সিন্ট্যাকটিক স্ট্রাকচারস

    সিনট্যাক্‌টিক স্ট্রাকচার্স (মূল ইংরেজি নাম Syntactic Structures) ভাষাবিজ্ঞানের একটি গুরুত্বপূর্ণ গ্রন্থ, যার লেখক মার্কিন ভাষাবিজ্ঞানী নোম চম্‌স্কি[৫] বইটি ১৯৫৭ সালে সর্বপ্রথম প্রকাশিত হয়। বইটিতে প্রথমবারের মত রূপান্তরমূলক উৎপাদনশীল ব্যাকরণ নামক ধারণাটিকে উপস্থাপন করা হয়। বাক্যতাত্ত্বিক (অর্থাৎ বাক্যের কাঠামো সংক্রান্ত) গবেষণার ক্ষেত্রে চম্‌স্কি-প্রস্তাবিত এই পন্থাটি ছিল সম্পূর্ণ বিধিসম্মত (অর্থাৎ বিভিন্ন চিহ্ন, সূত্র ও তাদের নিপূণ ব্যবহারভিত্তিক)। এই পদ্ধতিটির ভিত্তিতে রয়েছে কিছু পদগুচ্ছ কাঠামো সূত্র[টীকা ২] এই সূত্রগুলি একটি বাক্যকে একাধিক ক্ষুদ্রতর অংশে ভাগ করে ফেলে। চম্‌স্কি এরপর এই সূত্রগুলিকে এক নতুন ধরনের সূত্রের সাথে সংযুক্ত করেন, যাদের নাম “রূপান্তর”। এই পদ্ধতিটি বিভিন্ন ধরনের বাক্যিক সংগঠন বা কাঠামো উৎপাদন করতে পারে। [৬] চম্‌স্কির লক্ষ্য হল এই সীমিত সংখ্যক সূত্রের গুচ্ছ ব্যবহার করে যেকোন প্রদত্ত মানবভাষার সমস্ত এবং কেবলমাত্র ব্যাকরণশুদ্ধ বাক্যগুলি “উৎপাদন” করা।[৭][টীকা ৩][৮]

    সিনট্যাক্‌টিক স্ট্রাকচার্স ছিল চম্‌স্কির প্রথম গ্রন্থ। এই একক রচনাটি আকারে ছোট, এর পৃষ্ঠাসংখ্যা একশ’র খানিকটা বেশি। চম্‌স্কি বইটি ভাষাবিজ্ঞানের বিশেষজ্ঞদের জন্য রচনা করেন। মার্কিন যুক্তরাষ্ট্রের ম্যাসাচুসেটস ইন্সটিটিউট অফ টেকনলজি বিশ্ববিদ্যালয়ে স্নাতক পর্যায়ের শিক্ষার্থীদের একটি কোর্সে পড়ানোর জন্য তিনি যে পাঠগুলি তৈরি করেন, সেগুলির উপর ভিত্তি করেই তিনি বইটি লেখেন।[টীকা ৪] বইটিতে লেখা একটি বহুচর্চিত উক্তি হল “কালার্‌লেস গ্রিন আইডিয়াজ স্লিপ ফিউরিয়াসলি” (Colorless green ideas sleep furiously) অর্থাৎ “বর্ণহীন সবুজ ধারণাগুলি প্রচন্ড রেগে ঘুমায়”।[৯] এই ইংরেজি বাক্যটির কোন পরিষ্কার অর্থ নেই। কিন্তু কেবল ব্যাকরণের দৃষ্টিকোণ থেকে একজন মাতৃভাষী ইংরেজি বক্তার কাছে এটিকে একটি শুদ্ধ বাক্য বলে মনে হয়। চম্‌স্কির কাছে তাই বাক্যতত্ত্বের গবেষণা শব্দার্থতত্ত্বের গবেষণা থেকে স্বাধীন একটি বিষয়।[১০][টীকা ৫]

    চম্‌স্কি যখন সিনট্যাক্‌টিক স্ট্রাকচার্স লেখেন, তখনও তিনি শিক্ষায়তনিক অঙ্গনে তেমন পরিচিত হয়ে ওঠেননি।[টীকা ৬] মুটোঁ নামেক একটি ক্ষুদ্র ওলন্দাজ প্রকাশনা সংস্থা বইটি বাজারে বের করে।[টীকা ৭] তা সত্ত্বেও এই সূক্ষ্ম, জটিল ও গভীর বিষয়বস্তুসমৃদ্ধ বইটি শুরুতে ব্যাপক সমাদর পায়। এমনকি তৎকালীন ভাষা বিষয়ক গবেষণার ঐতিহ্যে বইটিকে একটি অন্যতম সংযোজন হিসেবে স্বাগত জানানো হয়।[১১] [টীকা ৮] কিন্তু শীঘ্রই বইটির সাহসী নতুন ধারণাগুলির জন্য প্রতিষ্ঠিত ও বয়স্ক ভাষাবিজ্ঞানীরা এর নেতিবাচক সমালোচনা করতে শুরু করেন।[টীকা ৯] তাদের বিপরীতে তরুণ নবীন ভাষাবিজ্ঞানীরা চম্‌স্কির গবেষণাপদ্ধতিকে উৎসাহের সাথে গ্রহণ করেন।[টীকা ১০] ফলে বিংশ শতাব্দীর দ্বিতীয় ভাগে এসে ভাষাবিজ্ঞান শাস্ত্রের মোড় ঘুরে যায়। এরপর থেকে বাক্যতত্ত্বকে কেন্দ্রে রেখে ভাষার বিধিসম্মত তত্ত্ব নির্মাণের কাজ অনেক স্বাভাবিক একটি কাজে পরিণত হয়। ভাষা গবেষণার এই ধারাতে ভাষিক বক্তার আচরণের পরিবর্তে বক্তার মনের মাঝে ভাষার অবস্থানকে অনেক বেশি গুরুত্ব দেওয়া হয়েছে।[টীকা ১১]

    সিনট্যাক্‌টিক স্ট্রাকচার্স ভাষাবিজ্ঞানের বাইরে জ্ঞানের বেশ কিছু ক্ষেত্রে প্রভাব বিস্তার করেছে। বিশেষ করে দর্শন, মনোবিজ্ঞান এবং বোধনবিজ্ঞানসমূহের উপর বইটি গভীর প্রভাব ফেলে। এছাড়া কম্পিউটার বিজ্ঞান ও স্নায়ুবিজ্ঞানের উপরও বইটিতে বর্ণিত তত্ত্ব প্রভাব ফেলতে সক্ষম হয়।[টীকা ১১] কোনও কোনও বিশেষজ্ঞ চম্‌স্কির তত্ত্ব নিয়ে প্রশ্ন তুলেছেন। তাদের মতে ভাষাকে একটি আদর্শ সংশ্রয় বা ব্যবস্থা হিসেবে বর্ণনা করাটা ভুল। অন্যান্য বিশেষজ্ঞরা মনে করেন চমস্কির তত্ত্বে উপাত্ত সংগ্রহ ও পরীক্ষা-নিরীক্ষাকে যথেষ্ট মূল্য দেওয়া হয়নি।[টীকা ১২] এ সত্ত্বেও ২১শ শতকের শুরুতে এসে ভাষাবিজ্ঞানী ও অন্যান্য পর্যালোচকেরা উভয়েই বইটির প্রশংসা করেন। তারা বইটিকে বিংশ শতাব্দীর অন্যতম গুরুত্বপূর্ণ গবেষণাগ্রন্থ হিসেবে স্বীকৃতি দেন।[৪][টীকা ১৩][১২]

    বিষয়বস্তু

    সিন্ট্যাকটিক স্ট্রাকচার্স বইতে চম্স্কি‌ ভাষাবিজ্ঞানগত কাঠামোর একটি বিধিসম্মত তত্ত্ব তৈরী করতে চেয়েছেন। তিনি সুস্পষ্ট সূত্র প্রয়োগ করে সুনির্দিষ্ট আদল (model) নির্মাণের উপর জোর দিয়েছেন।[১৩]

    ব্যাকরণের গ্রহণযোগ্যতা

    চমস্কি লিখেছেন যে তার মুখ্য চিন্তা ব্যাকরণের গ্রহণয়োগ্যতার সমস্যা নিয়ে। একটি ভাষার ব্যাকরণকে তিনি সেই ভাষার একটি সঠিক তত্ত্ব হিসেবে সংজ্ঞায়িত করেছেন। ভাষাবিজ্ঞানের উদ্দেশ্যকে তিনি প্রাকৃতিক বিজ্ঞানের কর্মপদ্ধতির সমান্তরালে বর্ণনা করেছেন। তিনি বলেছেন যে, যে কোনও বৈজ্ঞানিক তত্ত্ব কিছু সংখ্যক পর্যবেক্ষণের উপর ভিত্তি করে তৈরী হয়। সেই তত্ত্ব ওই পর্যবেক্ষণগুলির মধ্যে সম্পর্ক স্থাপনের চেষ্টা করে এবং নতুন ঘটনার ভবিষ্যদ্বাণী করে। এই দুটি কাজই করা হয় কিছু অনুমিতিনির্ভর সংগঠন (Hypothetical construct হাইপোথেটিক্যাল কনস্ট্রাক্ট) (যেমন পদার্থবিজ্ঞানে, ভর, ইলেক্ট্রন, ইত্যাদি) দ্বারা কিছু সাধারণ সূত্র গঠনের মাধ্যমে। সেইরকম, ইংরেজি ভাষার ব্যাকরণ কিছু সীমিত উচ্চারণের (পর্যবেক্ষণ) উপর নির্ভর করে তৈরী এবং এতে ইংরেজির কিছু বিশেষ ধ্বনিমূল (ফোনিম বা ধ্বনিসমষ্টি), পদসমষ্টি, বাক্য ইত্যাদি দ্বারা নির্মিত কিছু নির্দিষ্ট ব্যাকরণগত নিয়মাবলি (সূত্র) থাকবে। এই নিয়মগুলি যেমন সেই ভাষায় ব্যবহৃত বাক্যগুলির পারস্পরিক গঠনগত সম্পর্ক প্রকাশ করবে, তেমনি অসীম বা অর্নিদিষ্ট সংখ্যক বাক্য যা এখনও উচ্চারিত হয়নি সেগুলোরও ভবিষ্যদ্বাণী করবে। কোন একটি ভাষায় ব্যবহৃত সসীম উচ্চারণগুলিকে তিনি পর্যবেক্ষণের সাথে তুলনা করেছেন এবং ব্যাকরণিক নিয়মগুলিকে সূত্রের সঙ্গে তুলনা করেছেন, যে সুত্রগুলি ধ্বনিমূল, পদসমষ্টি ইত্যাদি বিভিন্ন অনুমিতিনির্ভর সংগঠনের মাধ্যমে বর্ণনা করা হয়।[১৪]

    চমস্কির মতে ব্যাকরণের গ্রহণয়োগ্যতার জন্য প্রয়োজন বাহ্যিক পর্যাপ্ততা, সাধারণীকরণ এবং এরকম আরও কিছু শর্তাবলী পূরণ করা। বাহ্যিক পর্যাপ্ততার উদাহরণ হিসেবে তিনি বলেছেন যে উপযুক্ত ব্যাকরণের দ্বারা উৎপাদিত বাক্যগুলিকে অবশ্যই সেই ভাষাকে মাতৃভাষা হিসেবে ব্যবহারকারী (নেটিভ স্পিকার) -দের কাছে গ্রহণোপযোগী হতে হবে। সাধারণীকরণ বলতে তিনি বুঝিয়েছেন যে, কোন ভাষার ব্যাকরণ একটি নির্দিষ্ট ভাষাবিজ্ঞানভিত্তিক পরিকাঠামোর অনুসারে হবে, যেখানে ফোনেম এবং ফ্রেজ কে কোনো নির্দিষ্ট ভাষার উপর নির্ভর না করেই সংজ্ঞায়িত করা হবে,[১৪] অর্থাৎ ব্যাকরণকে ভাষামুক্ত স্বনির্ভর হতে হবে।

    কোন এক ভাষার লেখা বা উচ্চারণ সমষ্টির জন্য কোন ব্যাকরণটি বেশি ভাল – এই প্রশ্নের উত্তরে চমস্কি বেশি প্রাধান্য দিয়েছেন বিচার পদ্ধতিকে (যা উপর্যুক্ত শর্তাবলীর উপর ভিত্তি করে সবথেকে সম্ভাবনাময় উপযোগী ব্যাকরণটি নির্ধারণ করে)। তিনি স্ট্রাকচারাল লিঙ্গুইস্টিক বা গঠনমূলক ভাষাবিজ্ঞানে ব্যবহৃত ডিসকভারি প্রসেডিয়র অর্থাৎ আবিষ্কার পদ্ধতি (যা সয়ংক্রিয়ভাবে একটি ভাষার লেখাসমষ্টি থেকে সঠিক ব্যাকরণটি বা গ্রামারটি উৎপাদন বা সৃষ্টি করে) অথবা ডিসিশন প্রসেডিয়র অর্থাৎ সিদ্ধান্ত পদ্ধতি (যা একটি ভাষাতে প্রাপ্ত প্রতিযোগী ব্যাকরণসমূহের মধ্যে থেকে সয়ংক্রিয়ভাবে সবথেকে কার্যকরী গ্রামারটিকে চিহ্নিত করে) – এই দুই পদ্ধতির থেকে বিচার পদ্ধতিকে বেশি উপযোগী মনে করেন।[১৫]

    ব্যাকরণসম্মত বাক্য

    চমস্কির মতে একটি ভাষা L-র ভাষাবিজ্ঞানভিত্তিক বা লিঙ্গুইস্টিক বিশ্লেষণের মূল উদ্দেশ্য হল ওই ভাষার গ্রামাটিক্যাল সিকোয়েন্স বা ব্যাকরণসম্মত বাক্যসমুহকে অগ্রামাটিক্যাল বাক্য থেকে আলাদা করা এবং ওই গ্রামাটিক্যাল বাক্যগুলিকে নিরীক্ষণ করা। গ্রামাটিক্যাল বলতে তিনি নেটিভ স্পিকারদের কাছে গ্রহণযোগ্যতাকেই নির্দেশ করেছেন। কোন একটি ভাষা L-এর ব্যাকরণকে তিনি এমন একটি যন্ত্র বলেছেন যা L-এর সমস্ত গ্রামাটিক্যাল পদবিন্যাস বা সিকোয়েন্সগুলি উৎপাদন করবে এবং অগ্রামাটিক্যাল কিছু তৈরী করবে না ।[১৬] গ্রামাটিক্যালিটির ভিত্তি নিয়ে আরও বিশ্লেষণ করতে গিয়ে চমস্কি তিনটি উপায়ের কথা বলেছেন যেগুলি একটি বাক্যের গ্রামাটিক্যাল হওয়া বা না হওয়া নির্ধারণ করতে পারে না, যথা, ১) বাক্যটি লেখাসামগ্রীতে পাওয়া যায়, ২) বাক্যটি অর্থপূর্ণ এবং ৩) বাক্যটি পরিসংখ্যানগত ভাবে সম্ভাব্য। উদাহরণ হিসেবে তিনি একটি বাক্য উল্লেখ করেছেন, কালারলেস গ্রীন আইডিয়াস স্লিপ ফিউরিয়াসলি, যা গ্রামাটিক্যাল অথচ আগে কোন লেখাতে পাওয়া যায় নি, বাক্যটি অর্থপূর্ণ নয় এবং পরিসংখ্যানগতভাবে সম্ভাব্যও নয়।[১৭]

    চমস্কি এই সিদ্ধান্তে উপনীত হয়েছেন যে, ব্যাকরণ হল সয়ংসম্পূর্ণ ও অর্থ থেকে স্বাধীন, এবং সম্ভাবনাভিত্তিক আদলগুলি বাক্যিক গঠনপ্রণালীর মূল সমস্যাগুলিতে তেমন কোনও আলোকপাত করে না।[১৮]

    ব্যাকরণের আদল

    যদি ধরে নেওয়া যায় যে, একটি ভাষার এক গুচ্ছ ব্যাকরণসম্মত বাক্য দিয়ে দেওয়া হয়েছে, তাহলে এরপর চমস্কি যেটা করেন সেটা হল তিনি সেই যন্ত্র বা আদল গঠন করার চেষ্টা করেন যা ওই উচ্চারণ বা কথাগুলোকে যথার্থভাবে বর্ণনা করতে পারে। [১৯] এর উদ্দেশ্যে তিনি প্রথমে আলোচনা করেছেন সসীম অবস্থা ব্যাকরণ (ফাইনাইট স্টেট গ্রামার) নিয়ে, যেটি একটি যোগাযোগ তত্ত্বভিত্তিক (কমিউনিকেশন থিওরিটিক) আদল, যেখানে ভাষা একটি সসীম অবস্থা মার্কভ প্রক্রিয়া (ফাইনাইট স্টেট মার্কভ প্রসেস), যেখানে ভাষার বাক্যগঠন প্রক্রিয়াকে একটি যন্ত্রের এক অবস্থা থেকে পরবর্তী অবস্থাতে গমনের মাধ্যমে বর্ণনা করা হয়।[২০] তারপর তিনি আলোচনা করেছেন ফ্রেজ স্ট্রাকচার গ্রামার বা পদবিন্যাসের গঠনসম্পর্কিত ব্যাকরণ নিয়ে, যে মডেলটি বাক্যের পদবিভাজনের (কনস্টিটুয়েন্ট অ্যানালিসিসের) উপর ভিত্তি করে বানানো। [২১] তিনি দেখান যে দুটো আদলই ভাষাবিশ্লেষণের জন্য অপর্যাপ্ত এবং তিনি বাক্যতত্ত্বের উপর তার নিজস্ব একটি বিধিসম্মত নিয়মনিষ্ঠ তত্ত্ব (ফর্মাল থিওরি) নিবেদন করেন [১৪], যাকে বলা হয় রূপান্তমূলক উৎপাদনশীল ব্যাকরণ (ট্টান্সফর্মেশনাল জেনেরেটিভ গ্রামার), যা ফ্রেজ স্ট্রাকচার বা পদবিন্যাস গঠন ও ব্যাকরণগত রূপান্তরের (গ্রামাটিক্যাল ট্রান্সফর্মেশন) সম্মিলন।

    যেকোন রূপান্তরমূলক ব্যাকরণের (ট্রান্সফর্মেশনাল গ্রামারের) তিনটি সহজাত ব্যবস্থা আছে, যথা ফ্রেজ স্ট্রাকচার নিয়মাবলী, রূপান্তরমূলক (ট্রান্সফর্মেশনাল) নিয়মাবলী এবং রূপধ্বনিভিত্তিক (মরফোফোনেমিক) নিয়মাবলী। ফ্রেজ স্ট্রাকচার নিয়মাবলী ব্যবহার করা হয় ব্যাকরণগত শ্রেণী বা গ্রামাটিক্যাল ক্যাটেগরি সম্প্রসারনের জন্য ও প্রতিস্থাপনের জন্য। এগুলির প্রয়োগের ফলে এক সারি মরফিম (পদ, ওয়ার্ড) তৈরী হয়। একটি ট্রান্সফর্মেশনাল বা রূপান্তরমূলক নিয়ম একসারি মরফিম ও তাদের মধ্যবর্তী কাঠামোর উপর কাজ করে এবং সেটিকে একটি নতুন সারিতে ও নতুন কাঠামোতে রূপান্তরিত করে। এটি মূল সারিটির পুনর্বিন্যাস করতে পারে অথবা কোন মরফিম যুক্ত বা বিযুক্ত করতে পারে। রূপান্তরমূলক নিয়ম দুধরনের হয়, অবলিগেটরি বা বাধ্যতামূলক এবং অপশনাল বা ঐচ্ছিক। বাধ্যতামূলক রূপান্তরমূলক নিয়ম যখন ফ্রেজ স্ট্রাকচারের প্রান্তিক বা অন্তিম মরফিম সারি বা টারমিনাল স্ট্রিংগুলিতে[২২] প্রয়োগ করা হয় তখন সেই ভাষার কার্নেল সমূহ তৈরি হয়, যেগুলি সহজ, অ্যাকটিভ বা কর্ত্তৃবাচক, ঘোষণামূলক বা ডীক্লেরাটিভ এবং সম্মতিবাচক হ্যাঁ-সূচক বা অ্যাফার্মেটিভ বাক্য। জটিল, প্যাসিভ বা কর্মবাচক, নেতিবাচক ও প্রশ্নোবাচক বাক্য গঠন করতে গেলে এক বা একাধিক ঐচ্ছিক রূপান্তরমূলক নিয়ম একটি নির্দিষ্ট ক্রমানুসারে কার্নেল বাক্যগুলির উপর প্রয়োগ করতে হবে। সবশেষে, রূপান্তমুলক নিয়ম প্রয়োগের পরে প্রাপ্ত পদসমষ্টি বা মরফিম সারিকে মরফোফোনেমিক নিয়মাবলীর দ্বার একসারি ফোনেম(ভাষার ধ্বনিতত্ত্বের মূলগত উপাদান)-এ পরিবর্তিত করা হয়। [২৩]

    সিন্ট্যাকটিক স্ট্রাকচারসে চমস্কি জেনেরটিভ বা উৎপাদনশীল বা সৃষ্টিশীল নামে একটি নতুন শব্দের প্রবর্তণ করেছেন এবং এটিকে ব্যবহার করেছেন বিশেষ প্রযুক্তিগত দৃষ্টিভঙ্গি থেকে। যখন চমস্কি বলেন যে একটি ভাষার এক গুচ্ছ সীমিত নিয়মাবলী অসীম বাক্যসমূহ জেনারেট বা সৃষ্টি করবে তখন তিনি আসলে বলতে চান যে ওই নিয়মগুলি ওই ভাষার প্রাপ্ত (বর্তমান) ও অপ্রাপ্ত (ভবিষ্যতে প্রাপ্য) সমস্ত বাক্যসমূহের পুঙ্খানুপুঙ্খ গঠনগত বর্ণনা দেবে।[১৪]

  • সাংস্কৃতিক ভাষাতত্ত্ব

    সাংস্কৃতিক ভাষাতত্ত্ব (Philology) বলতে প্রাচীন রচনাবলি ও তাদের ভাষা নিয়ে গবেষণা বোঝায়। আরও বিস্তৃতভাবে বলতে গেলে মানব যোগাযোগের লিখিত অথবা কথ্য রূপের পটভূমি এবং বর্তমান ব্যবহার জানার যে আগ্রহ তাকে সাংস্কৃতিক ভাষাতত্ত্ব বলা যায়। শাব্দিকভাবে চিন্তা করলে ফিলোলজি শব্দে অর্থ হচ্ছে “শব্দের জন্য ভালোবাসা”। যে ভাষা সম্বন্ধে অধ্যয়ন করা হবে তার উৎস এবং বয়সের তুলনায় সে ভাষায় যে সমস্ত লোক কথা বলে তারা এক্ষেত্রে বেশি গুরুত্বপূর্ণ যদিও উৎস ও বয়সের গুরুত্বও উপেক্ষা করার মত নয়। ফিলোলজি শব্দটি গ্রিক ফিলোস (Φιλος – ভালোবাসা) এবং লোগোস (λογος – শব্দ) থেকে এসেছে। এক হিসেবে কোন একটি ভাষাকে বুঝার জন্য ফিলোলজি সেই ভাষার উৎপত্তির অনুসন্ধানে ব্যপৃত হয় যে কারণে এই তত্ত্বকে বলা যেতে পারে প্রাচীন রচনাবলী এবং ভাষার অধ্যয়ন। অবশ্য এটি একটি স্থুল চিন্তাধারা।

    ভাষাবিজ্ঞান বিষয়ক এই নিবন্ধটি অসম্পূর্ণ। আপনি চাইলে এটিকে সম্প্রসারিত করে উইকিপিডিয়াকে সাহায্য করতে পারেন।
  • সাংগঠনিক অর্থবিজ্ঞান

    সাংগঠনিক অর্থবিজ্ঞান (ইংরেজি: Structural semantics) বলতে ভাষাবিজ্ঞানের একটি শাখাকে বোঝায় যেখানে বাক্যের বিভিন্ন পদগুলির মধ্যকার আর্থিক সম্পর্ক নিয়ে আলোচনা করা হয়। কিভাবে অপেক্ষাকৃত ক্ষুদ্রতর একাধিক এককের অর্থ মিলিত হয়ে বৃহত্তর ভাষিক এককের অর্থ গঠন করে, তাও এই শাখার আলোচ্য।

  • সর্বোচ্চ সন্তুষ্টিবিধান তত্ত্ব

    সর্বোচ্চ সন্তুষ্টিবিধান তত্ত্ব (ইংরেজি: Optimality Theory অপ্‌টিম্যালিটি থিওরি, সংক্ষেপে OT ওটি) ভাষার একটি আদল বা মডেল। অ্যালান প্রিন্স এবং পল স্মোলেন্‌স্কি ১৯৯১ সালে একটি বক্তৃতাতে এই আদলটি প্রস্তাব করেন[১] এবং ১৯৯৩ সালে এর উপর একটি গবেষণাপত্র প্রকাশ করেন।[২] এই তত্ত্বে তারা প্রস্তাব করেন যে ভাষার উপরিস্থিত বা বাহ্যিক যে রূপটি আমরা শুনি, সেটি আসলে মনের ভেতরে ভাষার অধঃস্থ বা আভ্যন্তরীণ রূপের উপর অনেকগুলি প্রতিদ্বন্দ্বী সীমাবদ্ধতার সর্বোচ্চ সন্তুষ্টিবিধানের ফলাফল।

    এই তত্ত্বের তিনটি প্রধান অংশ আছে: GEN (উৎপাদন), CON (সীমাবদ্ধতা), এবং EVAL (মূল্যায়ন)।

    GEN: এই অংশটি প্রবিষ্ট ভাষিক উপাত্ত থেকে সমস্ত সম্ভাব্য ফলাফলের (বা প্রার্থীর) একটি তালিকা উৎপাদন (Generate) করে।

    CON: এই অংশটি প্রয়োজনীয় মানদণ্ড, মাপকাঠি বা সীমাবদ্ধতাগুলি (Constraints) প্রদান করে, যেগুলি ব্যবহার করে সম্ভাব্য ফলাফলের তালিকা থেকে বিজয়ী প্রার্থীটিকে নির্বাচন করা হবে।

    EVAL: সীমাবদ্ধতাগুলি মূল্যায়ন (Evaluation) করে সর্বোচ্চ সন্তোষজনক প্রার্থীটিকে নির্বাচন করে।

    সর্বোচ্চ সন্তুষ্টিবিধান তত্ত্বটি ধরে নেয় যে এই সীমাবদ্ধতাগুলি বিশ্বজনীন অর্থাৎ সমস্ত মনুষ্য ভাষার জন্যই প্রযোজ্য। কিন্তু এই বিশ্বজনীন সীমাবদ্ধতার সেট বা দলটিতে সীমাবদ্ধতাগুলির ক্রমিক অবস্থান একেক ভাষাতে একেক রকম। কোনো নির্দিষ্ট ভাষাতে সীমাবদ্ধতাগুলির যে অদ্বিতীয় বা অনন্য ক্রম, সেটিই ঐ ভাষাটির নিজস্ব ব্যাকরণ।

    সর্বোচ্চ সন্তুষ্টিবিধান তত্ত্বটি মূলত উৎপাদনশীল ধ্বনিতত্ত্বে প্রয়োগ করা হয়েছে। তবে বাক্যতত্ত্ব এবং শব্দার্থতত্ত্বেও এর প্রয়োগ দেখা যায়।

    অন্যান্য উৎপাদনশীল ব্যাকরণ তত্ত্বের মত সর্বোচ্চ সন্তুষ্টিবিধান তত্ত্বটিও বিশ্বজনীন নীতিসমূহ, ভাষিক শ্রেণীকরণবিদ্যা এবং ভাষা অর্জনের মত ব্যাপারগুলির উপর জোর দিয়েছে।

  • সমাজভাষাবিজ্ঞান

    সমাজভাষাবিজ্ঞান (ইংরেজি: Sociolinguistics) একটি আন্তঃক্ষেত্রীয় বিদ্যা যেখানে ভাষাবিজ্ঞান তত্ত্বের প্রয়োগের মাধ্যমে বিভিন্ন সমাজে ও একই সমাজের বিভিন্ন স্তরে ভাষার বৈচিত্র্যের ওপর গবেষণা সম্পাদন করা হয়।

    গ্রন্থপঞ্জি

    • Labov, William (১৯৭২), Sociolinguistic Patterns, Philadelphia: University of Pennsylvania Press
    • Trudgill, Peter (১৯৮৩), Sociolinguistics, Harmondsworth: Penguin
    ভাষাবিজ্ঞান বিষয়ক এই নিবন্ধটি অসম্পূর্ণ। আপনি চাইলে এটিকে সম্প্রসারিত করে উইকিপিডিয়াকে সাহায্য করতে পারেন।
  • সংজ্ঞানাত্মক ভাষাবিজ্ঞান

    এবং সংজ্ঞানাত্মক বিজ্ঞানে সংজ্ঞানাত্মক ভাষাবিজ্ঞান (ইংরেজি: Cognitive Linguistics) বলতে ভাষাবিজ্ঞানের একটি ঘরানাকে বোঝায়, যেখানে মনে করা হয়, মানুষের সামগ্রিক সংজ্ঞান (cognition) প্রক্রিয়ার প্রেক্ষিতেই ভাষার সৃষ্টি, শিখন, ও ব্যবহার সবচেয়ে ভালভাবে ব্যাখ্যা করা সম্ভব। সংজ্ঞানাত্মক ভাষাবিজ্ঞানীরা তিনটি মূল অবস্থান গ্রহণ করেছেন। প্রথমত, ভাষার জন্য মনে বা মস্তিষ্কে যে একটি আলাদা স্বয়ংক্রিয় ব্যবস্থা আছে, সেটি তারা অস্বীকার করেন। দ্বিতীয়ত, তারা “ধারণায়ন” (conceptualization)-এর প্রেক্ষিতে ব্যাকরণ বোঝার চেষ্টা করেন। এবং তৃতীয়ত, তারা দাবী করেন যে ভাষার ব্যবহারের মধ্যে দিয়ে মানুষের মধ্যে ভাষা সম্পর্কিত জ্ঞান গড়ে ওঠে। [১]

    তথ্যসূত্র

    1. Croft, William and D. Alan Cruse (২০০৪)। Cognitive Linguistics। Cambridge: Cambridge University Press। পৃষ্ঠা 1

    আরও পড়ুন

    • Evans, Vyvyan; Benjamin Bergen & Joerg Zinken (2007). The Cognitive Linguistics Reader. London: Equinox.
    • Evans, Vyvyan, Benjamin K. Bergen and Jörg Zinken. The Cognitive Linguistics Enterprise: An Overview[স্থায়ীভাবে অকার্যকর সংযোগ]. In Vyvyan Evans, Benjamin K. Bergen and Jörg Zinken (Eds). The Cognitive Linguistics Reader. Equinox Publishing Co.
    • Geeraerts, D. & H. Cuyckens, eds. (2007). The Oxford Handbook of Cognitive Linguistics. New York: Oxford University Press.
    • Geeraerts, D., ed. (2006). Cognitive Linguistics: Basic Readings. Berlin / New York: Mouton de Gruyter.
    • Kristiansen et al., eds. (2006). Cognitive Linguistics: Current Applications and Future Perspectives. Berlin / New York: Mouton de Gruyter.
    • Rohrer, T. Embodiment and Experientialism in Cognitive Linguistics. In the Handbook of Cognitive Linguistics, Dirk Geeraerts and Herbert Cuyckens, eds., Oxford University Press, forthcoming.
    • Gilles Fauconnier has written a brief, manifesto-like introduction to Cognitive linguistics, which compares it to mainstream, Chomsky-inspired linguistics. See Introduction to Methods and Generalizations. In T. Janssen and G. Redeker (Eds). Scope and Foundations of Cognitive Linguistics. The Hague: Mouton De Gruyter. Cognitive Linguistics Research Series. (on-line version)
    • Grady, Oakley, and Coulson (1999). “Blending and Metaphor”. In Metaphor in cognitive linguistics, Steen and Gibbs (eds.). Philadelphia: John Benjamins. (online version)
    • Schmid, H. J. et al. (1996). An Introduction to Cognitive Linguistics. New York, Longman.
    • Fauconnier, G. (1997). Mappings in Thought and Language.
    • Taylor, J. R. (2002). Cognitive Grammar. Oxford, Oxford University Press.
    • Croft, W. & D.A. Cruse (2004) Cognitive Linguistics. Cambridge: Cambridge University Press.
    • Tomasello, M. (2003). Constructing a Language. A Usage-Based Theory of Language Acquisition. Harvard University Press.
    • Fauconnier, Gilles and Mark Turner (2003). The Way We Think. New York: Basic Books.

    বিষয়শ্রেণীসমূহ:

  • শব্দার্থে দ্ব্যর্থতা নিরসন

    এই নিবন্ধটি অসম্পূর্ণ। আপনি চাইলে এটিকে সম্প্রসারিত করে উইকিপিডিয়াকে সাহায্য করতে পারেন।

    মানচিত্র

    শব্দার্থে দ্ব্যর্থতা নিরসন (ইংরেজি: word sense disambiguation বা সংক্ষেপে, WSD) গণনীয় ভাষাতত্ত্বপ্রাকৃতিক ভাষা প্রক্রিয়াকরণের একটি খোলা সমস্যা (open problem)। শব্দার্থে দ্ব্যর্থতা নিরসনের কাজ হল যখন কোন শব্দের একের অধিক মান (sense) অথবা অর্থ (meaning) থাকে, সেখান থেকে সঠিক অর্থটি খুঁজে বের করা।

    উদাহরণস্বরূপ বলা যায়, ‘আমি ভাত খাই।’ – এ বাক্যেভাত‘ শব্দটি একটি দ্ব্যর্থ (যা বোধগোম্য নয়) শব্দ। এখানে কম্পিউটারকে বুঝতে হবে যে এ বাক্যে ‘ভাত’ শব্দটির মানে ‘দিনে প্রায় দু’বার নিয়মিত সময় নেওয়া সম্পূর্ণ আহার’, কিন্তু ‘খাওয়ার জন্য জলে সিদ্ধ করা চাল’ নয়।

    এ ধরনের সমস্যার সমাধান অন্যান্য কম্পিউটার সংক্রান্ত লেখার উপর প্রভাব ফেলে, যেমন, বকৃতা, অন্বেষণ যন্ত্রের (বা, সার্চ ইঞ্জিন) প্রাসঙ্গিকতা উন্নয়ন, অ্যানাফোরা বিশ্লেষণ (anaphora resolution), সংসক্তি, অন্বীক্ষা, ইত্যাদি।

    মানব মস্তিষ্ক শব্দার্থে দ্ব্যর্থতা নিরসনে বেশ দক্ষ। যদিও সত্য যে প্রাকৃতিক ভাষা এমন উপায়ে গঠিত হয় যে এর স্নায়ু বাস্তবতার প্রতিফলন খুবই প্রয়োজন। অন্য কথায়, মানুষের ভাষা এমন উপায়ে গঠিত হয় যা মস্তিষ্কের স্নায়বিক জাল দ্বারা প্রদত্ত সহজাত ক্ষমতার প্রতিফলন (এবং আকার দিতে সাহায্য করে)। কম্পিউটার বিজ্ঞানতথ্য প্রযুক্তিতে যেখানে এটা করা যায়, সেখানে প্রাকৃতিক ভাষা প্রক্রিয়াকরণ ও যন্ত্র শিক্ষণ দেওয়ার জন্য কম্পিউটারের ক্ষমতার বিকাশ ঘটাতে বিজ্ঞানীদের জন্য এটি একটি দীর্ঘ মেয়াদী চ্যালেঞ্জ ছিল।

    শব্দার্থে দ্ব্যর্থতা নিরসন করতে এখন পর্যন্ত বিভিন্ন রকমের প্রচুর কৌশলের খোঁজ করা হয়েছে। যেমন, অভিধান-ভিত্তিক পদ্ধতি থেকে (যা কিনা আভিধানিক সম্পদের মধ্যে নিহিত জ্ঞান ব্যবহার করে), পরিদর্শিত যন্ত্র শিক্ষণ পদ্ধতি (যেখানে প্রতিটি শব্দের জন্য হাতে প্রস্তুত করা সঠিকঅর্থসহ উদাহরনের লিখন থেকে এক একটি শ্রেণীবদ্ধকারীকে প্রশিক্ষণ দেওয়া হয়), অপরিদর্শিত যন্ত্র শিক্ষণ পদ্ধতি (যা শব্দের উপস্থিতির গুচ্ছ তৈরী করে যার ফলে অর্থপূর্ন শব্দের আরোহন ঘটে) পর্যন্ত। ক্যাভিয়েট হোস্ট (host of caveat) ছাড়া বর্তমান গাণিতিক পরিভাষার (algorithm) যথার্থতা বর্ণনা করা কঠিন। ইংরেজি ভাষার ক্ষেত্রে অপকৃষ্টবুনান (coarse-grained) পর্যায়ের সঠিকতার মাত্রা নিয়মিতভাবে ৯০ ভাগের উপরে, কোন নির্দিষ্ট সমপ্রকৃতি শব্দ নিয়ে কিছু পদ্ধতি ৯৬ ভাগের উপরে সফলতা অর্জন করে।