چکیده :

چکیده: پژوهش حاضر با هدف شناسایی واژه های غیرمفهومی در زبان فارسی و تهـیه سیاهه ای از این واژه ها برای نمایه سازی خودکار متنهای فارسی در رشته های روانشناسی، علوم تربیتی و کتابداری و اطلاع رسانی انجام شده است. این پژوهش با روش تحلیل محتوا صورت گرفته است. جامعه آماری این پژوهش را مقاله‌های مندرج در آخرین شماره منتشر شده در مجله‌های علمی و پژوهشی ِ رشته های علـوم تربیتی، روانشناسی و کتابداری و اطلاع رسانی در سال 1385 تشکیل می‌دهد. نمونه شامل 63 مقاله است. گردآوری داده ها با استفاده از تفکیک واژگان به صورت ماشینی و دستی صورت گرفت. نتایج پژوهش نشان داد: 1- افعال ( معین و همراه شونده)، قیدها، ضمایر، حروف، اصوات، اعداد و علائم سجاوندی به عنوان واژه نمایه ها ظاهر نمی شوند، بنابراین، آنها را می توان واژه های غیرمفهومی یا به اصطلاح واژه های بازدارنده تلقی کرد. 2- بدون احتساب علائم سجاوندی، در رشتة علوم تربیتی 96/39%، در رشته روانشناسی 57/38% و در رشـــته کتابداری 12/38% از حجم متون را واژه های غیرمفهومی تشکیل می دهد. 3- واژه های بازدارندة پربسامد در هرسه حوزه تقریبا مشابه است. 4- از تعداد 248552 واژه (بدون احتساب علائم سجاوندی) که پیکرة زبانی مورد مطالعه را تشکیل می داد، 97280 واژه که 94/38% کل واژه‌ها را شامل می شود، جزء واژه های بازدارنده هستند.5- نتیجة مقایسه فهرست فارسی حاصل از پژوهش با فهرست واژه های بازدارنده انگلیسی نشان داد بین این دو فهرست به میزان 5/28% همپوشانی وجود دارد. 6. همچنین 38/20% از واژه ها فاقد توزیع بسامدی یکسان در سه رشتة مورد مطالعه می باشند.

کلید واژگان :

واژه های غیرمفهومی, واژه های بازدارنده, نمایه سازی خودکار, ساخت واژگانی زبان



ارزش ریالی : 350000 ریال
دریافت مقاله
با پرداخت الکترونیک