نوع همکاری : مجری
کارفرما : پژوهشگاه ارتباطات و فناوری اطلاعات
سال طرح : 1395
مشاهده سایر طرح های سید محمد باقر سجادی
گراف دانش مجموعه بزرگی از موجودیت‌های و ارتباط بین آن‌هاست که یک پایگاه دانش پویا را تشکیل می‌دهد. گراف دانش فارسی با بیش از ۴۰۰ هزار موجودیت زبان فارسی و ۵/۶ میلیون رابطه ایجاد شده است. با توجه به این‌که این گراف بین دامنه‌ای است در حوزه‌های متنوع اشخاص مشهور، مکان‌های مهم، سازمان‌ها و شرکت‌ها، آثار ادبی و هنری، گونه‌های زیستی شامل گیاهان و حیوانات، رویدادها، زیست‌شناسی، اخترشناسی دارای اطلاعات غنی است. عمده داده‌های این گراف از مقالات ویکی‌پدیای فارسی به خصوص اطلاعات ساخت‌یافته آن نظیر جعبه‌های اطلاعاتی فراهم شده است. همچنین اطلاعات برخی جداول وب مانند اعضای هیئت علمی برخی دانشگاه‌ها خزش شده و به گراف افزوده شده است. از نوآوری‌های این محصول، استخراج اطلاعات از متن خام است به طوریکه ۲۰۰ هزار رابطه از متن خبری و همچنین مقالات ویکی‌پدیا به گراف افزوده شده است. در این محصول، هستان‌شناسی DBpedia مطابق ویکی‌پدیای فارسی توسط خبرگان زبان فارسی، سفارشی شده و در نگاشت بیش از ۷۰۰۰ خصیصه و الگوی ویکی‌پدیا مورد استفاده قرار گرفته است. از مهم‌ترین مولفه‌های این محصول می‌توان به سامانه جستجو روی گراف دانش اشاره نمود. با استفاده از این مولفه می‌توان به موتورهای جستجو خدمت‌های ارزنده‌ای را ارائه نمود به طوری‌که قابلیت جستجو روی پرسش‌های پر کاربرد دنیای وب وجود دارد. در برخی از پرس‌وجوها، پاسخ‌های گراف دانش فارسی از گراف دانش گوگل در زبان فارسی بهتر عمل می‌نماید.