نوع همکاری : مجری
کارفرما : پژوهشگاه ارتباطات و فناوری اطلاعات
سال طرح : 1395
مشاهده سایر طرح های سید محمد باقر سجادی
گراف دانش مجموعه بزرگی از موجودیتهای و ارتباط بین آنهاست که یک پایگاه دانش پویا را تشکیل میدهد.
گراف دانش فارسی با بیش از ۴۰۰ هزار موجودیت زبان فارسی و ۵/۶ میلیون رابطه ایجاد شده است. با توجه به اینکه این گراف بین دامنهای است در حوزههای متنوع اشخاص مشهور، مکانهای مهم، سازمانها و شرکتها، آثار ادبی و هنری، گونههای زیستی شامل گیاهان و حیوانات، رویدادها، زیستشناسی، اخترشناسی دارای اطلاعات غنی است.
عمده دادههای این گراف از مقالات ویکیپدیای فارسی به خصوص اطلاعات ساختیافته آن نظیر جعبههای اطلاعاتی فراهم شده است. همچنین اطلاعات برخی جداول وب مانند اعضای هیئت علمی برخی دانشگاهها خزش شده و به گراف افزوده شده است. از نوآوریهای این محصول، استخراج اطلاعات از متن خام است به طوریکه ۲۰۰ هزار رابطه از متن خبری و همچنین مقالات ویکیپدیا به گراف افزوده شده است.
در این محصول، هستانشناسی DBpedia مطابق ویکیپدیای فارسی توسط خبرگان زبان فارسی، سفارشی شده و در نگاشت بیش از ۷۰۰۰ خصیصه و الگوی ویکیپدیا مورد استفاده قرار گرفته است.
از مهمترین مولفههای این محصول میتوان به سامانه جستجو روی گراف دانش اشاره نمود. با استفاده از این مولفه میتوان به موتورهای جستجو خدمتهای ارزندهای را ارائه نمود به طوریکه قابلیت جستجو روی پرسشهای پر کاربرد دنیای وب وجود دارد. در برخی از پرسوجوها، پاسخهای گراف دانش فارسی از گراف دانش گوگل در زبان فارسی بهتر عمل مینماید.