Другие продукты:
подробнее на neurocomp.ru
|
Система автоматизации построения тезауруса поисковой системыПо мере развития сети Интернет обостряется парадокс: вероятность присутствия необходимой информации в глобальном информационном пространстве растет, а вероятность ее нахождения — уменьшается. Это происходит потому, что наполнение Сети громадно по объему, очень разнородно, быстро обновляется, плохо поддается структуризации и управлению. В этой ситуации особую актуальность приобретают исследования, направленные на повышение эффективности поиска информации. На сегодняшний день наиболее популярное средство поиска информации в Сети — машины поиска (МП) по ключевым словам. Формулировка информационной потребности на языке запросов — наиболее сложный и трудно формализуемый этап поиска. В отличие от традиционной библиотеки, где можно обратиться за помощью к библиографу, при обращении к МП пользователь оказывается «один на один» с поисковой системой. Тезаурус является неотъемлемой частью поисковой системы и представляет собой иерархическую сеть понятий, соответствующих тем или иным значениям отдельных слов или текстовых выражений. Для описания связей между понятиями используется традиционная для тезаурусов система семантических отношений. Все семантические связи имеют весовой коэффициент. Ручное построение тезауруса, с одной стороны, довольно тривиальная задача, с другой, — крайне трудоемкая, так как требует привлечения специалистов (экспертов предметной области и лингвистов) для выделения семантических отношений между понятиями. Разработка тезаурусов как правило сложна, поэтому в открытом доступе трудно найти достаточно полные тезаурусы. Как правило это дорогие продукты. Особенно сложно найти открытый исходный код или библиотеки для внедрения в программные продукты. Мы предлагаем универсальное автоматизированное решение для построения тезаурусов любой сложности. Предлагаемая система автоматизации построения тезауруса позволяет значительно удешивить построение тезауруса, а так же обладает следующими чертами:
Нами была проведена работа с материалами докладов еженедельного семинара «Геометрия и физика» Российского гравитационного общества под руководством Ю.С. Владимирова, посвященного обсуждению актуальных проблем астрофизики, теории гравитации и др. В период с 1972г. – по 2008. В результате был построен тезаурус данной предметной области. Построенная программа может использоваться во всех традиционных областях применения классических тезаурусов.
Главная цель автоматизации построения тезауруса — внедрение в программные продукты, в поисковые системы в частности.
|




