|
Новостной интегратор Digester предназначен для получения актуальной
новостной информации и проведения анализа информационного потока, получаемого из
открытых источников. Основное назначение продукта - предоставить пользователям всесторонние
возможности по поиску, отбору и анализу информации по разнообразным тематикам.
Система Digester представляет собой базу данных новостных
сообщений, поступающих из различных открытых новостных источников. Статьи, поступающие
в систему, индексируются, а также проходят дополнительную обработку для выделения
из них аналитической информации. Автоматическая обработка информации включает в
себя:
-
аннотирование текстов;
-
кластеризацию текстов по сюжетам;
-
выделение значимых информационных объектов (персоны и объекты);
-
классификацию текстов по рубрикам.
В результате пользователь системы получает возможность проводить поиск по обработанным
статьям, как средствами языка запросов полнотекстового поиска, так и с помощью дополнительных
инструментов, основанных на извлеченной из массива статей информации.
Система Digester оперативно индексирует предоставленные данные, после чего они становятся
доступными для поиска пользователями. На страницах размещаются заголовки сообщений,
ссылки с которых ведут на сайты изданий.
Язык запросов
Система Digester основана на общепринятом специализированном языке
запросов, который содержит набор логических и групповых операторов.
Поиск в системе осуществляется с учетом морфологии русского и английского языков.
Поэтому, независимо от употребленной в запросе формы слова, поисковая система будет
искать все формы слова по правилам языка. Например, по запросу “Россия”, поисковая
система будет искать слова “Россия”, “Россию”, “России” и т. д., но не “российский”.
Простые запросы
Для проведения поиска по интересующей тематике достаточно ввести интерсующую фразу
в поле запроса. Пример: чемпионат мира по футболу.
Комплексные запросы
Использование операторов языка запросов позволяет дать более точное описание интересующей
тематики и получить более релевантные результаты поиска. Ниже предоставлен список
операторов языка запроса поисковой системы Digester.
|
Выражение
|
Пример
|
Результат
|
|
Отдельное слово
|
машина
|
Документы, содержащие слово “машина”.
|
|
Фраза в кавычках
|
“чемпионат мира по футболу”
|
Документы, содержащие подряд идущие слова “чемпионат“,
“мира”, “по”
и “футболу”.
|
|
Групповой символ "?"
|
Чакв?тадзе
|
Документы, содержащие слова “Чаквитадзе”, “Чакветадзе” и т.д. Знак вопроса может
заменять любой символ, но должен стоять не раньше, чем через 3 символа от начала
слова.
|
|
Групповой символ "*"
|
машин*
|
Документы, содержащие слова, которые начинаются на “машин”: “машина”, “машинный”,
“машины” и т.д.
Символ "*" используется для замены одного или более символов.
|
|
Поиск близости
|
"владелец машина" ~4
|
Документы, содержащие слова "владелец" и "машина", расстояние между которым не превышает
4 слова.
|
|
Операторы "ИЛИ", "OR"
|
машина ИЛИ мотоцикл
машина OR мотоцикл
|
Документы, содержащие слово “машина” или слово “мотоцикл” или оба слова одновременно.
|
|
Операторы "И", "AND"
|
машина AND мотоцикл
машина И мотоцикл
|
Документы, содержащие слова “машина” и “мотоцикл” одновременно.
|
|
Операторы "-", "NOT"
|
машина NOT мотоцикл
машина -мотоцикл
|
Документы, содержащие слово “машина” и не содержащие слово “мотоцикл”
|
|
группировка
|
владелец И (машина ИЛИ мотоцикл)
|
Документы, содержащие слова “владелец” и “машина” или слова “владелец” и “мотоцикл”
|
При поиске нельзя использовать следующие символы:
“+ - && || ! ( ) { } [ ] ^ " ~ * ? : \”, поскольку они являются
специализированными.
Главная страница
На главной странице располагается список
самых последних сюжетов и рейтинги упоминаемости.
В разделе “Главные новости” приводится
список сюжетов за сегодняшний день. В разделах рубрик приводятся сюжеты соответствующих
рубрик. Для того чтобы просмотреть полный список сюжетов раздела, необходимо кликнуть
на название соостветствующго раздела.
Для просмотра документов, входящих в сюжет,
кликните на названии соответствующего сюжета. Для просмотра докуметов, входящих
в сюжет, необходимо кликнуть по названию сюжета.
Раздел “Рейтинги” содержит рейтинги упоминаемости
людей и объектов. Для просмотра полных рейтингов, кликните по названию раздела “Рейтинги”.
Поиск
Выполнение поискового запроса

Для выполнения поиска в системе Digester достаточно ввести поисковый
запрос в поле поискового запроса, выбрать интересующий временной диапазон поиска
и нажать на кнопку “Искать”.
Результаты поиска

Страница результатов поиска содержит список документов, релевантных поисковому запросу,
график распределения документов по датам и панель управления фильтрами.
Документы, релевантные поисковому запросу, выводятся с указанием даты публикации,
источника и аннотации.
График распределения документов по датам показывает временное распределение документов,
релевантных запросу.
Панель управления позволяет накладывать фильтры на результаты поиска по диапазону
дат, рубрикам и источникам.
Фильтрация результатов поиска

Панель управления содержит список возможных фильтров и количество документов, которое
получится в результате фильтрации. Фильтры разбиты на три категории: по временному
периоду, рубрикам и источникам. Чтобы наложить фильтр на результаты поиска кликните
по его названию. Чтобы отменить фильтр нажмите на кнопку “+”.
Рейтинги
На этой странице представлены результаты автоматического выделения информационных
объектов из текста. С помощью оригинальной технологии, основанной на применении
Марковских цепей происходит выделение именнованых объектов (персон, организаций,
локаций и т.д) и последующее сведение в рейтинговую таблицу. В настоящее время публикуются
рейтинги по персонам (О ком пишут) и объектам (О чем пишут). Цифра
слева от объекта показывает место в сегодняшнем рейтинге, цифра справа – количество
документов, в которых объект был упомянут. Чтобы задать запрос и произвести поиск
документов, кликните по ссылке. Календарь позволяет просмотреть рейтинги за любую
выбранную дату.
|