Главная | Рейтинги Политика | Экономика | Общество |  В мире | Происшествия | Спорт | Культура | Hi-Tech Информеры | Помощь

Новостной интегратор Digester предназначен для получения актуальной новостной информации и проведения анализа информационного потока, получаемого из открытых источников. Основное назначение продукта - предоставить пользователям всесторонние возможности по поиску, отбору и анализу информации по разнообразным тематикам.

Система Digester представляет собой базу данных новостных сообщений, поступающих из различных открытых новостных источников. Статьи, поступающие в систему, индексируются, а также проходят дополнительную обработку для выделения из них аналитической информации. Автоматическая обработка информации включает в себя:

  1. аннотирование текстов;

  2. кластеризацию текстов по сюжетам;

  3. выделение значимых информационных объектов (персоны и объекты);

  4. классификацию текстов по рубрикам.

В результате пользователь системы получает возможность проводить поиск по обработанным статьям, как средствами языка запросов полнотекстового поиска, так и с помощью дополнительных инструментов, основанных на извлеченной из массива статей информации.

Система Digester оперативно индексирует предоставленные данные, после чего они становятся доступными для поиска пользователями. На страницах размещаются заголовки сообщений, ссылки с которых ведут на сайты изданий.


Язык запросов

Система Digester основана на общепринятом специализированном языке запросов, который содержит набор логических и групповых операторов.

Поиск в системе осуществляется с учетом морфологии русского и английского языков. Поэтому, независимо от употребленной в запросе формы слова, поисковая система будет искать все формы слова по правилам языка. Например, по запросу “Россия”, поисковая система будет искать слова “Россия”, “Россию”, “России” и т. д., но не “российский”.


Простые запросы

Для проведения поиска по интересующей тематике достаточно ввести интерсующую фразу в поле запроса. Пример: чемпионат мира по футболу.


Комплексные запросы

Использование операторов языка запросов позволяет дать более точное описание интересующей тематики и получить более релевантные результаты поиска. Ниже предоставлен список операторов языка запроса поисковой системы Digester.

 

Выражение

Пример

Результат

Отдельное слово

машина

Документы, содержащие слово “машина”.

Фраза в кавычках

чемпионат мира по футболу

Документы, содержащие подряд идущие слова “чемпионат“, “мира”, “по” и “футболу”.

Групповой символ "?"

Чакв?тадзе

Документы, содержащие слова “Чаквитадзе”, “Чакветадзе” и т.д. Знак вопроса может заменять любой символ, но должен стоять не раньше, чем через 3 символа от начала слова.

Групповой символ "*"

машин*

Документы, содержащие слова, которые начинаются на “машин”: “машина”, “машинный”, “машины” и т.д.

Символ "*" используется для замены одного или более символов.

Поиск близости

"владелец машина" ~4

Документы, содержащие слова "владелец" и "машина", расстояние между которым не превышает 4 слова.

Операторы "ИЛИ", "OR"

машина ИЛИ мотоцикл

машина OR мотоцикл

Документы, содержащие слово “машина” или слово “мотоцикл” или оба слова одновременно.

Операторы "И", "AND"

машина AND мотоцикл

машина И мотоцикл

Документы, содержащие слова “машина” и “мотоцикл” одновременно.

Операторы "-", "NOT"

машина NOT мотоцикл

машина -мотоцикл

Документы, содержащие слово “машина” и не содержащие слово “мотоцикл”

группировка

владелец И (машина ИЛИ мотоцикл)

Документы, содержащие слова “владелец” и “машина” или слова “владелец” и “мотоцикл”

 При поиске нельзя использовать следующие символы: “+ - && || ! ( ) { } [ ] ^ " ~ * ? : \”, поскольку они являются специализированными.

 

Главная страница

Главная страница Digester.RU 

На главной странице располагается список самых последних сюжетов и рейтинги упоминаемости.

В разделе “Главные новости” приводится список сюжетов за сегодняшний день. В разделах рубрик приводятся сюжеты соответствующих рубрик. Для того чтобы просмотреть полный список сюжетов раздела, необходимо кликнуть на название соостветствующго раздела.

Для просмотра документов, входящих в сюжет, кликните на названии соответствующего сюжета. Для просмотра докуметов, входящих в сюжет, необходимо кликнуть по названию сюжета.

Раздел “Рейтинги” содержит рейтинги упоминаемости людей и объектов. Для просмотра полных рейтингов, кликните по названию раздела “Рейтинги”.

Поиск

Выполнение поискового запроса

Главная страница Digester.RU

Для выполнения поиска в системе Digester достаточно ввести поисковый запрос в поле поискового запроса, выбрать интересующий временной диапазон поиска и нажать на кнопку “Искать”.

Результаты поиска


Главная страница Digester.RU

 

Страница результатов поиска содержит список документов, релевантных поисковому запросу, график распределения документов по датам и панель управления фильтрами.

Документы, релевантные поисковому запросу, выводятся с указанием даты публикации, источника и аннотации.

График распределения документов по датам показывает временное распределение документов, релевантных запросу.

Панель управления позволяет накладывать фильтры на результаты поиска по диапазону дат, рубрикам и источникам.


Фильтрация результатов поиска

Главная страница Digester.RU

Панель управления содержит список возможных фильтров и количество документов, которое получится в результате фильтрации. Фильтры разбиты на три категории: по временному периоду, рубрикам и источникам. Чтобы наложить фильтр на результаты поиска кликните по его названию. Чтобы отменить фильтр нажмите на кнопку “+”.

 

Рейтинги

 

На этой странице представлены результаты автоматического выделения информационных объектов из текста. С помощью оригинальной технологии, основанной на применении Марковских цепей происходит выделение именнованых объектов (персон, организаций, локаций и т.д) и последующее сведение в рейтинговую таблицу. В настоящее время публикуются рейтинги по персонам (О ком пишут) и объектам (О чем пишут). Цифра слева от объекта показывает место в сегодняшнем рейтинге, цифра справа – количество документов, в которых объект был упомянут. Чтобы задать запрос и произвести поиск документов, кликните по ссылке. Календарь позволяет просмотреть рейтинги за любую выбранную дату.



ТелеХаус, 2009.       Выпуск для Украины