« предыдущая статья | Все статьи | следующая »
Корпоративный поиск
dtSearch 7.0
Разработчик: dtsearch Corp.
Официальный сайт: www .dtsearch .com
Цена: $199
Размер дистрибутива: 23,1 Мб
Разработка компании dtSearch Corp . dtSearch Desktop со встроенным dtSearch Spider умеет индексировать и находить не только файлы на компьютере пользователя, но и веб узлы (на заданную глубину), ресурсы локальной сети, а также использовать внешние индексы, созданные на других компьютерах. Как и следовало ожидать, dtSearch распознает различные кодировки, в том числе и кириллические, а также множество форматов файлов, такие как . doc , . xls , . rtf , . pdf , . html и так далее. Нужно отметить также возможность поиска в базах данных в общем и по содержимому конкретных полей в них в частности.
Кроме традиционного поиска на «естественном языке» или с помощью формальных запросов, в dtSearch есть еще несколько видов поиска: с учетом морфологии, нечеткий (подразумевающий возможные ошибки и опечатки), фонетический (с учетом сходных по звучанию слов) и синонимический. Но это все заявленные возможности. Хотя должен сказать, что особых расхождений с продекларированными функциями я не обнаружил.
Тестовые 20 гигабайт информации dtSearch Desktop 7.0 проиндексировала за 6 часов 13 минут, создав для нужд последующего поиска индекс размером 7.9 Гб.
Что касается непосредственно поиска документов, то накладок у программы не было. Как не было их ни с заявленной морфологией, ни с нечетким поиском. Система вполне адекватно находила нужные документы (хоть и с небольшой паузой – 20 гигабайт все-таки) и по простому запросу в одно слово и по использовании в качестве ключевой фразы пары абзацев какого либо документа. Хотя должен заметить, что при поиске по приличному фрагменту текста (в несколько десятков слов) система «подвисала» на некоторое время, прежде чем выдать результат.
Плюсы dtSearch Desktop 7.0 |
Минусы dtSearch Desktop 7.0 |
+ Поиск с использованием морфологии
+ Поиск с использованием синонимов
+ Нечеткий поиск
+ Фонетический поиск
+ Поиск в базах данных (через ODBC)
+ Поддержка сообщений Outlook
+ Поддержка различных кодировок
+ Работа в локальной сети
+ Индексация веб страниц на заданную глубину |
- Отсутствие возможности подключения различных источников информации (кроме СУБД) и Outlook e-mail
- низкая скорость поиска по ключевой фразе более чем 50 слов |
SoftInform Search Technology в первую очередь корпоративный инструмент поиска информации в локальной сети предприятия (документов практически любых форматов), информационных системах, СУБД, CRM и так далее. Важным преимуществом данной разработки является консолидация под своим управлением информации из различных источников. В SoftInform Search Technology реализована система рубрикации (удобный и быстрый инструмент распределения любых документов по заданной тематике) и автокатегоризации документов – автоматического распределения новых документов по существующим рубрикам в соответствии с общим принципом похожести. Такой подход к организации и консолидации данных позволяет структурировать информационные составляющие любого крупного предприятия под управлением одной программы. Притом, без нужды переводить документы и данные в какой-либо единый формат. Вся информация, доступная для индексирования и дальнейшего поиска может быть распределена, структурирована и отображена в удобном виде.
« предыдущая статья | Все статьи | следующая »
Так, например, в базе из нескольких десятков тысяч документов нам нужно найти какую-либо информацию. Используя фразовый поиск, и даже идеально подбирая ключевые слова и фразы, добиться быстрого и адекватного результата практически не возможно. Чтобы получить какой-либо приемлемый результат нам придется просматривать документ за документом, выбирая новые ключевые слова и тратя время на изучение ненужной нам информации. Но гораздо проще было бы, найдя хоть один более-менее удовлетворяющий нас по тематике текст, нажать кнопку поиска похожих на него документов…
4 октября 2006 года.
Компания СофтИнформ объявила о выходе новой версии SearchInform 3.0 – программы полнотекстового поиска и поиска похожих по содержанию документов.
В новой версии программы были внесены изменения, значительно улучшившие процесс индексации. Также был значительно улучшен алгоритм поиска информации. Основные же изменения коснулись процессов, влияющих на скорость работы системы в целом. За счет введения новой функции кэширования запросов скорость обработки поисковых запросов возросла в несколько раз.
Подробнее...
»
5 октября 2006 года.
Выход программы для полнотекстового поиска SearchInform 3.0
В новой версии программы были внесены изменения, значительно улучшившие процесс индексации.
Также был значительно улучшен алгоритм поиска информации. Основные же изменения коснулись процессов, влияющих на скорость работы системы в целом. За счет введения новой функции кэширования запросов скорость обработки поисковых запросов возросла в несколько раз.
Internet.ru
Подробнее...
» Вся пресса
|