Софт [7308] |
Операционые системы [163] |
Фильмы [3476] |
Музыка [5933] |
Шаблоны фотошопа [88] |
Книги / Журналы [8140] |
Картинки [1704] |
Скринсерверы [60] |
Телефоны [336] |
Игры [1673] |
Разное [10375] |
15:42 DocFetcher 1.1.7 | |
DocFetcher – это приложение с открытым исходным кодом, позволяющее вам совершать поиск по содержанию файлов на вашем компьютере вы можете считать это чем-то вроде Google для ваших файлов. Для работы DocFetcher необходимо создать так называемые индексы для тех папок, в которых вы хотите осуществлять поиск. Создание индекса занимает время только один раз для каждой папки. Обновление индекса после изменения содержимого папки происходит гораздо быстрее. Этот процесс обычно занимает несколько секунд. Особенности программы: Поддержка 64-битных систем: • Поддерживаются как 32-битные, так и 64-битные операционные системы. Поддержка Unicode: • DocFetcher поддерживает Unicode для всех основных форматов, включая Microsoft Office, OpenOffice.org, PDF, HTML, RTF и простые текстовые файлы. Исключение составляет лишь формат CHM, для которого поддержка Unicode ещё не реализована. Поддержка архивов: • DocFetcher поддерживает следующие форматы архивов: zip, 7z, rar, и всё семейство архивов tar.*. Список расширений файлов для zip-архивов может быть изменён, что позволит вам добавить поддержку больших форматов, основанных на zip. Кроме того, DocFetcher может справиться с неограниченным количеством вложенных архивов. Поиск в файлах исходных кодов: • Расширения файлов, в которых DocFetcher распознаёт обычный текст, может быть изменён, это позволит вам использовать DocFetcher для поиска в исходном коде любого вида и других форматах, основанных на тексте. (Это отлично работает в сочетании с изменяемыми zip-расширениями, например для поиска в исходном коде Java внутри файлов Jar) Файлы Outlook PST: • DocFetcher позволяет осуществлять поиск по письмам Outlook, которые обычно хранятся в файлах PST. Определение HTML-пар DocFetcher по умолчанию определяет пары HTML-файлов (например, файл под названием «foo.html» и папка под названием «foo_files») и рассматривает пары как один документ. На первый взгляд эта функция может показаться бесполезной, но потом оказывается, что она гигантски увеличивает производительность, когда вы имеете дело с HTML-файлами, так как вся «неразбериха» из HTML-папок пропадает из результатов. Исключения файлов из индекса на основе регулярных выражений: Вы можете использовать регулярные выражения, для того, что бы исключить определённые файлы из индекса. Например, для того, что бы исключить файлы Microsoft Excel, вы можете использовать регулярное выражение вроде этого: .*\.xls Определение MIME-типов: • Вы можете использовать регулярные выражения, для того, что бы включить «определение MIME-типов» ля определённых файлов, что будет означать, что DocFetcher будет пытаться определить тип файла не просто по названию этого файла, но и по содержимому. Мощный синтаксис запросов: • В дополнение к стандартным выражениям типа 'OR', 'AND' и 'NOT', DocFetcher также поддерживает шаблоны подстановки, поиск фраз, нечёткий поиск («найти слова, похожие на данное»), поиск по соседству («эти два слова должны бы на расстояние не более чем в 10 слов друг от друга»), повышение («повысить оценку документов, содержащих…») Поддерживаемые форматы документов: Microsoft Office (doc, xls, ppt) Microsoft Office 2007 и новее (docx, xlsx, pptx, docm, xlsm, pptm) Microsoft Outlook (pst) OpenOffice.org (odt, ods, odg, odp, ott, ots, otg, otp) Portable Document Format (pdf) HTML (html, xhtml, ...) Plain text (customizable) Rich Text Format (rtf) AbiWord (abw, abw.gz, zabw) Microsoft Compiled HTML Help (chm) MP3 Metadata (mp3) JPEG Exif Metadata (jpg, jpeg) Microsoft Visio (vsd) Scalable Vector Graphics (svg) Как работает индексация: Простой подход к поиску файлов: • Основной подход к поиску файлов – это просто «посещение» каждого файла в определённой папке один за одним. Это отлично подходит для поиска только по именам файлов, так как анализ имён файлов происходит очень быстро. Однако, это не подходит, когда вы хотите осуществить поиск по содержимому файлов, так как извлечение полного текст – более трудоёмкая задача, чем анализ имён файлов. Поиск, основанный на индексе: • Вот почему DocFetcher, выполняя поиск по содержимому, использует подход, называемый «индексация»: Основная идея заключается в том, что большинство файлов, в которых пользователи хотят осуществить поиск изменяются очень нечасто или не изменяются вообще. И, вместо извлечения всего текста каждый раз, более эффективным будет сделать извлечение текста из всех фалов лишь однажды и создать так называемый индекс из этого извлечённого текста. Это что-то вроде словаря, позволяющего находить файлы по словам, которые они содержат. Сравнение с телефонной книгой: • Для сравнения, подумайте, насколько более эффективно искать чей-то номер телефона в телефонной книге («индекс), а не обзванивать каждый возможный номер телефона с целью узнать, не является ли человек на другом конце провода тем, кого вы ищете. — Звонок кому-либо и извлечение текста из файла могут быть рассмотренны как «трудоёмкие операции». Кроме того, то, то люди не меняют свои номера очень часто, аналогично тому, что большинство фалов на компьютере очень редко изменяются, если вообще изменяются. Обновления индекса: • Конечно, индекс отображает только то состояние фалов, которое существовало, когда он был создан, не обязательно последнее состояние файлов. Таким образом, если индекс не соответствует действительности, вы можете получить устаревшие результаты поиска, телефонная книга устаревает точно так же. Однако, это не проблема, так как мы знаем, что большинство фалов изменяются очень редко. Кроме того, DocFetcher может автоматически обновлять индексы: (1) Когда он запущен, он определяет изменённые файлы и, соответственно, обновляет их индексы. (2) Когда он не запущен, маленький фоновый процесс будет определять изменения в файлах и составлять список из файлов, требующих обновления индекса. DocFetcher обновит эти индексы при следующем запуске. Вы можете не беспокоиться об этом фоновом процессе: он действительно мало нагружает процессор и память, так как не делает ничего, кроме обнаружения изменения в папках, оставляя боле затратное обновления индекса DocFetcher. Релиз выпущен: 2013 Системные требования: Windows XP / Vista / 7 (32&64bit) Язык интерфейса: Русский Лечение: не требуется Размер файла: 35,37 Мб Скачать DocFetcher 1.1.7 Скачать с LetitBit.net Скачать с ShareFlare.net Скачать с TurboBit.net | |
|
Всего комментариев: 0 | |