Indexa y busca archivos con Seekafile

Seekafile es un servicio Windows que indexa documentos en diferentes formatos, está basada en DotLucene, que es la versión en .NET del popular Lucene.

Lucene es un API para recuperación de información de código abierto, originalmente implementada en Java por Doug Cutting. Está apoyado por el Apache Software Foundation y se distribuye bajo la Apache Software License. Lucene tiene versiones para otros lenguajes incluyendo Perl, C# y C++.

Es útil para cualquier aplicación que requiera indexado y búsqueda a texto completo. Lucene ha sido ampliamente usado por su utilidad en la implementación de motores de búsquedas, lo cual ha llevado a la falsa idea de que Lucene es un motor de búsquedas con funciones de "crawling" y análisis de documentos en HTML incorporadas.

El centro de la arquitectura lógica de Lucene se encuentra el concepto de Documento(Document) que contiene Campos (Fields) de texto. Esta flexibilidad permite a Lucene ser independiente del formato del fichero. Textos que se encuentran en PDFs, páginas HTML, documentos de Microsoft Word, así como muchos otros pueden ser indexados mientras que se pueda extraer información de ellos.


Algunas características de Seekafile:

Búsqueda rápida

  • Búsqueda rápida basada DotLucene.
  • Reconoce rápidamente los cambios que se hacen en los documentos indexados.

Flexibilidad

  • El índice és compatible con la versión 1.3+ de DotLucene/Lucene 1.3+.
  • Se puede acceder al índice -para hacer búsquedas- a través de otras aplicaciones.

Soporte integrado para los siguientes formatos:

  • Microsoft Powerpoint (PPT)
  • Microsoft Word (DOC)
  • Microsoft Excel (XLS)
  • HTML (HTM/HTML)
  • Text files (TXT)

Es extensible a través de IFilter

Soporta la interface IFilter para hacer búsquedas sobre otros documentos:

  • Adobe Acrobat (PDF)
  • Microsoft Visio (VSD)
  • Rich Text Format (RTF)
  • XML
  • etc...

Extensible a través de plugins

Se pueden programar los plugins usando cualquier lenguaje que soporte .NET custom plugins.

Cero mantenimiento

  • El indexador corre como un servicio de Windows.
  • Se puede especificar que se detecten cambios sobre ciertos directorios.
  • El indexador trabaja en segundo plano con una prioridad baja.
  • Corre sobre un Windows 2000/XP/2003 con .NET Framework 1.1 instalado.

Se puede bajar el código fuente o el instalador, ambas versiones incluyen tanto un servidor (servicio Windows), como aplicaciones cliente: una aplicacion de escritorio y una página asp.net