BlueBox

Qu'est-ce que BlueBox?

BlueBox est un projet d'envergure réalisé après constatation que l'utilisation de moteur de recherche indépendant sur des sites web n'était pas toujours aisé et supporté sur le long terme. Ce moteur de recherche est facile à intégrer, à administrer ainsi qu'à remplacer le cas échéant.

Afin d'aider à la compréhension du projet, mais aussi pour le mener à bien, un slideshow a été réalisé afin de détailler les différents aspects de celui-ci.

Pour quelle utilisation BlueBox a-t-il été développé?

BlueBox est prévu pour être utilisé sur les sites de petites / moyennes ainsi que grandes tailles (des tests concluants ont d'ores et déjà été effectués sur plus de 1'500'000 pages scannées) qui veulent garder leur indépendance des données. Les données scannées par BlueBox sont stockées dans le serveur MySQL que l'utisateur définira, contrairement à toutes les solutions tierces qui consistent bien souvent à exclure de votre recherche la totalité d'internet hormis votre site web. Bluebox peut scanner toutes pages web, y compris les pages derrière des mots de passe ou sur un intranet.

Pour quelle utilisation BlueBox n'est-il pas développé?

BlueBox ne remplace pas et ne remplacera jamais un moteur de recherche évolué à l'instar de Google, Altavista, Yahoo, Live, Exalead, ... Il ne permet pas d'indexer très rapidement une forte quantité de pages ni d'executer des requêtes très complexes dans des délais très courts.

Les avantages de BlueBox

BlueBox dispose des avantages suivants:

  1. Il est Open Source, librement modifiable et librement distribuable
  2. Il est très simple à installer
  3. Il ne nécessite aucun droit spécifique. Seuls un compte FTP et un compte MySQL sont nécessaires
  4. Il utilise des technologies très fortement dominantes sur internet (PHP5 - MySQL5)
  5. Il est très rapide et optimisé
  6. Il est capable d'exclure des portions de pages à l'aide de commentaires xHTML
  7. Il est entièrement configurable.
  8. Il est développé en programmation orientée objets, le rendant ainsi très concis à l'intégration et très compréhensible.
  9. Il est capable d'indexer plusieurs sites de manière complètement dissociée et indépendante.
  10. Il ne se base pas sur les extensions de fichiers pour en déterminer leur nature, mais sur leur MIME/Type.
  11. Il est capable d'effectuer des recherches par critères spéciaux (URL, GET vars, POST vars, ... )

Les inconvénients de BlueBox

BlueBox dispose des inconvénients suivants:

  1. Actuellement, BlueBox, de part sa philosophie, ne dispose pas d'indexation autre qu'en PHP. De ce fait, l'indexation, bien qu'efficace, peut encore largement être optimisée pour les utilisateurs disposant de plus de droits que le strict nécessaire à l'installation de BlueBox.

Améliorations prévues

  1. Capacité de lire et indexer les META des fichiers suivants:
    1. Adobe PDF
    2. JPEG
    3. GIF
    4. PNG
    5. Documents des suites Microsoft Office
    6. Documents des suites iWork
    7. Documents des suites OpenOffice
    8. ...
  2. Capacité de lire et indexer le contenu des fichiers suivants:
    1. Adobe PDF
    2. Documents des suites Microsoft Office
    3. Documents des suites iWork
    4. Documents des suites OpenOffice
    5. RTF
    6. TXT
    7. ...
  3. Possibilité d'indexer les sources des fichiers interprétés (PHP, ASP, JSP, ...)
  4. Possibilité d'indexer des fichiers via d'autres protocoles que l'HTTP (FTP, SSH, FILE, ...)
  5. Amélioration des logs générés pour un meilleur suivi des erreurs
  6. Développement d'un script CLI en PHP pour l'indexation
  7. Développement d'un script / programme compilé pour l'indexation
  8. ...

Où trouver BlueBox?

Le projet est déposé chez Sourceforge à l'adresse suivante: http://sourceforge.net/projects/bluebx/

Voir BlueBox fonctionner

Une version démo de BlueBox est utilisée sur ce site. Toutefois, la quantité de données se trouvant sur lapinbleu.ch n'est pas assez conséquente pour le pousser dans ses retranchements et avoir une bonne idée de ses performances. Je vous conseille vivement de l'essayer sur votre site web.

Comment contribuer à BlueBox?

  • Vous n'avez pas de compétences techniques: n'hésitez pas à me contacter si souhaitez apporter des améliorations à BlueBox, je modifierai les fonctionnalités selon vos besoins.
  • Vous avez un profil technique et voulez participer au projet: contactez-moi, je serai ravi de vous inclure à l'équipe de développement.