Lieu confirmé: Salle Ruby à la FrenchTech (Mabilais) Rejoignez-nous pour notre second meetup sur Rennes ! Déroulement de la soirée : 19H00 Talk 1: Auto-complétion avec Elasticsearch sur du fulltext intégral non structuré à l'aide de techniques de NLP Talk 1: Auto-complétion avec Elasticsearch sur du fulltext intégral non structuré à l'aide de techniques de NLP Lorsqu'un utilisateur navigue sur un site web avec une fonction de recherche, l’auto-complétion est en général la première fonctionnalité utilisée. Elle se doit donc d'être la plus optimale possible. Réaliser un service d’auto-complétion à l'aide d'un moteur de recherche tel qu'Elasticsearch ou Apache Solr semble souvent aisé. Dans le cadre d'un projet, il nous a été demandé d'effectuer un service d’auto-complétion sur du texte complet non structuré. Le cahier des charges était le suivant : L'idée de cet échange est de présenter : Ludovic Boutros (Zenika) nous présentera ce premier talk. Talk 2: Machine Learning avec Elastic Comment fonctionne le machine learning d'Elastic, et comment l'utiliser pour traquer des données anormales dans votre SI. David Sztykman (@dsztykman sur Twitter), Solutions Architect chez Elastic, est spécialisé dans les environnements distribués et Cloud. Avant d'intégrer Elastic, il a travaillé plus de 10 ans dans le monde du CDN (Content Delivery Network) et la sécurité notamment sur les problématiques de Web Application Firewall distribué.
19H45 Talk 2: Machine Learning avec Elastic
20H30 Social discussions (food and drinks)
21H30 Fin du meetup
En effet, dans la majorité des situations, il s'agit de retourner des auteurs, des titres ou du moins un ensemble de libellés assez courts.
Le fond documentaire utilisé est un mélange d'extractions de documents PDF et de contributions éditoriales en langues française et anglaise.
Malheureusement ces extractions de documents PDF sont de qualité très variable (de médiocre à correcte).
- ce service d’auto-complétion permet de trouver des expressions issues du fulltext à partir de n'importe quel début de mot de l'expression ;
- il doit être tolérant aux erreurs de frappe ;
- il doit être le plus performant possible à la recherche ;
- et bien entendu, la qualité doit être au mieux de ce qu'il est possible d'obtenir avec le fond documentaire du projet.
- les méthodes choisies pour réaliser ce service avec toutes ces contraintes ;
- les difficultés rencontrés ;
- les améliorations/adaptations possibles.
Thursday, December 13, 2018
6:00 PM – 9:00 PM UTC