Rejoignez-nous pour notre prochain meetup chez Doctrine qui nous accueillera pour cette soirée. Merci à eux ! Comment Doctrine utilise la fonction More like This pour proposer des recommandations basées sur le contenu, personnalisées pour l'utilisateur et à la demande. Par Raphaël Champeimont, Doctrine.fr Raphaël est Lead Architect et co-fondateur de Doctrine DataDome est une société de cybersécurité internationale qui délivre une solution SaaS qui a pour but de protéger les sites internets et API des menaces automatisées OWASP: credential stuffing, layer 7 DDoS attaques, SQL injection et intensive scraping. DataDome protège tous les points de vulnérabilités de ses clients (web, mobile apps & APIs) grâce à sa technologie d'intelligence artificielle qui délivre une protection temps réel de bot protection. DataDome utilise Elasticsearch pour stocker toutes les requêtes des utilisateurs finaux de ses clients. En quelques chiffres, le cluster Elasticsearch stocke plus de 150To de données, 60 milliards de documents répartis en 3000 index et 15000 shards sur 80 nodes. Nous allons pendant ce talk évoquer les problèmes que DataDome a rencontré, relatif à la forte charge en écriture et comment l'équipe a réussi à les résoudre en partie grâce au rollover et à l'index lifecycle management. Par Stéphane Pham, Lead DevOps chez DataDome Stéphane Pham travaille dans les systèmes et réseaux depuis près de 8 ans et est en charge de l'infrastructure DataDome depuis aout 2018. Elasticsearch has a new field type which allows structured data to be added into the text of documents as annotations. Mark will demonstrate some of the powerful new search features this offers and how NER (Named Entity Recognition) tools like OpenNLP and Spacy can be used to tag people, places and organisations mentioned in text. Par Mark Harwood, developer, Elastic Mark is a core developer working on elasticsearch and has been involved with Lucene for many years.Talk 1 : MLT et Search chez Doctrine.fr
Talk 2 : Comment DataDome manage son cluster à forte charge en écriture et lecture avec le rollover et l'index lifecycle management
Talk 3 : Beyond plain text: elasticsearch’s annotated text field type (en anglais)
Déroulement de la soirée