Search

Wannes Gennar

Consultant @ Euricom

Hoe bouwen we het zoek systeem
zeer complex

Levenshtein

  • kitten → sitting
  • kitten → sitten
  • sitten → sittin
  • sittin → sitting
source
							
								
							
						

Complexere queries

  • Meerdere keywords
  • Geografische queries
  • Facets
  • Boosting
Lucene.NET is a high performance search library for .NET
  • Apache Solr
  • ElasticSearch
  • MongoDB

Index

Parsing Tokenization Analysis
language aware
Als winkelmedewerker ben jij het gezicht van de traiteurafdeling!
Als winkelmedewerker ben jij het gezicht van de traiteurafdeling!
Als winkelmedewerker ben jij het gezicht van de traiteurafdeling
winkelmedewerker gezicht traiteurafdeling

TF-IDF

Word DF IDF
gezicht 1 1.57
traiteurafdeling 2 1.27
winkelmedewerker 4 0.967
show me some code
Model Binding Mapping Execution

Infrastructuur

Database Documents Lucene

Infrastructuur

??? → Documents → Lucene

hidden features!
Recommendation engine
Explain query resultaten
Boosten van fields
Voordelen voor stakeholders
Uitbreiden van queries
Gemakkelijk te tunen

Geen databases meer?

  • Full text search
  • Fuzzy/mistake tolerant
  • Facets
  • Boosting

Nadelen

  • Memory consumption
  • Distributed systems
  • Unit testing
Thank you

👏👏

Questions?