Die digitale Verarbeitung und das maschinelle Verstehen von Handwerkerrechnungen sind eine ernstzunehmende Herausforderung. Es ist der erste Schritt auf dem Weg, Maschinen beizubringen, Texte so zu lesen und zu verarbeiten, wie wir Menschen es können. Worte verstehen zu können, bedeutet für Computer, diese in Zahlen und Vektoren abzubilden. Die ausgereiftesten Methoden des Maschinenlernens (z.B. GloVe, Word2Vec oder fasttext) ermöglichen es, Wortvektoren aus unstrukturierten Textdaten zu erlernen. Diese Vektoren (auch als Worteinbettungen bezeichnet) erlauben es Maschinen, dem menschlichen Verständnis von Sprache zu folgen, indem sie Wörter nach semantischen Ähnlichkeiten gruppieren und analysieren.