• Skip to main content

Polydocs

Automate Data Capture for Infor ERP

  • Produkte
      • DOC²
        • Automatisierung der Posteingänge
        • Autonome Erfassung
        • Stammdaten Validierung
        • Portfolio von Integrationen
      • Insight²
  • Use Cases
      • 1200px-Infor_logo.svgFinanzen / Controlling
        • Rechnungsbearbeitung für Infor LN
        • Rechnungsbearbeitung für Infor M3
      • Genehmigung von Dokumenten
        • Genehmigung von Rechnungen
  • Resourcen
    • Blog
    • Schau & Lern
    • Dokumentation
    • Glossar
    • IT Trends für 2022
  • Firma
    • Kontakt
    • Karriere
    • Leistungen
    • Partner
  • Deutsch
    • English
    • Anmelden
    • Registrieren
  • Kostenlos testen
  • Demo

Daten

Jan 17 2023

Datenextraktion

Datenextraktion
17. Januar 2023 von Leni

Datenextraktion

von einer mühsamen Tätigkeit zu einem effizienten Prozess


In der heutigen Zeit, die durch Datenreichtum geprägt ist, ist die Analyse und weitere Verwendung von Daten ein allgegenwärtiges Thema. Dabei spielt die Extraktion von Daten aus unterschiedlichsten Dokumenten eine unabdingbare und konstant notwendige Rolle. In vielen Unternehmen werden Daten jedoch häufig immer noch in mühsamen und aufwändigen Prozessen manuell extrahiert und bearbeitet, was mit einem erhöhten Zeitaufwand und Fehlerrisiko verbunden ist. 

Wie können diese Prozesse zur Datenextraktion also erleichtert und optimiert werden, um unstrukturierte Daten in ein strukturiertes Format zu verarbeiten, welches zur einfachen Weiterverwendung geeignet ist?

Die größten Herausforderungen bei der Datenextraktion

Die größten Herausforderungen bei der Datenextraktion liegen in der Vielzahl an Formularvarianten und Dokumentenversionen mit unstrukturierten Daten und zum Teil unwichtigen Angaben. 

Ein anpassungsfähiges System zur Inhaltserfassung und Datenintegration ist demnach notwendig, um die erforderlichen Daten zu extrahieren und in ein strukturiertes Format zu verarbeiten. Und genau diese Möglichkeit bietet Ihnen DOC²! Durch die flexible Inhaltserfassung von DOC² können Daten aus den unterschiedlichsten Dokumenten erkannt, extrahiert und strukturiert erfasst werden. Diese geordnete Datendigitalisierung ermöglicht es, Daten leicht an anderer Stelle weiter zu verarbeiten, zu speichern und zu analysieren, was wiederum zu mehr Kontrolle und einer erhöhten Genauigkeit der erfassten Daten führt. 

Die Verwendung einer KI ermöglicht DOC² eine vereinfachte und strukturierte Datenextraktion, welche die Effizienz dieser Prozesse erhöht. Es spart Zeit, beschleunigt die sonst so langwierigen Abwicklungszeiträume und verbessert zusätzlich die Qualität der erfassten Daten.

Verabschieden Sie sich also vom mühsamen und langwierigen manuellen Abtippen von Daten und nutzen Sie die Vorteile von DOC² in Ihrem Unternehmen.

Nehmen Sie Kontakt mit uns auf.

Wir werden Ihnen helfen, so gut wir können.

KontaKt
Datenextraktion

Bildnachweis: Header- und Beitragsbild von Polydocs

Written by Stephanie Propstmeier · Categorized: Blog, Deutsch, DOC², Künstliche Intelligenz · Tagged: Datendigitalisierung, Datenextraktion, DOC², erkannt, extrahiert, KI, strukturiert

Jan 10 2023

Optimieren Sie Ihre Prozesse

Prozesse
10. Januar 2023 von Stephanie Propstmeier

Optimieren Sie Ihre Prozesse


Prozesse optimieren – Wer will das nicht? Gibt es eine Möglichkeit bestimmte Abläufe und Vorgänge im Unternehmen zu verbessern und erleichtern, wäre es ganz schön blöd, wenn man diese nicht nutzen würde. Gerade manuelle Routinetätigkeiten wie das Bearbeiten von Rechnungs- und Bestelldokumenten ist oftmals ein langwieriger Prozess, bei dem einem leider immer wieder auch Fehler unterlaufen. Wir sind ja alle nur Menschen und geben unser Bestes. Die Verbesserung von Schwachstellen kann den Workflow optimieren und führt zu einer Kosteneinsparung und effizienteren Arbeitsabläufen. Die Integration von moderner Technologie kann genau diese Prozesse effizienter gestalten und somit den Arbeitsalltag erheblich erleichtern. 

Die teilweise oder vollständige Automatisierung von bestimmten Abläufen kann somit zu einer allgemeinen Verbesserung des Workflows innerhalb eines Unternehmens beitragen. Die künstliche Intelligenz kann wichtige Informationen rasch digitalisieren und zur weiteren Nutzung zur Verfügung stellen. Daten können dadurch schneller analysiert werden, wodurch eventuelle Schwachstellen oder Fehler schneller aufgedeckt und korrigiert werden können und somit Kosten und Zeit gespart werden. Dies bedeutet im Detail zum Beispiel, dass Rechnungs- oder Bestelldokumente einfach eingelesen werden können und langwierige Verarbeitungsprozesse vermieden werden, wodurch die manuellen Tätigkeiten reduziert und die Durchlaufzeiten verkürzt werden. Das hört sich doch gut an oder nicht?

Steigern Sie die Effizienz in Ihrem Unternehmen mit DOC²!

Durch die Digitalisierung von Dokumenten kann DOC² Ihnen dabei helfen, langwierige Prozesse zu verkürzen, so haben Sie mehr Zeit, sich auf wichtigere Aufgaben zu konzentrieren. DOC² kann sämtliche wichtigen Informationen durch Image Recognition aus verschiedenen Dokumenten auslesen und verarbeiten. Somit stehen die notwendigen Daten für Folgeprozesse schnell zur Verfügung. Die einfache und schnelle Extraktion und Verarbeitung von wichtigen Dokumenteninformationen von DOC² in ein übersichtliches Format sorgt somit für eine verbesserte #Datenqualität und eine reduzierte Fehlerquote. Durch die Cloud-basierte API-Architektur von DOC² und die fortlaufende Optimierung der Prozesse, werden die Abläufe konstant verbessert und effizienter gestaltet. Die Bündelung der notwendigen Daten aus unterschiedlichen Dokumenten in ein übersichtliches Format vereinfacht damit ebenfalls langwierige manuelle Routinetätigkeiten, was zu einer Steigerung der allgemeinen Produktivität führt. Überzeugen Sie sich selbst, wie DOC² Ihnen dabei helfen kann, Prozesse zu optimieren und somit die Effizienz und Leistungsfähigkeit Ihres Unternehmens zu steigern.

Nehmen Sie Kontakt mit uns auf.

Wir werden Ihnen helfen, so gut wir können.

KontaKt
Prozesse

Bildnachweis: Header- und Beitragsbild von Dirk Wouters auf Pixabay

Written by Stephanie Propstmeier · Categorized: Blog, Daten, Deutsch, DOC² · Tagged: Automatisierung, Datenqualität, Digitalisierung, DOC², Prozessoptimierung, Workflow, Zeit ist Geld

Dez 13 2022

Kann eine KI-gestützte OCR “Handschrift” wirklich besser lesen als ein Mensch?

ocr
13. Dezember 2022 von Leni

Kann eine KI-gestützte OCR “Handschrift” wirklich besser lesen als ein Mensch?


Die Papierverarbeitung ist mühsam, es erfordert viel Zeit und Ressourcen, alle Daten manuell ins System einzugeben, doch es ist leider ein notwendiges Übel für viele Unternehmen.

Genau aus diesem Grund setzen immer mehr Unternehmen eine OCR-Software (optische Zeichenerkennung) zur Unterstützung ein.

Mit einer herkömmlichen OCR lassen sich bis zu 80 % der Dokumenten-Workflows bewältigen. Sie ist in der Lage, fast jede Variante von maschinell und klar gedrucktem Text, basierend auf Schriftarten und Symbolen, zu erkennen. Doch sobald der Text verschmiert oder schief ist, wird es schwierig. Und genau das sind dann die 20 %, bei denen jetzt doch wieder eine Mensch eingreifen muss, womit wir unweigerlich vor drei großen Herausforderungen stehen:

  1. Ungenauigkeit: Tippfehler und Behandlung von Ausnahmen (Wir sind alle nur Menschen)
  2. Ressourcen: Es ist schwierig, Mitarbeiter zu finden, die bereit und vor allem auch in der Lage sind, Text aus minderwertigen Dokumenten zu extrahieren.
  3. Sicherheit:  Der Übergang von der Maschine zum Menschen und zurück zur Maschine birgt Sicherheitsrisiken. Gerade in streng regulierten Branchen mit sensiblen Daten, wie Finanzdienstleistungen, Behörden oder auch Organisationen im Gesundheitswesen, spielt dies eine große Rolle.

Wenn wir ehrlich sind, brauchen wir eine bessere Lösung für diese 20 %. Doch bevor wir uns mit der Lösung beschäftigen, sollten wir noch eine wichtige Frage klären. 

Was genau sind minderwertige Dokumente? 

Ein minderwertiges Dokument kann ein Fax oder ein mit schlechter Qualität eingescanntes Dokument sein. Genauso kann es aber auch ein Lieferschein, ein Stundenzettel oder ein Formular zur Patientenregistrierung sein, welche handschriftlich ausgefüllt wurden.

Um Daten aus dieser Art von Dokumenten zu extrahieren reicht die herkömmliche OCR nicht mehr aus. Eine KI-gestützte OCR hingegen verwendet fortschrittlichere Technologien, wie ein hochqualifiziertes maschinelles Lernmodell und fortschrittliche Computer-Vision-Engines. Durch die Kombination dieser beiden Technologien erhalten wir eine OCR, die in der Lage ist, die Art und Weise zu replizieren, mit der Menschen minderwertige Dokumente lesen können. Ist das Modell gut genug, kann es unter Umständen tatsächlich (handschriftliche) Texte besser extrahieren als der Mensch. Doch jedes Modell ist nur so gut wie der Datensatz, auf dem es trainiert ist.

Wie finde ich jetzt unter den ganzen Anbietern den Richtigen für mich?

Begriffe wie „künstliche Intelligenz“ und „maschinelles Lernen“ werden zu häufig verwendet, wobei nicht jeder Anbieter die Funktionsweise seiner Technologie belegen kann. Suchen Sie nach Anbietern mit transparenten Zahlen und stellen Sie sich im Vorfeld folgende Fragen:

  • Ist die Lösung des Anbieters KI-gestützt oder handelt es sich nur um eine gut vermarktete Mischung aus menschlicher Dateneingabe und Maschine? 
  • Können die Anbieter für jeden durchgeführten Prozess, sowie jedes eingelesene und extrahierte Dokument, Genauigkeitsangaben machen?
  • Warum ist der Anbieter in der OCR-Branche tätig und wie viele Erfahrungen hat er in diesem Bereich?
  • Bietet es eine Cloud-basierte SaaS-Lösung an oder müssen Sie die Lösung vor Ort hosten?
  • Wie lange dauert es, bis Sie das Produkt nutzen können? Wie viele Schulungen sind nötig? Sind spezielle Fachkenntnisse erforderlich?

Die Fellow Consulting AG / Polydocs GmbH begann mit der Datenerfassung durch Menschen. Dadurch haben wir den größten von Menschen geprüften Datensatz (über 1 Milliarde Felder) in der Branche.

Wir bieten bereits ab Tag 1 der Nutzung des Produktes eine hohe Genauigkeit an.

Das waren jetzt viele Informationen und viele Fragen!

Nehmen Sie sich Zeit, denken Sie darüber nach, wägen Sie alle Pro und Kontras ab und entscheiden Sie sich richtig – für DOC² (Polydocs) 😉

ocr

Bildnachweis: Header & Beitragsbild von rawpixel.com auf Freepik

Written by Stephanie Propstmeier · Categorized: Blog, Daten, Deutsch, DOC², Künstliche Intelligenz

Nov 15 2022

Digitalisierung – Industrie 4.0 – Künstliche Intelligenz

Künstliche Intelligenz
15. November 2022 von Leni

Digitalisierung – Industrie 4.0 – Künstliche Intelligenz


All das sind Begriffe, die wir heutzutage sehr oft hören oder lesen. Wir wollten heute über das Thema künstliche Intelligenz (KI) nachdenken.

Was genau ist künstliche Intelligenz?

Wo und wie setze ich sie ein? Welche Vorteile kann sie mir bringen?

Künstliche Intelligenz ist nicht ganz so einfach zu erklären, aus dem einfachen Grund, dass es noch nicht einmal eine genaue Definition für den Begriff “Intelligenz” gibt. Wir wollen es trotzdem mal versuchen 🙂 zu erklären.

Man kann sagen, dass eine KI ein Mix aus verschiedenen Technologien ist, die Maschinen dazu befähigt, mit menschlicher Intelligenz zu verstehen, zu handeln und zu lernen. 

Technologien wie maschinelles Lernen (ML) oder MachineLearning, das Verarbeiten natürlicher Sprache (NLP – Natural Language Processing) sowie Deep Learning (DL) gehören alle zur KI-Landschaft. 

In allen Bereichen, wo große Mengen an Daten anfallen, ist der Einsatz einer KI sinnvoll und von Vorteil. Einer KI ist es möglich, binnen kürzester Zeit durch ausgefeilte Algorithmen riesige unstrukturierte Datenmengen objektiv zu analysieren, darin Muster zu erkennen und anhand dieser Entscheidungen selbstständig zu treffen. Zudem sinkt die Fehlerrate immer weiter durch den ständig wachsenden Erfahrungsschatz. KI übernimmt alltägliche wiederkehrende Routineaufgaben, so haben Mitarbeiter mehr Zeit sich Aufgaben zu konzentrieren, die Empathie und Einfühlungsvermögen benötigen und werden produktiver. Das heißt: Eine KI soll und kann einen Menschen nicht voll ersetzen, sondern lediglich unterstützen und ergänzen.

In Kombination mit Analysen und Automatisierungen kann eine KI dem Unternehmen helfen, ihre Ziele, wie beispielsweise einen verbesserten Kundenservice oder eine optimierte Lieferkette, schneller und leichter zu erreichen.

Durch Automatisierungen werden Kosten gesenkt und sie bringen ein neues Maß an Konsistenz, Geschwindigkeit und Skalierbarkeit in Ihre Prozesse.

Mit DOC² wollen wir Ihnen helfen, Ihre Prozesse in der Dokumentenverarbeitung zu automatisieren. Durch die Nutzung einer künstlichen Schwarmintelligenz bieten DOC² Ihnen viele Vorteile.

Sie wollen wissen, welche das sind?

Dann schreiben Sie uns gerne

Kontakt
Künstliche Intelligenz

Bildnachweis: Header & Beitragsbild von Gerd Altmann auf Pixabay

Written by Stephanie Propstmeier · Categorized: Blog, Deutsch, DOC², Künstliche Intelligenz, Maschinelles Lernen · Tagged: Deep Learning, Digitalisierung, DOC², Industry 4.0, KI, Künstliche Intelligenz, machine learning, ML, Natural Language Processing, NLP, Zukunft

Nov 01 2022

Dokumentenverarbeitung mit Doc2 Version 2.0

Doc2
1. November 2022 von Daniel Jordan

Dokumentenverarbeitung mit Doc2 Version 2.0


Die Extraktion von Informationen aus PDFs und gescannten Dokumenten ist vielleicht nicht die interessanteste oder herausforderndste Thematik des Jahrhunderts. Es gibt einem nicht die Möglichkeit einen Roboter zu steuern, virtuelle Spiele zu spielen oder seine Kreativität auszuleben. Stattdessen ist es reine Fleißarbeit, etwas, das die „KI“ zu automatisieren versprochen hat, jedoch bisher nicht erreicht hat. Nichtsdestotrotz stellt die Dokumentenverarbeitung, also die Umwandlung analoger Daten in ein digitales Format, eine subtile Herausforderung dar – eine Aufgabenstellung, die so einfach und doch so schwer zu lösen ist.

Dokumentenverarbeitung mit Doc2 Version 2.0, die Umwandlung analoger Daten in ein digitales Format – eine so einfache und doch schwer zu lösende Aufgabe.

Nach Abschluss verschiedener Projekte wurde uns bei Polydocs klar, dass die Verarbeitung von Dokumenten allgegenwärtig ist – von Unternehmen bis zu Nichtregierungsorganisationen, von kleinen Betrieben bis zu Großkonzernen – es gibt immer ein PDF, das digitalisiert werden muss!

Die Verarbeitung von Dokumenten ist demnach also nicht nur schwierig, sondern vielleicht auch dringend notwendig.

In diesem Blogbeitrag wird ein Rahmen für die Entwicklung von Dokumentenverarbeitungslösungen beschrieben und woran wir für Doc2 Version 2.0 arbeiten.

Die Dokumentenverarbeitung mit Doc2 Version 2.0 basiert auf drei Prinzipien:

Anmerkungen sind das A und O: Es gibt kein Patentrezept. Selbst wenn Sie ein gutes Modell haben, müssen Sie immer noch eine Feinabstimmung mit Ihren Daten vornehmen. Idealerweise sollten Sie ein Annotationswerkzeug mit eingebauter Feinabstimmung haben oder flexibel genug sein, um diesen Mechanismus zu integrieren.

Erstellen von multimodalen Modellen: Wir verlassen uns bei der Analyse eines Dokuments nicht nur auf den Text. Stattdessen übernehmen wir alle Informationen (Position, Textgröße usw.) als Kontext, um diese als Merkmale nutzen zu können. Eine reine OCR (optische Zeichenerkennung) oder ein rein textbasierter Ansatz sind suboptimal, um diese Aufgabe zu lösen.

Immer korrigieren: OCR– und Dokumentenlayoutmodelle sind nicht immer perfekt, daher ist es wichtig, dass der Mensch die Ergebnisse des Systems korrigiert. Sie können die Korrektur verwenden, um Ihr Modell neu zu trainieren oder als vorletzten Schritt vor dem Speichern der Ergebnisse in einer Datenbank.

Formularverständnis

Formularverständnis

In Doc² haben wir alle oben genannten Grundsätze berücksichtigt. Das Diagramm, beschreibt den typischen Dokumentenverarbeitungsworkflow:

Dokumentenverarbeitungsworkflow

Anmerkungen sind das A und O

Beschriftungen sind bei jeder Lösung für die Dokumentenverarbeitung unabdingbar. Dokumente neigen dazu, sehr unterschiedlich auszusehen, selbst wenn sie unterscheidbare Muster haben. Sie brauchen also ein Werkzeug, mit dem Sie Dokumente zuverlässig beschriften können.

Multimodale Modelle erstellen

Ein weiterer Grund, warum die Verarbeitung von Dokumenten eine so attraktive Herausforderung darstellt, liegt darin, dass sie von Natur aus multimodal ist – textliche und visuelle Informationen stehen ohne weiteres zur Verfügung. Jedoch neigen grobe Lösungen für die Dokumentenverarbeitung leider dazu, nur eins der beiden Modelle zu nutzen:

Bildzentrierte Ansätze beinhalten eine Menge komplexer Geschäftsregeln rund um Begrenzungsrahmen und Textplatzierung, um die erforderlichen Informationen zu erhalten. Sie verlassen sich meist auf Vorlagen, die nicht skalierbar sind. Textzentrierte Ansätze basieren auf NLP-Pipelines für OCR-erfasste Texte. Wobei Textblöcke jedoch nicht mit der Domäne kompatibel sind, auf der diese Modelle ursprünglich trainiert wurden, was zu einer suboptimalen Leistung führt.

Glücklicherweise können multimodale Modelle wie DOC² aus textlichen und visuellen Informationen lernen. Für ein bestimmtes Dokument werden nicht nur das Wort und das Bild selbst, sondern auch ihre Positionen eingebettet. Die Interaktionen zwischen ihnen wird dann mit Hilfe mehrerer Vortrainingsziele erlernt.

Das Doc2-Modell lernt sowohl aus textlichen als auch aus visuellen Informationen und lernt die Wechselwirkungen zwischen ihnen

Immer wieder korrigieren

Wir sind nach wie vor der Meinung, dass man selbst bei einem noch so leistungsfähigen Dokumentenverarbeitungssystem menschliches Wissen und menschliche Erfahrung zur Korrektur und Bewertung einbeziehen muss. Human-in-the-loop kann als Endkontrolle für die Ausgabe eines Modells dienen. Wir können die korrigierten Anmerkungen wiederverwenden, um das Modell weiter zu verfeinern und so den Kreislauf zu schließen.

Abschließende Anmerkungen zur Dokumentenverarbeitung mit Doc2 Version 2.0

Dieser Blogbeitrag gibt einen Ausblick auf unsere Version 2.0, beschrieben nach wichtigsten Aspekten einer Dokumentenverarbeitungslösung: ein Annotationsmechanismus, ein multimodales Modell und ein Bewertungsschritt.

Maschinelles Lernen wurde versprochen, um die manuelle Arbeit zu automatisieren. Aber es scheint, dass wir auf eine Mauer gestoßen sind und stattdessen begonnen haben, kreative Arbeiten zu automatisieren. Meiner Meinung nach haben wir die Suche nach Patentlösungen optimiert: Man füttert ein großes Modell mit Eingaben und erhält die gewünschte Ausgabe. Manuelle Arbeit, wie die Verarbeitung von Dokumenten, ist nicht so. Stattdessen sind sie in der Regel maßgeschneidert: Sie müssen Daten beschriften, Sie müssen alle Elemente Ihres Dokuments berücksichtigen, Sie müssen die Ausgabe Ihres Modells korrigieren – und ein großes einziges Modell reicht dafür nicht aus. Es gibt unterschiedliche Modelle, die Unterschiedliche Dinge extrahieren.

Doc2

Bildnachweis: Header & Beitragsbild von Freepik und Freepik

Written by Daniel Jordan · Categorized: Blog, Daten, Deutsch, DOC², Maschinelles Lernen · Tagged: DOC², Dokumentenverarbeitung, KI, OCR

  • Go to page 1
  • Go to page 2
  • Go to page 3
  • Interim pages omitted …
  • Go to page 8
  • Go to Next Page »
  • Contact
  • Privacy Policy
  • Imprint
  • Master Service Agreement
  • Status

Copyright © 2023 · Polydocs Gmbh · Log in