Im Bundesgesetzblatt Jahrgang 2017 Teil I Nr. 75 wurde die „Verordnung über die technischen Rahmenbedingungen des elektronischen Rechtsverkehrs und über das besondere elektronische Behördenpostfach* (Elektronischer-Rechtsverkehr-Verordnung – ERVV) vom 24. November 2017“ veröffentlicht.
Auf den ersten Blick liest sich der Text wie eine der üblichen entsprechenden Verordnungen, man neigt dazu, das zu ignorieren, denn irgendjemand wird sich ja darum kümmern. Dieser „Irgendjemand“ sind die Softwareersteller (also wir). Entsprechend werfen wir nicht nur einen kurzen Blick in den Text, sondern versuchen auch, ihn zu verstehen und nachzuvollziehen. Dieser kurze Blogeintrag soll einen ersten Eindruck vermitteln, welche grundsätzlichen Konstruktionsfehler – man könnte sagen: „wie nicht anders zu erwarten“ – in der Verordnung enthalten sind, die im Nachgang zumindest erhebliche technische Probleme – wenn nicht sogar Rechtsunsicherheiten – erzeugen. Dieser Blogeintrag erhebt keinen Anspruch auf Vollständigkeit, sondern gibt nur die ersten Eindrücke wieder:
1) §2 Abs. 1: „Das elektronische Dokument ist in …, durchsuchbarer Form im Format PDF zu übermitteln“
Offensichtlich haben sich die Verfasser dieser Verordnung noch niemals mit optischer Zeichenerkennung befasst, denn sonst wüssten sie, dass es eine gewisse Fehlerquote gibt, die auf absehbare Zeit nicht auf digitalem Wege auf Null reduziert werden kann. Gerade diese Fehlerkennungsquote führt bei elektronischen Dokumenten dann dazu, dass gegebenenfalls essentielle Teile nicht gefunden werden. Bei optischer Zeichenerkennung sind die größten Fehlerquellen Eigennamen, Aktenzeichen, jegliche Form von Kennziffern (also auch Kontonummern, Bankleitzahlen, IBANs, BICs, Geschäftszeichen etc.). Durchsuchbarkeit von Dokumenten klingt schön und gut, aber wenn der Gesetzgeber dies einfordert (auch mit der Einschränkung „sofern möglich“), so muss er sich auch zwingend dazu äußern, wie mit den Konsequenzen einer Fehl- oder Nichterkennung umzugehen ist. Wie ist die Beweislast verteilt, wenn Dokumente eingereicht werden, die einen Sachverhalt ganz offensichtlich enthalten, dieser Sachverhalt jedoch (vielleicht einfach wegen eines ungünstigen Zeichensatzes) im Rahmen einer optischen Zeichenerkennung falsch aufbereitet und dann nicht mehr gefunden wird? Wer trägt hier die Verantwortung?
Nebenbei steht hierbei die überaus berechtigte Frage im Raum, wer dafür überhaupt die Kosten trägt. Es gibt mehrere Systeme für optische Zeichenerkennung, die ihre verschiedenen Vor- und Nachteile haben und unterschiedlich viel Geld kosten. In jedem Falle gilt jedoch, dass sie eben Geld kosten. Einerseits ist entsprechende Hardware nötig, die diese Arbeit überhaupt leisten kann (bei umfangreichen Schriftsätzen sind selbst leistungsstarke Computer durchaus ausgelastet), andererseits muss Software angeschafft und auch gewartet werden. Die Erfüllungskosten für die Wirtschaft sind dementsprechend hoch anzusetzen. Eine sehr stark vereinfachte Betrachtung verdeutlicht dies. Ausgehend von 100.000 Arbeitsplätzen (das dürfte bei alleine 160.000 Rechtsanwälten eine extrem defensive Betrachtung sein):
OCR-fähiger Computer Lebensdauer 4 Jahre: 1.000,- €
OCR-Software Anschaffung: 300,- €
Entspricht einem (zwingenden) Investitionsvolumen von 1.300,-*100.000=130 Mio €
Hinzu kommen Wartungskosten für die Software und PC-Hardware von min. 200,- € jährlich, das bedeutet zusätzliche Kosten in Höhe von 20 Mio €
Nun könnte man natürlich sagen: „Alles halb so wild, das betrifft ja nur umgewandelte Dokumente“. Dem kann mit einem sehr einfachen Beispiel gegengehalten werden. Der originale Veröffentlichungstext aus dem Bundesgesetzblatt (dieser Text ist von Hause aus durchsuchbar erstellt, musste also gar nicht erst umgewandelt werden) ergibt via Copy und Paste folgendes Ergebnis:
„B e son de re s e l e k t ron i s c h e s Be h ö rd e n p o s t f a c h“
Man beachte hier die innovativ eingestreuten Leerzeichen. Eine Suche in diesem Text nach dem einfachen Wort „Behördenpostfach“ gibt – erwartungsgemaß – keine Ergebnisse. Wenn es nicht so bitter wäre, dann wäre es amüsant, dass der Gesetzgeber selbst im Rahmen der Veröffentlichung einer Verordnung den Beweis erbringt, dass ein Teil genau dieser Verordnung nicht funktioniert.
2) §2 Abs. 2: „Der Dateiname soll den Inhalt des elektronischen Dokuments schlagwortartig umschreiben und bei der Übermittlung mehrerer elektronischer Dokumente eine logische Nummerierung enthalten“
Man muss schon zum Thesaurus greifen, um sich in seiner Wortwahl nicht zu wiederholen. In sämtlichen Fachgremien der Justiz und Verwaltung (z.B. beA) ist es ein Thema, dass komplexe Dateinamen zu erheblichen Problemen führen:
1) Es gibt keine Standards für die Kodierung von Umlauten in Dateinamen, diese werden auf unterschiedlichen Systemen unterschiedlich dargestellt, sind mithin häufig nicht lesbar.
2) Windows-Systeme haben eine Längenbeschränkung für Dateinamen, die bei maximal 256 Zeichen liegt (inkl. der Pfadangabe). Das führt dann sehr schnell dazu, dass eine Datei auf einem System lesbar und auf einem anderen System nicht mehr lesbar ist (schlicht weil die Datei auf dem anderen System in einem Unterverzeichnis mit längerem Namen abgespeichert wurde). Wenn der Name eine Schlagwortdarstellung sein soll, dann gehört zwingend eine Definition für eine Maximallänge sowie der Hinweis auf ein Verzicht auf Sonderzeichen in die Verordnung hinein. Die häufig vertretene Auffassung, dass der Gesetzgeber nicht alles regeln kann, und dass gesunder Menschenverstand und technische Sachkenntnis schon für eine sinnvolle Umsetzung sorgen werden, geht vollkommen fehl, denn einerseits zeigt die langjährige Erfahrung, dass der technische Sachverstand (insbesondere bei der Justiz) in der Regel schlicht nicht vorhanden ist und andererseits wäre diese Argumentation ein Zirkelschluss, denn es würde damit argumentiert, dass Sachverstand ein Problem löst, welches der gleiche Sachverstand nicht einmal erkannt hat.
Über die vollkommene Unzulänglichkeit hinsichtlich der Aussage „eine logische Nummerierung enthalten“ kann man kaum etwas sagen. Jeder, der schon mal versucht hat, mit einfachen Mitteln (also z.B. dem Explorer) eine nummerierte Dateiliste in korrekter Reihenfolge anzuzeigen, wird wissen, dass eine angezeigte Reihenfolge für die Dateien „1, 2, 3, 4, …, 11, 12, …30, …“ nicht in der Form erfolgt, wie man es erwartet, sondern in der Reihenfolge „1, 11, 12, 2, 3, 30, 4“. Logische Numerierungen unterliegen mannigfaltigen Konventionen und sind sämtlichst in der Regel inkompatibel mit sinnvollen Dateisystem-Darstellungen. Dabei muss noch nicht einmal darüber gesprochen werden, welche potentiellen Probleme sich durch Trennungspunkte in Dateinamen ergeben.
Dies ist nur der erste Eindruck über eine sehr weitreichend undurchdachte Verordnung. Es ist in keinster Weise verwunderlich, dass Deutschland zunehmend zum digitalen Schlusslicht wird.
Andre Koppel
Könnte es sein, dass „der Verordnungsgeber“ weiß, dass texterkannte wie nicht-texterkannte Dokumente in gerichtlichen Verfahren gelesen werden (müssen)?
Vielleicht kommt es ihm auch bei der Dateinamensbildung nur auf eine Hilfestellung für eine manuelle Weiterverarbeitung in gerichtsspezifischer Software an und dem Einsender sollten möglichst wenig Beschränkungen auerlegt werden, auch um für möglicherweise sehr unterschiedliche Gepflogenheiten Rücksicht zu nehmen, die auch auf nicht unbedingt flexibel programmierte Anwendungen beim Einsender zurückzuführen sein könnten?
Alles hat zwei Seiten, rechtliche Dinge mindestens drei 🙂
Ob Dokumente tatsächlich gelesen werden, lässt sich wohl nicht abschließend feststellen, da wird jeder seine eigene Meinung haben (basierend auf höchstpersönlichen Erfahrungen). Die Texterkennung ergibt jedoch nur dann Sinn, wenn irgendetwas mit dem „erkannten“ Text gemacht wird. In der Regel dürfte es sich bei „dem Machen“ schlicht um Suchen im Text handeln. Das soll heißen, dass der Empfänger von Dokumenten diese nach Begrifflichkeiten durchsucht, um dazu Stellung zu nehmen oder eben darauf aufbauend zu argumentieren. Genau hier führt die fehlerhafte Erkennung von Dokumenten jedoch zu erheblichen Problemen. Der nicht geschulte Anwender verlässt sich auf die Texterkennung (obwohl diese nachweislich nicht verlässlich ist) und geht dann beim Nichtauffinden davon aus, dass das Gesuchte im Text nicht vorhanden ist. Das Ergebnis ist dann ein Fehlschluss oder eine Fehlinterpretation des Textes. Wenn der Text von vornherein nicht durchsuchbar ist, dann muss der Anwender ihn tatsächlich lesen oder eben selbst durchsuchbar machen, wobei ihm bei letzterem dann eben klar gemacht wird, an welchen Stellen eine Fehlerkennung stattgefunden hat. Das Problem mit jeglicher Form von Automatisierung ist in der Regel, dass Menschen sich sehr schnell blind darauf verlassen. Die Kritikfähigkeit geht verloren und darunter leidet die Qualität. Umgehen kann man diese Probleme nur durch intensive, teure Schulung (die findet in der öffentlichen Verwaltung und Justiz schlicht nicht statt) oder dadurch, dass Software 100%iger Ergebnisse liefert. Beides ist im Falle der optischen Zeichenerkennung – also der Durchsuchbarmachung von Dokumenten – derzeit quasi ausgeschlossen, die logische Konsequenz ist – bei dieser Form der Umsetzung der Verordnung – eine Verschlechterung der Qualität.
Und was die Rücksichtnahme auf Gepflogenheiten bei der Datennamensvergabe angeht: Genau diese Rücksichtnahme führt zu den immensen Inkompatibilitäten, mit denen wir schon heute leben müssen. Diese Inkompatibilitäten lassen sich überhaupt nur dadurch lösen, dass eben keine Rücksicht auf Gepflogenheiten genommen wird, sondern es bedarf klarer Regeln. Nur solche klaren Regeln führen dann zu deutlichem Fortschritt. Die Einführung solch klarer Regeln hat in allen Wissenschaften zu deutlichen Fortschritten geführt, so sollte man es auch in der Justiz halten. Insofern hat die Gesamtbetrachtung eben keine zwei oder drei Seiten. Es gibt eine sehr kleine Anzahl richtiger Wege und eine sehr große Zahl falscher Wege; und diese Verordnung in dieser Form zählt nicht zu der kleinen Zahl.
Glücklich sind die Menschen, die nicht wissen wie Gesetze und Würste gemacht werden…
Nicht zu vergessen, dass das „bea“ keine Dateien mit Umlauten erkennt. Was bei Kündigungen, Änderungsverträgen und Schriftsätzen nach Köln traurige Probleme bedeuten wird.
Umlaute in Dateinamen sind generell ein extrem großes Problem. Bei Dokumenten, Mails, Webseiten und allen möglichen Dingen gibt es Regeln, die festlegen, wie Umlaute zu kodieren sind (also welcher Zeichensatz zu verwenden ist). Für Dateinamen gibt es solche Regeln nicht. Mir fallen auf Anhieb vier verschiedene Standards ein, nach denen Umlaute kodiert werden können, und auch intelligente Programme können nicht ohne weiteres an der Bytefolge erkennen, welcher Standard verwendet wurde. Das führt dann immer zu diesen „komisch“ verunstalteten Dateinamen. Der Computeranwender kann dann in der Regel einfach nur raten, was gemeint ist. Besonders viel Spaß macht das bei Namen (Köln ist ein schönes Beispiel).
Frage: „Ist das Schriftstück vom AG Köln schon eingegangen?“
Antwort: „Nein, eigentlich hätte es schon da sein müssen, aber ich habe in der gesamten Dateiliste nirgendwo das Wort Köln gefunden, und das Dokument mit dem Namen Koeln.pdf isses nicht“
Viel Spaß bei der Argumentation bei einer daraus resultierenden Fristversäumnis. Das ist jetzt zwar extrem überspitzt, bringt es aber auf den Punkt.
Regelwerke – wie zum Beispiel Gesetze – sind ja ganz schön, aber wenn sie Bezüge und/oder Worte enthalten, für die es keine genaue Spezifikation gibt, dann öffnen sie Fehlern (euphemistisch „Interpretationen“ genannt) Tür und Tor. Die sich daraus ergebenden Konflikte und Probleme sind vermeidbar, wenn man’s von Anfang an richtig machen würde.
Man kann es auch sein lassen. German Umlauts sind ein sinnlosr Ressourcenfresser. Und Bilddateien gehen ja.