Testdatengenerierung mit RapidRep®

Generieren Sie Ihre Testdaten für das Back-End mit RapidRep – unkompliziert, nachhaltig, hoch-flexibel.

Ein zentraler Schritt im Testprozess ist das Testen mit möglichst vielen Datensätzen. Bereits aus Datenschutzgründen sollten die Testdaten jedoch nicht den Produktivdaten entsprechen. Dies ist vor allem in Hinblick auf die im Mai 2018 in Kraft tretende EU-weite Datenschutz-Grundverordnung sowie das ergänzende „neue Bundesdatenschutzgesetz“ höchst relevant.1 Zufallsbedingte, fiktive Daten sind gefragt. Jedoch reichen Daten, die mit Online-Generatoren oder gering anpassbarer Software erstellt werden, in der Regel nicht aus, um die eigenen Anwendungsfälle komplett abzudecken. Die Generierung der nötigen Testdaten wird daher oft zum zeit- und kostenintensiven Vorgang, unter Umständen erschwert durch komplexe Relationen.

Hier bieten wir Ihnen mit RapidRep eine unkomplizierte Lösung. Dank der RapidRep Regelwerke erzeugen Sie mit RapidRep realistische, zufällige Daten für das Back-End, die Ihren Anforderungen sowie den neuen Sicherheitsbestimmungen entsprechen, flexibel anpassbar sind und somit eine hohe Anzahl an Anwendungsfällen abdecken können. Weder sind Sie auf einen geringen Umfang von Datensätzen oder ein einziges Zielsystem, noch auf ein einziges Ausgabeformat beschränkt. Da RapidRep zudem über eine innovative Lösung zur Datenqualitätssicherung verfügt, können Sie optional immer auch die Qualität Ihrer Testdaten überprüfen.

Das Vorgehen zur Testdatenerstellung mit RapidRep umfasst im Wesentlichen zwei Schritte: die Beschreibung eines Datenmodells für Ihre Testdaten sowie die Erstellung eines RapidRep Regelwerkes zur Testdatengenerierung. Das Regelwerk muss anschließend in eine RapidRep Reportdefinition eingebunden werden, um die Ausgabe der Daten zu steuern.2

Schritt 1: Datenmodell und Zieltabellen identifizieren

Zunächst stellt sich die Frage, welche Daten Sie für den Test benötigen. Dies sollte sich im Normalfall aus dem Anwendungsfall ergeben und im besten Fall haben Sie bereits ein entsprechendes Datenmodell vorliegen. Sollte dies nicht so sein, identifizieren Sie im ersten Schritt ein Datenmodell für Ihre Testdaten. Aus diesem lassen sich sowohl die Zieltabellen und –spalten ableiten, welche wir mit Testdaten befüllen möchten, als auch deren relationale Abhängigkeiten. (Wir gehen im folgenden Beispiel von der Ausgabe in Tabellen aus, mit RapidRep können Sie jedoch auch andere Ausgabeformate, bspw. CSV, wählen.)

Datenmodell für das Beispiel zur Testdatengenerierung

(Grafik 1: Datenmodell für das Beispiel zur Testdatengenerierung)

In diesem Beispiel ist der Datensatz „Customer“ der Ausgangspunkt, von welchem die weiteren Datensätze abhängen und welcher, ebenso wie z.B. die Bestellung einmalig identifizierbar sein sollte, d.h. es sollte in der Tabelle „Customer“ kein Kunde doppelt vorkommen und jeder Bestellung, Rechnung und Adresse genau ein Kunde zugeordnet sein. Hingegen könnten mit einem Kunden verschiedene, also mehrere, Adressen verbunden sein, z.B. eine abweichende Lieferadresse für eine bestimmte Bestellung. Aus dem Modell ergibt sich, dass wir für unsere Daten die Tabellen „Address“, „Customer“, „Order“, „Order_Position“, „Invoice“ und „Payment“ anlegen (wollen).

Wie werden nun jedoch die Werte bestimmt, welche diese Zieltabellen füllen sollen, und wie können die so entstehenden Testdaten realistisch gestaltet werden (z.B. statistischen Häufigkeiten entsprechen)? Dazu überführen Sie im nächsten Schritt das Datenmodell in ein RapidRep Regelwerk, welches alle Regeln umfasst, die zur Generierung der entsprechenden Testdaten benötigt werden.

Schritt 2: RapidRep Regelwerk zur Testdatengenerierung erstellen

RapidRep Regelwerke sind der Übersichtlichkeit und Zugänglichkeit halber in Excel angelegt und in ihrer Struktur flexibel. Sie sollten für alle beteiligten Personen verständlich sein, um Transparenz und Glaubwürdigkeit der Ergebnisse zu gewährleisten. Mehr Informationen zu den Eigenschaften der Regelwerke und dem modellbasierten Testen mit RapidRep finden Sie hier: Modellbasiertes Testen mit der RapidRep Test Suite.

Das Regelwerk zur Testdatengenerierung umfasst neben einem Arbeitsblatt, welches das Datenmodell abbildet, ein Arbeitsblatt mit Rohdaten sowie verschiedene Arbeitsblätter mit Regeln und Spezifikationen, wie diese verwendet werden. Die Rohdaten stellen die Wertelisten dar, welche als Datenquelle für die Zieltabellen und -spalten genutzt werden. Mittels der schrittweisen Auswertung der enthaltenen Regeln, werden die Ausgangs-  bzw. Rohdaten in das erwartete Ergebnis, in diesem Fall die Testdaten, transformiert. In der folgenden Grafik sehen Sie einen Ausschnitt der Regeln, die bei unserem Beispiel zur Testdatengenerierung Anwendung finden.

Ausschnitt Regelwerk Beispiel Testdatengenerierung

(Grafik 2: Ausschnitt Regelwerk; Regeln für das Beispiel zur Testdatengenerierung)

RapidRep-Regeln haben die folgenden allgemeinen Eigenschaften:

  • Regeln haben die Form: Wenn (Bedingung) > Dann (Aktion).
  • Jede Regel ist eindeutig über das Attribut RULE_ID identifizierbar (Grafik 2, Spalte 3).
  • Mit dem Attribut ORDER_ID kann, wenn nötig, die Auswertungsreihenfolge von Regeln geändert werden (Grafik 2, Spalte 2; in diesem Beispiel nicht relevant).
  • Jede Regel erfüllt in einem Regelwerk eine ganz bestimmte Aufgabe (funktionaler Aspekt).
  • Jede Regel muss mindestens ein Attribut besitzen, das die RapidRep Rule-Engine für die Auswertung der Wenn-Bedingung verwenden kann.
  • Regeln dürfen beliebig viele andere Attribute besitzen.

Bei der schrittweisen Auswertung der Regeln würde im dargestellten Beispiel zuerst die Regel mit der RULE_ID 1 Anwendung finden. Diese bezieht sich auf die Tabelle „Customer“ (siehe Grafik 2, Spalte „Aspect“) und befüllt in dieser die Spalte „Country“ (siehe Grafik 2, Spalte „Target“). Welchen Wert RapidRep in die Spalte einfügen wird, bestimmt die in der Spalte „Source“ angegebene Funktion. Diese wählt einen Wert aus der Werteliste „Country“ entsprechend vorgegebener Gewichtungen zur Wahrscheinlichkeit (siehe Grafik 3 unten). Wo die Werte zu finden sind und mit welcher Gewichtung sie gewählt werden ist auf anderen Arbeitsblättern („Importspezifikationen“, „Enumerations“) zu finden.

Werteliste Country Beispiel Testdatengenerierung

(Grafik 3: Werteliste "Country" für das Beispiel zur Testdatengenerierung)

Die nachfolgenden Regeln im Beispiel Grafik 2 beziehen sich auf die Auswahl und bestimmen aufgrund dieser Auswahl den Wert der Spalte „Language“ der Tabelle „Customer“. Wird zum Beispiel für „Country“ der Wert „IT“ gewählt, so werden die Regeln 2-5 als „failed“ gewertet, da die Vorbedingung (siehe Grafik Spalte 5, „Pre-Condition“) nicht erfüllt ist. Abhängig von der zufälligen prozentualen Wahrscheinlichkeit die in der Bedingung festgelegt wird (siehe Grafik Spalte 6, „Condition“), wird der Wert „it“, „de“ oder „fr“ in die Zielspalte Language eingetragen. Entspricht der Wert für „Country“ keinem der vorgegebenen Länder, werden Regeln 2-12 als „failed“ gewertet und die Regel mit der Rule_ID 13 findet Anwendung, d.h. in diesem Fall wird „en“ als Wert für die Sprache in die Spalte „Language“ eingtragen.

In dieser Form werden alle Spalten der in unserem Datenmodell vorgegebenen Zieltabellen gefüllt. Dies geschieht mit fiktiven und zufälligen Werten, welche auf dem Arbeitsblatt Rohdaten in Listen hinterlegt sind. Verwendete Funktionen, bspw. zur Selektion des Landes, sind in der Reportdefinition in RapidRep angelegt, welche die im Regelwerk angelegten und nachvollziehbaren Regeln interpretiert. Einmal erstellt, lassen sich so mittels Regelwerk und Reportdefinition in RapidRep die Testdaten gemäß  der völlig benutzerdefinierten und damit an jeglichen Sonderfall angepassten Vorgaben immer wieder in zufälliger Zusammenstellung generieren.

Fazit: Testdatengenerierung mit RapidRep

Um sicherzugehen, dass Ihre Prozesse und Datenverarbeitungen funktionieren und auch den neuen Sicherheitsbestimmungen entsprechen, sollten Sie in Ihren Tests möglichst viele Datensätze verproben. Auch diese Testdaten müssen natürlich den Bestimmungen der EU-Datenschutzgrundverordnung und dem „neuen Bundesdatenschutzgesetz“ entsprechen. Testdaten, die nicht nur fiktiv sind, sondern darüber hinaus auch Ihren Anwendungsfällen entsprechen und die relationalen Abhängigkeiten korrekt abbilden, sind das A und O.

Mit RapidRep Regelwerken erstellen Sie Testdaten, die genau zu Ihren Bedürfnissen passen:

  • sie sind fiktiv;
  • sie sind zufällig;
  • sie sind nachvollziehbar;
  • sie können den Häufigkeitsverteilungen allgemeiner sowie kundenstammspezifischer Statistiken entsprechen;
  • sie können an individuelle Gegebenheiten angepasst werden (Umsetzung des eigenen Datenmodells).

Weitere Vorteile:

  • die Anzahl der Testdatensätze ist nicht auf wenige Hundert beschränkt;
  • das Ausgabeformat und Zielsystem kann angepasst werden;
  • Regelwerke lassen sich einfach duplizieren und für andere Szenarien abändern;
  • die Qualität der Testdaten kann mit RapidRep’s integrierten Lösungen direkt überprüft werden.

Sie benötigen keine weitere Software zur Testdatengenerierung, sondern erledigen dies gleich mit RapidRep, während Sie alle weiteren Vorteile nutzen, die die Arbeit mit den RapidRep Suiten mit sich bringt.

Falls Sie Unterstützung für das Erstellen Ihrer Testdaten mit RapidRep benötigen, kontaktieren Sie uns und wir beraten Sie gern!

 

Fußnoten:

1: Vgl. zum Beispiel:  https://www.datenschutz-wiki.de/BDSG_2018

2: Dabei handelt es sich um typische Arbeitsschritte mit RapidRep, die über das hier behandelte Thema hinausgehen. Informationen stellen Ihnen weitere Artikel aus dieser Website, unser Forum sowie die RapidRep Dokumentation zur Verfügung.

Aufsichtskonforme IDV-Lösungen mit RapidRep®

Mit RapidRep, der Softwarefamilie von FINARIS, können Sie IDV-Lösungen erstellen und anpassen, die die bankaufsichtlichen Anforderungen an die IT von vornherein erfüllen.

Lösungen zur individuellen Datenverarbeitung (IDV) sind aus der IT-Landschaft vieler Unternehmen nicht wegzudenken. Häufig auftretende Nachteile der IDV wie mangelnde Reproduzier- oder Nachvollziehbarkeit stellen dabei jedoch ein Risiko dar. Dies gilt vor allem für den Finanzsektor. Daher enthält das aktuelle Rundschreiben zu den "Bankaufsichtlichen Anforderungen an die IT" (BAIT) spezifische Anforderungen an die IDV.

Bei bestehenden IDV-Anwendungen handelt es sich oft um Insellösungen, die lediglich für spezifische Arbeitsgänge eingesetzt werden können, nicht übergreifend kompatibel sind und keine für die Fachabteilung nachvollziehbaren Ergebnisse darstellen. Sie sind personenabhängig, vor allem da es meist auch an der Dokumentation mangelt, und verfügen, wenn überhaupt, nur über geringe Sicherheitsmaßnahmen. Insbesondere der Sicherheitsaspekt und das damit verbundene Risikobewusstsein sind Grund für die Konsultation 02/2017 zu den bankaufsichtlichen Anforderungen an die IT der Banken (https://www.bafin.de/SharedDocs/Veroeffentlichungen/DE/Konsultation/2017/kon_0217_bankaufsichtliche_anforderungen_it_ba.html). Die Anforderungen an die individuelle Datenverarbeitung umfassen unter anderem Nachvollziehbarkeit, Nutzer-Authentifizierung und angemessene Versionierung.

Mit der von FINARIS hergestellten Software RapidRep erstellen Sie IDV-Lösungen, die diese Kriterien erfüllen. Anwendungen, die auf RapidRep basieren:

  • erzeugen nachvollziehbare Ergebnisse durch den Einsatz von Regelwerken,
  • können die Ergebnisse (auch aus früheren Versionen) reproduzieren,
  • ermöglichen konstruktiven Dialog mit der Fachabteilung dank Einbindung von übersichtlichen Vorlagen,
  • sind personenunabhängig und leicht in Linie überführbar,
  • werden agil oder konventionell (Wasserfall) entwickelt,
  • liefern schnell erste Ergebnisse,
  • können bei Bedarf ohne Installation dezentral bei Tochterunternehmen ausgerollt werden (portable App),
  • trennen Entwicklung und Betrieb durch ein smartes Freigabeverfahren,
  • erfüllen sehr hohe Ansprüche an Authentifizierung und Autorisierung,
  • haben ein einfaches und intuitives User Interface,
  • integrieren sich in die bestehende IT-Infrastruktur (LDAP, Back Up, RDBMS),
  • können flexibel an neue Anforderungen angepasst werden,
  • bieten eine Versionsverwaltung und ein optionales 4-Augen-Prinzip.

Wie kommt es, dass RapidRep so gut an die Bedürfnisse der Finanz-IT angepasst ist? Die vereinte IT- und Finanzerfahrung von FINARIS bewährt sich seit vielen Jahren in Projekten von Großbanken und Finanzinstituten und die gewonnenen Kenntnisse sowie Best Practice Ansätze fließen kontinuierlich in die Erweiterung von RapidRep. Die Software ist in vielen Unternehmen des Finanzsektors im Einsatz. Durch die Verbindung von Praxiserfahrung, IT-Kenntnissen und Finanzwissen deckt RapidRep bereits die grundlegenden Anforderungen an die IDV ab und kann richtlinienkonform eingesetzt werden. Auf RapidRep basierende IDV-Lösungen zu aufsichtsrechtlichen Anforderungen werden bereits in zahlreichen aufsichtsrechtlichen Projekten (z.B.  EBA Stresstest , EZB Stresstest, EBA Funding Plan, ...) erfolgreich eingesetzt (siehe auch: http://www.rapidrep.com/de/aufsichtsrechtliche-sonderanforderungen).

Die BAIT richten sich in erster Linie an die Geschäftsleitungen der Kreditinstitute und haben zum Ziel die Erwartungen der Aufsicht in Bezug auf IT-Sicherheit zu verdeutlichen. Seit dem Frühjahr 2017 liegt der Entwurf des Rundschreibens zu den BAIT vor und kann auf der Website der BaFin heruntergeladen werden (siehe oben). Das Schreiben wurde von BaFin und Bundesbank gemeinsam entwickelt mit Unterstützung des Fachgremiums IT, welchem neben den Aufsichtsbehörden Vertreter/innen verschiedener IT-Dienstleister, Bankenverbände und der Wissenschaft angehören. Die BAIT befassen sich mit acht Schwerpunktthemen, unter anderem IT-Strategie, Informationssicherheitsmanagement und IT-Betrieb. Vor allem im Kapitel „IT-Projekte, Anwendungsentwicklung (inkl. durch Endbenutzer in den Fachbereichen)“ finden sich Anforderungen an die IDV.

Cookies helfen uns bei der Bereitstellung unserer Dienste. Durch die Nutzung unserer Dienste erklären Sie sich damit einverstanden, dass wir Cookies setzen.

OK