<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=2038511469714819&amp;ev=PageView&amp;noscript=1">

Testdatengenerierung – So hilft eperi

31. Juli 2019

Das eperi Gateway verfügt über zahlreiche Funktionen, die sich vor allem auf den Schutz von Cloud-Daten konzentrieren. Dabei werden aber auch gleichzeitig allgemeine Datenschutzanforderungen erfüllt. Aus diesem Grund entwickelt eperi immer wieder neue Produkte auf der Grundlage des patentierten Template-Konzepts, von denen das neueste der Adapter für die Generierung von Testdaten ist.

Testdaten_Teil3_800x800

GDPR, PCI-DSS und andere gesetzliche Vorschriften haben den Umgang mit personenbezogenen Daten verändert: Dies gilt auch für Daten, die für die Entwicklung, den Test und die Schulung von Software verwendet werden. Dazu zählen beispielsweise unter anderem CRM-Systeme oder Software aus dem Bereich Human Resources. Diese strengen Vorschriften verbieten die Verwendung sensibler Informationen für andere Zwecke als die, zu denen sie erhoben wurden. Daher dürfen diese Produktionsdaten nicht in einer Entwicklungsumgebung eingesetzt werden. Geschieht das dennoch, können saftige Strafen drohen.

Die besondere Herausforderung bei Testdaten besteht darin, dass sie sich an die Struktur und das Format der realen Daten halten müssen, um die gleichen Fehler zu provozieren, die später auftreten können, wenn Produktionsdaten in die Anwendung gelangen. Gleichzeitig dürfen aber nicht die Produktionsdaten als solche für die Prüfung herangezogen werden. Mit der eperi Testdatengenerierung läuft dieser Prozess so reibungslos wie möglich. In 4 einfachen Schritten erreichen Kunden so die nötige Compliance – auch und gerade beim Umgang mit Testdaten:

  1. Die Anwendung wird auf einem Server oder einer VM im Rechenzentrum des Kunden bereitgestellt. Es muss also nichts bei Entwicklern und Testern installiert werden. Somit haben diese auch keinen Zugriff auf die Zielanwendung.
  2. Der Kunde entscheidet selbst, ob ein Einzelwert, eine CSV-Datei oder eine Datenbank anonymisiert werden soll und kann den Anonymisierungs-Webservice selbst einrichten oder das eperi Gateway mit der Datenbank verbinden.
  3. Der Kunde kann ohne großen Aufwand Richtlinien für Werte / Spalten einrichten, die anonymisiert oder pseudonymisiert werden sollen.
  4. Der Prozess kann immer wieder nach Belieben gestartet werden – sogar auf mehreren Gateways parallel für sehr große Datenmengen.

Die Technik

Speziell für die Verwendung bei Testdaten hat eperi einen Tokenizer für aussprechbare Zeichenketten hinzugefügt. Ein Beispiel: Der Test eines CRM-Systems kann dazu führen, dass jemand telefonisch den Namen eines Kontoinhabers an jemand anderen weitergeben muss – dies wäre mit zufällig generierten Zeichenketten (wie Xbfegt) sehr mühsam und kann zu Missverständnissen führen.

Doch die Tokenisierungsfunktion des eperi Gateways ist noch viel mehr als das. Kunden können sogar ihre eigenen Tokenizer entwerfen, indem sie beispielsweise den RegEx-Tokenizer verwenden. Damit können relevante Teile der Live-Kreditkartendaten so anonymisiert werden, dass sie später dem Format von Dummy-Zahlungskarten entsprechen.

Darüber hinaus können die generierten Werte entweder die statistische Verteilung der Originalwerte darstellen oder völlig unabhängig davon sein (= eindeutige Token). Außerdem können die Kunden mit dem eperi Gateway alle Zeilen einer Spalte auf die gleichen Zieldaten setzen oder sicherstellen, dass bestimmte Spalten in der Zieltabelle ganz weggelassen werden, um Daten zu reduzieren. Und sie können entscheiden, ob Sie den Originalwert beibehalten wollen, um die erzeugten Daten bei Bedarf wieder auf ihren Originalwert zurücksetzen zu können oder ob sie sie verwerfen möchten.

All dies ist mit geringen Kosten verbunden: Es sind keine Änderungen an der Zielanwendung erforderlich, so dass der Integrationsaufwand minimal ist. Auch bei unterschiedlichen Quell- und Zieldatenbanktypen in Test- und Produktionsumgebung (wie beispielsweise DB2 und Oracle) ist die eperi Testdatengenerierung problemlos einsetzbar. Das eperi Gateway stellt die Kompatibilität zwischen den beiden Welten sicher.

Und hier hört es noch nicht auf: Wie bereits erwähnt, werden echte Kundendaten immer häufiger als Trainingsdaten für die Künstliche Intelligenz verwendet. eperi will in Zukunft Alternativen zur Datenspeicherung anbieten: Deshalb beteiligen wir uns an einem Forschungsprojekt mit der Fachhochschule Würzburg zur Nutzung von Testdaten in IoT-Umgebungen mit künstlicher Intelligenz, bei dem Massendaten erzeugt und analysiert werden, die einen potenziell schädlichen Einblick in unternehmenskritische Prozesse geben, wenn sie in die falschen Hände geraten.

 


Auch interessant:

Produkt Information: eperi Testdatengenerierung

 

Share Button: LinkedIn Share Button: XING