Sie wollen Ihre personenbezogenen Daten bereinigen!

Wie geht das? Was ist zu beachten? Wir bieten Ihnen dazu viele nützliche Informationen in unseren Beiträgen an.

 

Gerne unterstützen wir Sie auch persönlich. Unsere standardisierten Angebote konzentrieren sich auf die Anfangsphase des Projekts. Wir begleiten Sie aber auch gerne bis zum Schluss.

 

Wir freuen uns, auch Ihr Vertrauen zu gewinnen.

Ihre Experten für Personendaten.

Scrollen Krähe Krähe Krähe

Personendaten

Checkliste zur Bereinigung von Personendaten

Sie planen ein Projekt zur Bereinigung von Personendaten. Da stellen sich sofort die Fragen nach Schwierigkeit und Zeitbedarf. Wenn Sie dies wissen möchten, tun Sie folgendes: Sie laden die kostenlose Checkliste herunter. Sie beantworten die gestellten Fragen zu Zielsetzung, Daten, Strukturen, Qualität, Datenschutz und Organisation Als Resultat erhalten Sie eine informative Erstauswertung Sie kennen nun

Weiterlesen

Datenschutz: Anonymisierung, Pseudonymisierung und Verschlüsselung

Was bedeuten im Datenschutz ‚Anonymisierung‘, ‚Pseudonymisierung‘ und ‚Verschlüsselung‘? Die drei Begriffe kommen immer wieder vor. In diesem Beitrag erklären wir sie mit jeweils einem Beispiel. Anonymisierung Durch Anonymisierung wird der Bezug von Personendaten zur betroffenen Person unwiderruflich aufgelöst. Es ist somit bei anonymisierten Daten nicht mehr möglich, die Personendaten einer Person zuzuordnen. Als Beispiel führen

Weiterlesen

Dublette und Duplikat

Was ist eigentlich der Unterschied zwischen Dublette und Duplikat? Dublette Eine Dublette ist ein mehrfach vorhandenes Stück in einer Sammlung. In einer Datenbank bezeichnet der Begriff ‘Dublette’ einen doppelt vorhandenen Datensatz. Dubletten in einer Datenbank zeichnen sich jedoch noch durch eine andere Eigenschaft aus. Die Dubletten-Datensätze sind in der Regel nicht identisch. Denn Dubletten entstehen

Weiterlesen

Ursachen für Fehler in Personendaten

Es gibt viele Ursachen für Fehler in den Personendaten. Dabei interessieren wir uns besonders für Personendaten, die in einer Datenbank abgespeichert sind. Im Lauf der Zeit haben sich hier Klassen von Fehlerursachen herausgeschält. Die wichtigsten davon haben wir nachstehend aufgeführt und kurz beschrieben. Tippfehler Am häufigsten kommen wohl Tippfehler als Ursache für Fehler in Personendaten

Weiterlesen

Pannen bei personenbezogenen Daten 2019

Auch im Jahr 2019 kamen immer wieder Pannen bei personenbezogenen Daten vor.  Eine kleine Sammlung dazu finden Sie hier. Die betroffenen Daten sind alles vertrauliche personenbezogene Daten: Passwörter, persönliche Daten, Kreditkarten-Informationen und vor allem Patientendaten. Die Einleitungstexte sind aus den jeweiligen Artikeln kopiert. 4. Januar 2019 Bundesregierung prüft Datenleck Viele deutsche Politiker sind Opfer eines

Weiterlesen

Pannen bei Patientendaten 2019

Eigentlich ist es erschreckend, wie viele Pannen bei Patientendaten vorkommen. Wir haben eine kleine Internet-Recherche durchgeführt. Allein im Jahr 2019 sind von September bis Dezember seit September 8 Fälle in der Presse beschrieben. Und dies nur im deutschsprachigen Raum. Das Fazit: Wahrscheinlich wäre an vielen Orten mehr Sorgfalt im Umgang mit Patientendaten angebracht. Die Einleitungstexte

Weiterlesen

Personen und Daten: Die drei Aufgaben

In der digitalen Welt werden immer mehr Informationen gesammelt. Und dabei handelt es sich häufig um Personen und deren Daten. Welche Aufgaben stellen sich nun, wenn es um die Sicherheit dieser Daten geht? Diese Frage wollen wir im Beitrag ‘Personen und Daten: Die drei Aufgaben’ etwas näher untersuchen. Wir können dazu das Thema in drei

Weiterlesen

Weshalb Patientendaten bereinigen?

Die drei Antworten auf die Frage: Weshalb Patientendaten bereinigen?  Die Situation der Patientendaten ist in aller Regel die folgende. Alle möchten fehlerfreie Daten. Und alle wissen, dass die Daten Fehler enthalten. Doch die meisten leben damit, bis eine ausserordentliche Situation eintritt. Solche Situationen sind: Notwendigkeit des Zusammenführens der Daten aus zwei Datenbanken Einführen eines Master

Weiterlesen

Personen und Daten

Wie gehören Personen und Daten in der digitalen Welt zusammen? Die Daten sind ja nicht automatisch der realen Person zugeordnet. In einer Datenbank ist die Person immer durch einen Datenbankschlüssel identifiziert. Dieser Schlüssel ist gewissermassen die Person im digitalen Umfeld. Meist stimmt der Bezug zwischen Schlüssel und Person. Jedoch ist dies nicht immer sichergestellt. Dafür

Weiterlesen

DSGVO und personenbezogene Daten

Die DSGVO und personenbezogene Daten gehören untrennbar zusammen. Aber was bedeutet dies für die Daten Verwaltung? Müssen Datenbanken neu organisiert werden? Damit befassen wir uns in diesem Beitrag. Wir zeigen auf, welche Massnahmen notwendig sind, um die neuen Anforderungen zu erfüllen. Die Datenschutzverordnung der EU (DSGVO) stellt die neuen Anforderungen an die Daten Verwaltung indirekt.

Weiterlesen

Die Person im Informationssystem

Was heisst es, eine Person im Informationssystem zu sein? Wie gelangt eine Person in ein Informationssystem? Wie wird ein Bezug zwischen der betroffenen Person und ihrer Abbildung im Informationssystem geschaffen? Mit dieser Frage beschäftigt sich dieser Blogbeitrag. Die Person im Informationssystem: von der E-Mail-Adresse zur Mustererkennung Die Digitalisierung bringt es mit sich, dass wir alle

Weiterlesen

weibliche und gleichzeitig männliche Vornamen

Gibt es eigentlich viele Vornamen, die gleichzeitig weibliche und männliche Vornamen sind? Wir sind bei einer Datenanalyse auf diese Frage gestossen. Denn in einer Datenbank haben wir folgenden Fehler festgestellt. Das eingetragene Geschlecht einer Person stimmte nicht mit dem Vornamen überein. Dabei könnte es allerdings auch sein, dass die Vornamen bei Mädchen und Knaben vorkommen.

Weiterlesen

Was sind personenbezogene Daten?

Was sind personenbezogene Daten überhaupt? Was verstehen wir darunter? Welche Kategorien und Arten gibt es? Zuerst eine Definition. Sie ist der DSGVO (Datenschutz Grundverordnung der EU) entnommen. Personenbezogene Daten umfassen alle Informationen, die sich auf eine identifizierbare oder identifizierte Person beziehen. In den meisten Ländern betreffen diese Daten ausschliesslich natürliche Personen. In der Schweiz wird

Weiterlesen

Übersicht über die Bereinigung von Personendaten

Hier erhalten Sie eine kurze Übersicht über die Bereinigung von Personendaten. Wir beginnen dabei mit den einfachsten Fällen. In mehreren Schritten möchten wir Sie dann bis zu den sehr komplexen Aufgaben führen. Deshalb startet unsere Reise durch das Thema mit dem Bereinigen von Personendaten aus einer Quelle. Sie endet mit dem Bereinigen und Zusammenführen von

Weiterlesen

Muster-Projektplan zum Bereinigen von Personendaten

CrowTen hat einen Muster-Projektplan zum Bereinigen von Personendaten entwickelt. Der Muster-Projektplan enthält alle Schritte, die zur Bereinigung von Personendaten notwendig sind. Hier ist er in einer kurzen Version vorgestellt. Der Projektplan stützt sich auf das Muster-Projektmodell. Selbstverständlich ist dieses nicht über Nacht entstanden. Sondern Erfahrungen aus einem Dutzend Projekten haben zu diesem optimierten Projektmodell geführt.

Weiterlesen

Inkrementelle Datenintegration

Was heisst inkrementelle Datenintegration? Aufgabenstellung Zuerst möchten wir kurz erklären, was wir unter dem Begriff ‚inkrementelle Datenintegration‘ verstehen. Müssen Sie Daten aus fremden Quellen in eine Datenbank integrieren, stehen ihnen die so genannten ETL-Tools (extract, transfer, load) zur Verfügung. Müssen Sie die Daten in mehreren Schritten integrieren, kompliziert sich die Aufgabe. Denn die Daten verändern

Weiterlesen

Mehrfache Integration von Daten

Was ist zu tun, wenn die Daten sich nicht auf einmal in eine Datenbank integrieren lassen? Dann ist eine mehrfache Integration der Daten notwendig. Und in welchen Fällen ist diese Aufgabe wirklich anspruchsvoll? Dann versagen die klassischen ETL-Tools ihren Dienst. Wann kommt eine mehrfache Integration von Daten überhaupt vor? In diesem Beitrag haben wir die

Weiterlesen

Duplikate finden und entfernen mit Excel

Excel bietet Möglichkeiten, Duplikate zu finden und zu entfernen. Wir zeigen Ihnen hier, wie Sie diese Funktionen anwenden können. Zum Schluss fügen wir eine Bewertung der Funktionen an. Duplikate finden Excel kann doppelte Einträge in einer Spalte finden und diese markieren. Um diese Funktion anzuwenden, gehen Sie folgendermassen vor: Sie markieren in der Exceltabelle die

Weiterlesen

Transformation von Daten

In zwei Situationen sind Daten Transformationen unerlässlich.

1. Sie ersetzen ein bestehendes Informationssystem durch eine modernere, einfacher wartbare und kostengünstigere Lösung. Die Datenstrukturen von altem und neuem System passen jedoch nicht zusammen. Dann sind Anpassungen der Datenstrukturen notwendig, die Daten  müssen transformiert werden.

2. Sie integrieren Daten aus fremden Datenquellen in eine bestehende Datenbank. Auch hier passen die Datenstrukturen nicht zusammen. Eine Transformation der Daten ist notwendig.

Die Transformationen reichen von einfachen Anpassungen des Formats bis zu anspruchsvollen Anpassungen der Datenstruktur. Wir schlagen eine Einteilung der Aufgaben in drei Klassen vor. So können der Aufwand abgeschätzt und das richtige Vorgehen für die Transformation ausgewählt werden.

Weiterlesen

Sind die Schweizer abergläubisch? Eine Statistik der Hausnummern

Einiges lässt sich aus Strassennamen und Hausnummern herauslesen. Hier sind wir der Frage nachgegangen, ob die Schweizer abergläubisch sind.

Weiterlesen

Personendaten bereinigen: Wie geht das?

Wer Personendaten richtig bereinigen will, kommt um die Bearbeitung von Teilaufgaben nicht herum. Die Vorbereitung spielt dabei eine wichtige Rolle. Ohne gute Grundlagen und eine sorgfältige Planung ziehen sich Projekte der Personenbereinigung unnötig in die Länge. Der Kostenrahmen wird dann kaum je eingehalten.

Um welche Personendaten es sich auch handelt, die Lösung ihrer Bereinigung hat stets dieselbe Struktur. Nicht immer sind alle Schritte erforderlich. Doch in ihrer Abfolge bleiben sie sich gleich. Die Schritte der Standard-Lösung sind hier beschrieben.

Weiterlesen

Qualität der Personendaten

Nicht für alle Personendaten gelten dieselben Qualitätskriterien. Es macht einen Unterschied, ob es sich bei den Personendaten um Versandadressen oder Patientendaten in einem Spital handelt. So sind die Qualitätskriterien entsprechend der jeweiligen spezifischen Situation festzulegen.

Die verschiedenen Kriterien zur Qualitätsbeschreibung gliedern sich in Gruppen. Dabei hilft ein kleiner Katalog der gängigen Qualitätskriterien bei der Festlegung der Anforderungen an die Qualität im Einzelfall.

Weiterlesen

Die digitale Transformation braucht korrekte Personendaten

Zwei Entwicklungen sind Folgen der digitalen Transformation. Erstens steigt die verwaltete Datenmenge stark an. In den letzten 20 Jahren hat sich die Datenmenge verzehnfacht. Dabei hat sich die Qualität der Daten nicht verbessert. Es hat also auch 10 Mal mehr Fehler in den Daten.

Zweitens werden im Zug der digitalen Transformation Systeme vernetzt. Datenbanken, die früher unabhängig in Betrieb waren, tauschen nun ihre Daten aus. Falsche Daten werden anderswo, in anderen Systemen weiterverwendet. Die Datenfehler in einer Datenbank sind oft bekannt und kontrollierbar. Werden sie jedoch von neuen Programmen und Systemen verwendet, haben die Fehler in den Daten unkalkulierbare Folgen.

Deshalb sind korrekte Personendaten mehr denn je eine Notwendigkeit, wenn die Vernetzung von Systemen mehr Nutzen als Schaden bringen soll.

Weiterlesen

sichere und mögliche Dubletten: kennen Sie den Unterschied?

Die Bereinigung von Personendaten führt zur Unterscheidung von sicheren und möglichen Dubletten. Die Programme zur Dubletten Erkennung finden in einer grossen Datenmenge automatisch die doppelten Datensätze, die Dubletten. Die Programme können jedoch bei ähnlichen Datensätzen nicht immer mit Sicherheit entscheiden, ob es sich um echte Dubletten handelt oder nicht. Deshalb unterscheiden wir zwischen sicheren und unsicheren Dubletten. Die unsicheren Fälle werden als mögliche Dubletten ausgewiesen und sind mit zusätzlichen Informationen zu beurteilen.

Weiterlesen

Gruppenbildung zur Suche von Dubletten

Grosse Datenbanken können eine Million verschiedener Datensätze beinhalten. Es ist unmöglich, jeden Datensatz mit jedem anderen zu vergleichen. Es können einfach nicht alle möglichen Kombinationen für Gruppenbildungen ausprobiert werden. Das Finden der möglichen Dubletten und diese in Gruppen zusammenzufassen, ist somit die schwierigste Aufgabe beim Bereinigen von Personendaten. Dies erfordert spezielle Verfahren. CrowTen hat Algorithmen entwickelt, die für die Gruppenbildung von Personendaten in der Schweiz (Mehrsprachigkeit, spezielle Vornamen), optimiert sind.

Weiterlesen

Glossar Personendaten

Die wichtigsten Begriffe im Zusammenhang mit der Bereinigung von Personendaten sind hier aufgeführt und beschrieben. In den weiteren Beiträgen werden die Begriffe mit der beschriebenen Bedeutung verwendet.

Weiterlesen

Bearbeiten möglicher Dubletten

Mögliche Dubletten entstehen folgendermassen: Der Algorithmus zur automatischen Dubletten Erkennung kann nicht alle Datensätze mit Sicherheit den Dubletten oder den Unikaten zuordnen. Dort, wo er nicht entscheiden kann, bleiben die möglichen Dubletten übrig. Sie müssen manuell bearbeitet werden. Mit Hilfe zusätzlicher Informationen entscheidet dann eine zuständige Person, ob es sich um Unikate oder Dubletten handelt. Bei einer grossen Zahl von Daten kann diese Arbeit Tage oder Wochen beanspruchen. In diesem Fall werden Verfahren und Hilfsmittel zur effizienten Bearbeitung möglicher Dubletten eingesetzt.

Weiterlesen

Datenfelder zur Personenidentifikation

Die Personen werden anhand von Datenfeldern identifiziert. Einige davon werden immer zur Identifikation der Person verwendet. Andere sind nicht immer vorhanden. Sie werden bei Verfügbarkeit beigezogen. Die wichtigsten Datenfelder zur Personenidentifikation mit aus Eigenschaften und typischen Fehlern sind hier beschrieben. Die besten Algorithmen nutzen diese Eigenschaften zur Personenidentifikation aus.

Weiterlesen

Bereinigen von Daten in Etappen

Werden Personendaten bereinigt während das Informationssystem noch in Betrieb ist, werden die Daten im System weiterhin verändert. Nach der Bereinigungsphase ist somit eine Nachbereinigung notwendig. Die in der Zwischenzeit geänderten Daten sind zu bereinigen.

Die Lösung ist eine Bereinigung in Etappen. Diese kann nur mit Unterstützung eines Software-Werkzeugs sinnvoll durchgeführt werden. Nur so können Korrekturen auf den bereits bereinigten Daten automatisch nachgeführt, wo dies möglich ist. CrowTen hat Verfahren und Tools für diesen Zweck entwickelt.

Weiterlesen

Synchronisation von Daten – die Kernaufgaben

Zwei Datenbestände verwalten zum Teil dieselben Objekte. Diese haben jedoch keinen gemeinsamen Identifikationsschlüssel. Zudem sind die Daten auch unterschiedlich strukturiert. Das Ziel der Synchronisation ist es, Objekte zwischen den Datenbeständen korrekt miteinander zu verknüpfen und auszutauschen.

Die drei Kernaufgaben der Synchronisation

Damit die Synchronisation korrekt ausgeführt werden kann, sind die folgenden drei Kernaufgaben zu lösen:

1. Transformation
2. Objektidentifikation
3. Zusammenfügen der Objekte – Aufbereiten der Resultate

Weiterlesen

Dubletten in Patientendaten

Werden Pateientendatenbanken zusammengelegt, ein MPI gebildet oder medizinische Informationen aus verschiedenen Systemen zusammengeführt, dann ist das Finden der Dubletten die Voraussetzung. Die Aufgabe ist anspruchsvoll. Fehler in Namen und Vornamen, Verwechslungen, Änderungen des Familiennamens bringen einfache Dublettensuchen rasch an ihre Grenzen.
CrowTen hat eine Software-Lösung und ein Verfahren zur anspruchsvollen Dublettensuche entwickelt. Dubletten werden in auch kompliziertesten Fällen mit der grösstmöglichen Sicherheit gefunden.

Weiterlesen