Klassische Erhebung einer Stichprobe von Variablenausprägungen

Die klassische Erhebung einer Stichprobe von Variablenausprägungen ist eine statistische Stichprobenmethode zur Einschätzung:

  • des Gesamtprüfungswerts eines Kontos oder einer Transaktionsklasse
  • des gesamten Fehlerbetrages eines Kontos oder einer Transaktionsklasse als Geldbetrag

Die klassische Erhebung einer Stichprobe von Variablenausprägungen funktioniert am besten mit Finanzdaten, welche die folgenden Eigenschaften aufweisen:

eine moderate bis größere Anzahl fehlerhaft ausgewiesener Beträge

Es sind beispielsweise 5% der Elemente oder mehr falsch ausgewiesen.

sowohl Über- als auch Unterbewertungen sind möglich
Elemente mit einem Wert von 0 sind möglich

Tipp

Eine praktische Einführung in den gesamten Ablauf der klassischen Erhebung einer Stichprobe von Variablenausprägungen in Analytics finden Sie unter Tutorial für klassische Stichprobe von Variablenausprägungen.

Hinweis

Über Finanzdaten hinaus können Sie die klassische Erhebung einer Stichprobe von Variablenausprägungen mit beliebigen numerischen Daten verwenden, die Charakteristiken von Variablen aufweisen, also beispielsweise Mengen, Zeiteinheiten oder Messungen.

Funktionsweise

Die klassische Erhebung einer Stichprobe von Variablenausprägungen ermöglicht Ihnen, eine kleine Teilmenge der Datensätze eines Kontos auszuwählen und zu analysieren. Auf Basis des Ergebnisses können Sie dann den gesamten Fehlerbetrag innerhalb des Kontos schätzen.

Die beiden Schätzungen werden als Bereiche berechnet:

  • Die Punktschätzung ist der Mittelpunkt eines Bereichs.
  • Die obere Grenze und die untere Grenze sind die beiden Endpunkte eines Bereichs.

    Sie können auch eine einseitige Schätzung berechnen, deren Bereich eine Punktschätzung und nur eine obere Grenze bzw. nur eine untere Grenze enthält.

Sie vergleichen die geschätzte Bandbreite mit dem Buchwert für das Konto oder mit dem von Ihnen als wesentlich betrachteten Fehlerbetrag und treffen dann eine Entscheidung über das Konto.

Die klassische Erhebung einer Stichprobe von Variablenausprägungen untermauert eine Aussage der folgenden Art:

  • Mit einer Wahrscheinlichkeit von 95% liegt der tatsächliche Prüfungswert des Kontos zwischen 45.577.123,95 und 46.929.384,17, einem Bereich, der den Buchwert des Kontos von 46.400.198,71 beinhaltet. Die Beträge des Kontos sind daher angemessen ausgewiesen.
  • Mit einer Wahrscheinlichkeit von 95% liegt der Fehlerbetrag des Kontensaldos zwischen –813.074,76 und 539.185,46, was die monetäre Genauigkeit von ±928.003,97 nicht überschreitet. Die Beträge des Kontos sind daher angemessen ausgewiesen.

Übersicht zur klassischen Erhebung einer Stichprobe von Variablenausprägungen

Achtung

Überspringen Sie nicht die Berechnung eines gültigen Stichprobenumfangs.

Falls Sie sofort eine Stichprobe an Datensätzen ziehen und den Stichprobenumfang raten, besteht eine hohe Wahrscheinlichkeit, dass die Hochrechnung Ihrer Analyseergebnisse ungültig ist und Ihre abschließenden Folgerungen fehlerhaft sein werden.

Die klassische Erhebung einer Stichprobe von Variablenausprägungen umfasst die folgenden Phasen:

  1. Klassische Erhebung einer Stichprobe von Variablenausprägungen vorbereiten (planen)
  2. Die Stichprobe aus den Datensätzen ziehen
  3. Führen Sie Ihre beabsichtigten Prüfungsverfahren für die Stichprobendaten durch.
  4. Werten Sie die folgenden Sachverhalte aus:
    • ob der Prüfungswert der Stichprobendaten nach Hochrechnung auf das gesamte Konto in eine annehmbare Bandbreite des erfassten Buchwerts fällt
    • ob die festgestellten Fehlerbeträge in den Stichprobendaten einen akzeptablen oder unannehmbaren Fehlerbetrag für das Gesamtkonto darstellen

Werte werden zwischen Phasen beibehalten und vorab ausgefüllt

Die klassische Erhebung einer Stichprobe von Variablenausprägungen setzt in Analytics voraus, dass Sie Informationen in drei unterschiedliche Dialogfelder eingeben und die zugehörigen Befehle in dieser Reihenfolge ausführen:

  1. Dialogfeld CVS-Vorbereitung
  2. Dialogfeld CVS-Stichprobe
  3. Dialogfeld CVS-Auswertung

Während Sie diesen Prozess durchschreiten, werden Informationen von einem vorherigen Dialogfeld im nächsten Dialogfeld automatisch vorgegeben. Diese Vorgaben sparen viel Arbeit und verhindern, dass aus Versehen falsche Werte eingegeben werden, durch welche die Stichprobe ungültig wird.

Werte, die automatisch in den Dialogfeldern CVS-Stichprobe und CVS-Auswertung vorgegeben sind, werden aber nur vorübergehend gespeichert. Sobald Sie das Analytics-Projekt schließen, werden sie gelöscht.

Werte einer klassischen Stichprobenerhebung von Variablenausprägungen erneut erzeugen

In einer Produktionsumgebung führen Sie die unterschiedlichen Phasen der klassischen Erhebung einer Stichprobe von Variablenausprägungen üblicherweise zu verschiedenen Zeiten durch. Zur erneuten Erzeugung der Werte einer klassischen Stichprobenerhebung von Variablenausprägungen, die durch das Schließen von Analytics verloren gingen, können Sie eine der folgenden Methoden verwenden.

Die erste Methode ist am einfachsten.

  • Vorgegebene Befehle speichern

    Die Ergebnisse der Phasen „CVS-Vorbereitung“ und „CVS-Stichprobe“ enthalten nachfolgende Befehle für die Stichprobenbildung, in denen notwendige Werte vorgegeben werden. Speichern Sie diese vorgegebenen Befehle in eigenen Skripts zur späteren Verwendung ab.

    Weitere Informationen finden Sie unter Tutorial für klassische Stichprobe von Variablenausprägungen.

  • Ausgeführte Befehle in Skripts speichern

    Nach Durchführung der Phasen „CVS-Vorbereitung“ und „CVS-Stichprobe“, kopieren Sie die Befehle CVSPREPARE und CVSSAMPLE aus dem Anzeigebereich von Analytics und speichern sie in eigenen Skripts ab. Sie können diese Skripts später ausführen, um die Werte der klassischen Stichprobenerhebung von Variablenausprägungen erneut zu erzeugen.

    Der Nachteil dieser Methode ist, dass Sie eine redundante Datensatzstichprobe ziehen.

  • Ausgeführte Befehle aus dem Protokoll abrufen

    Kopieren Sie die Befehle CVSPREPARE und CVSSAMPLE aus dem Protokoll, und führen Sie sie erneut in der Befehlszeile aus, um die Werte der klassischen Stichprobenerhebung von Variablenausprägungen wieder zu erzeugen.

    Der Nachteil dieser Methode ist, dass es schwierig sein kann, die korrekten Instanzen der Befehle im Protokoll zu finden, und dass Sie eine redundante Datensatzstichprobe ziehen.

Vorgegebene Werte ändern

Normalerweise sollten Sie keinen der vorgegebenen Werte für die klassische Erhebung einer Stichprobe von Variablenausprägungen ändern. Das Ändern vorgegebener Werte kann die statistische Gültigkeit der Stichprobenbildung aufheben.

Achtung

Aktualisieren Sie vorgegebene Werte nur, wenn Sie die statistischen Kenntnisse aufweisen, um die Auswirkung der Änderung zu verstehen.

Numerische Längenbeschränkung

Einige interne Berechnungen werden während der Vorbereitungsphase der klassischen Erhebung einer Stichprobe von Variablenausprägungen vorgenommen. Die Berechnungen unterstützen Zahlen mit einer maximalen Länge von 17 Ziffern. Wenn das Ergebnis einer Berechnung 17 Ziffern überschreitet, wird das Ergebnis nicht in die Ausgabe aufgenommen, und Sie können die Stichprobenbildung nicht fortsetzen.

Beachten Sie, dass Zahlen aus Quelldaten mit weniger als 17 Ziffern interne Berechnungsergebnisse von über 17 Ziffern verursachen können.

Schichtung

Mit der klassischen Erhebung einer Stichprobe von Variablenausprägungen können Sie die Datensätze innerhalb einer Grundgesamtheit numerisch schichten, bevor Sie die Stichprobe ziehen.

Der Vorteil einer Schichtung besteht in einer oftmals dramatischen Verringerung des benötigten Stichprobenumfangs, während die statistische Gültigkeit jedoch erhalten bleibt. Durch eine Verringerung des Stichprobenumfangs wird die notwendige Datenanalysearbeit bis zum Erreichen Ihres Ziels verringert.

Funktionsweise

Die Sicherheitsschicht

Durch die Definition einer Sicherheitsschicht steht eine weitere Schichtungsoption zur Verfügung. Sie können eine obere Sicherheitsschicht, eine untere Sicherheitsschicht oder beides definieren.

Die Verwendung einer Sicherheitsschicht hat zwei Vorteile:

  • Automatischer Einschluss Einzeln erhebliche Elemente bzw. Elemente mit hohem Wert werden automatisch in die Stichprobe aufgenommen, sodass kein Risiko besteht, dass sie im Rahmen der zufälligen Auswahlmethode ausgeschlossen werden.
  • Verringerung der Varianz Elemente der Sicherheitsschicht werden aus der Berechnung des Stichprobenumfangs entfernt. Hochwertige Elemente können die Varianz der Grundgesamtheit naturgemäß beträchtlich vergrößern und damit auch den Stichprobenumfang, solange sie in die Berechnung aufgenommen werden.

Eine Sicherheitsschicht definieren

Um eine Sicherheitsschicht zu definieren, legen Sie einen numerischen Grenzwert fest:

  • Obere Sicherheitsschichtgrenze Alle Buchwerte des Schlüsselfelds, die mindestens dem Grenzwert entsprechen, werden automatisch ausgewählt und in die Stichprobe aufgenommen.
  • Untere Sicherheitsschichtgrenze Alle Buchwerte des Schlüsselfelds, die höchstens dem Grenzwert entsprechen, werden automatisch ausgewählt und in die Stichprobe aufgenommen.

    Eine untere Sicherheitsschicht ist sinnvoll, falls es in einer Grundgesamtheit hohe negative Werte gibt und Sie diese automatisch einschließen möchten.

Aus der restlichen Grundgesamtheit, die durch eine Sicherheitsschicht nicht erfasst wurde, wird mit der zufälligen Auswahlmethode eine Stichprobe gezogen.

Hinweis

Je nach Beschaffenheit der Daten kann der gesamte Stichprobenumfang steigen, wenn Sie den Grenzwert der oberen Sicherheitsschicht verringern oder den Grenzwert der unteren Sicherheitsschicht anheben.

Sie sollten es vermeiden, den Grenzwert zu großzügig einzustellen. Ziehen Sie einen Stichprobenspezialisten zurate, wenn Sie nicht sicher sind, wie Sie den Grenzwert festlegen sollen.

Obere und untere Sicherheitsschicht koordinieren

Wenn Sie für die Entnahme einer Stichprobe sowohl eine obere als auch eine untere Sicherheitsschicht verwenden, müssen Sie auf die Beziehung der oberen und unteren Grenzwerte achten:

  • Sicherheitsschichten dürfen nicht überlappen Es kann ein Fehler auftreten, wenn Sie einen oberen Grenzwert festlegen, der unter einem unteren Grenzwert liegt.
  • Ausreichenden Abstand zwischen den Grenzwerten sicherstellen Wenn Sie zwei Grenzwerte festlegen, die sich zu dicht aneinander befinden, wird die Datenmenge überwiegend automatisch in die Stichprobe aufgenommen, was dem Zweck der Stichprobe widerspricht.

Wie Datensätze in der klassischen Stichprobe von Variablenausprägungen ausgewählt werden

Die klassische Erhebung einer Stichprobe von Variablenausprägungen nutzt den folgenden Ablauf, um aus einer Analytics-Tabelle Datensätze für eine Stichprobe auszuwählen:

  • Sie legen ein numerisches Feld als Grundlage für die Stichprobe fest. Die Stichprobeneinheit ist ein individueller Datensatz der Tabelle.
  • Mit der zufälligen Auswahlmethode zieht Analytics aus den Datensätzen der Tabelle eine Stichprobe.
  • Wenn Sie die Schichtung verwenden, wird aus jeder Schicht eine ungefähr gleiche Datensatzanzahl zufällig ausgewählt.
  • Wenn Sie die Schichtung nicht verwenden, werden die Datensätze zufällig aus der Grundgesamtheit ausgewählt.
  • Die ausgewählten Datensätze werden in die Ausgabetabelle der Stichprobe aufgenommen.

Beispiel

In einer Tabelle mit 300 Datensätzen, die in drei Schichten aufgeteilt ist, könnte Analytics die folgenden Datensatznummern auswählen:

Schicht 1 Schicht 2 Schicht 3
  • 9
  • 13
  • 40
  • 52
  • 78
  • 91
  • 99
  • 104
  • 119
  • 132
  • 144
  • 153
  • 186
  • 211
  • 229
  • 236
  • 248
  • 278
  • 295
  • 296

In einer Tabelle mit 300 Datensätzen ohne Schichten könnte Analytics die unten angezeigten Datensatznummern auswählen. Sie sehen, dass die ausgewählten Datensatznummern weniger einheitlich verteilt sind.

Hinweis

Für einen einfacheren Vergleich werden die folgenden Datensatznummern in drei Spalten gruppiert. Diese Spalten sind jedoch keine Schichten.

  • 25
  • 64
  • 79
  • 104
  • 122
  • 127
  • 138
  • 143
  • 175
  • 179
  • 184
  • 191
  • 201
  • 234
  • 241
  • 257
  • 259
  • 281
  • 289
  • 299

Unverzerrte Stichprobenauswahl

Die klassische Erhebung einer Stichprobe von Variablenausprägungen ist unverzerrt und basiert nicht auf Beträgen eines Datensatzes. Die Auswahlwahrscheinlichkeit hinsichtlich einer Einbeziehung in die Stichprobe ist für alle Datensätze gleich. Ein Datensatz mit einem Betrag von $1000, ein Datensatz mit einem Betrag von $250 und ein Datensatz mit einem Betrag von $1 haben allesamt dieselbe Wahrscheinlichkeit ausgewählt zu werden.

Die Wahrscheinlichkeit, dass ein bestimmter Datensatz ausgewählt wird, steht also anders ausgedrückt in keinem Zusammenhang zur Höhe des in ihm enthaltenen Betrags.

Wenn Sie sicherstellen möchten, dass Datensätze mit großen Beträgen ausgewählt werden, lesen Sie Die Sicherheitsschicht.