Klassische Erhebung einer Stichprobe von Variablenausprägungen
Die klassische Erhebung einer Stichprobe von Variablenausprägungen ist eine statistische Stichprobenmethode zur Einschätzung:
- des Gesamtprüfungswerts eines Kontos oder einer Transaktionsklasse
- des gesamten Fehlerbetrages eines Kontos oder einer Transaktionsklasse als Geldbetrag
Die klassische Erhebung einer Stichprobe von Variablenausprägungen funktioniert am besten mit Finanzdaten, welche die folgenden Eigenschaften aufweisen:
eine moderate bis größere Anzahl fehlerhaft ausgewiesener Beträge Es sind beispielsweise 5% der Elemente oder mehr falsch ausgewiesen. |
sowohl Über- als auch Unterbewertungen sind möglich |
Elemente mit einem Wert von 0 sind möglich |
Tipp
Eine praktische Einführung in den gesamten Ablauf der klassischen Erhebung einer Stichprobe von Variablenausprägungen in Analytics finden Sie unter Tutorial für klassische Stichprobe von Variablenausprägungen.
Hinweis
Über Finanzdaten hinaus können Sie die klassische Erhebung einer Stichprobe von Variablenausprägungen mit beliebigen numerischen Daten verwenden, die Charakteristiken von Variablen aufweisen, also beispielsweise Mengen, Zeiteinheiten oder Messungen.
Funktionsweise
Die klassische Erhebung einer Stichprobe von Variablenausprägungen ermöglicht Ihnen, eine kleine Teilmenge der Datensätze eines Kontos auszuwählen und zu analysieren. Auf Basis des Ergebnisses können Sie dann den Gesamtprüfungswert des Kontos und den Gesamtbetrag des fehlerhaft ausgewiesenen Betrags schätzen.
Die Schätzungen werden als Bereiche berechnet:
- Die Punktschätzung ist der Mittelpunkt des Bereichs.
- Die obere Grenze und die untere Grenze sind die beiden Endpunkte des Bereichs.
Sie können auch eine einseitige Schätzung berechnen, deren Bereich eine Punktschätzung und nur eine obere Grenze bzw. nur eine untere Grenze enthält.
Sie vergleichen die geschätzte Bandbreite mit dem Buchwert für das Konto oder mit dem von Ihnen als wesentlich betrachteten Fehlerbetrag und treffen dann eine Entscheidung über das Konto.
Die klassische Erhebung einer Stichprobe von Variablenausprägungen untermauert eine Aussage der folgenden Art:
- Mit einer Wahrscheinlichkeit von 95% liegt der tatsächliche Prüfungswert des Kontos zwischen 45.577.123,95 und 46.929.384,17, einem Bereich, der den Buchwert des Kontos von 46.400.198,71 beinhaltet. Die Beträge des Kontos sind daher angemessen ausgewiesen.
- Mit einer Wahrscheinlichkeit von 95% liegt der Fehlerbetrag des Kontensaldos zwischen –813.074,76 und 539.185,46, was die monetäre Genauigkeit von ±928.003,97 nicht überschreitet. Die Beträge des Kontos sind daher angemessen ausgewiesen.
Übersicht zur klassischen Erhebung einer Stichprobe von Variablenausprägungen
Achtung
Überspringen Sie nicht die Berechnung eines gültigen Stichprobenumfangs.
Falls Sie sofort eine Stichprobe an Datensätzen ziehen und den Stichprobenumfang raten, besteht eine hohe Wahrscheinlichkeit, dass die Hochrechnung Ihrer Analyseergebnisse ungültig ist und Ihre abschließenden Folgerungen fehlerhaft sein werden.
Die klassische Erhebung einer Stichprobe von Variablenausprägungen umfasst die folgenden allgemeinen Schritte:
- Klassische Erhebung einer Stichprobe von Variablenausprägungen vorbereiten (planen)
- Die Stichprobe aus den Datensätzen ziehen
- Führen Sie Ihre beabsichtigten Prüfungsverfahren für die Stichprobendaten durch.
- Werten Sie die folgenden Sachverhalte aus:
- ob der Prüfungswert der Stichprobendaten nach Hochrechnung auf das gesamte Konto in eine annehmbare Bandbreite des erfassten Buchwerts fällt
- ob die festgestellten Fehlerbeträge in den Stichprobendaten einen akzeptablen oder unannehmbaren Fehlerbetrag für das Gesamtkonto darstellen
Numerische Längenbeschränkung
Einige interne Berechnungen werden während der Vorbereitungsphase der klassischen Erhebung einer Stichprobe von Variablenausprägungen vorgenommen. Die Berechnungen unterstützen Zahlen mit einer maximalen Länge von 17 Ziffern. Wenn das Ergebnis einer Berechnung 17 Ziffern überschreitet, wird das Ergebnis nicht in die Ausgabe aufgenommen, und Sie können die Stichprobenbildung nicht fortsetzen.
Beachten Sie, dass Zahlen aus Quelldaten mit weniger als 17 Ziffern interne Berechnungsergebnisse von über 17 Ziffern verursachen können.
Werte werden zwischen Phasen beibehalten und vorab ausgefüllt
Wenn Sie Analytics für die klassische Erhebung einer Stichprobe von Variablenausprägungen verwenden, geben Sie Informationen in drei unterschiedliche Dialogfelder ein und führen die zugehörigen Befehle in dieser Reihenfolge durch:
- Dialogfeld CVS-Vorbereitung
- Dialogfeld CVS-Stichprobe
- Dialogfeld CVS-Auswertung
Während Sie diesen Prozess durchschreiten, werden Informationen von einem vorherigen Dialogfeld im nächsten Dialogfeld vorgegeben. Diese Vorgaben sparen viel Arbeit und verhindern, dass aus Versehen falsche Werte eingegeben werden, durch welche die Stichprobe ungültig wird.
Wichtige Überlegungen
- Vorgegebene Werte ändern Normalerweise sollten Sie keinen der vorgegebenen Werte ändern. Das Ändern vorgegebener Werte kann die statistische Gültigkeit der Stichprobenbildung aufheben.
Achtung
Aktualisieren Sie vorgegebene Werte nur, wenn Sie die statistischen Kenntnisse aufweisen, um die Auswirkung der Änderung zu verstehen.
-
Temporäre Speicherung von Werten Werte, die automatisch die Dialogfelder CVS-Stichprobe und CVS-Auswertung ausfüllen, werden nur vorübergehend gespeichert. Sobald Sie das Analytics-Projekt schließen, werden sie gelöscht.
Richtlinien
Folgen Sie diesen Richtlinien, damit der CVS-Prozess insgesamt so reibungslos wie möglich verläuft:
- Schließen Sie das Analytics-Projekt zwischen den Phasen CVS-Vorbereitung und CVS-Stichprobe nicht.
Tipp
Falls Sie das Projekt schließen, können Sie die temporären CVS-Werte wiederherstellen, indem Sie die notwendigen Informationen in das Dialogfeld CVS-Vorbereitung erneut eingeben oder den Befehl CVSPREPARE noch einmal aus dem Protokoll heraus ausführen.
- Optional. Speichern Sie die Befehle nach der Ausführung von CVS-Vorbereitung und CVS-Stichprobe in ein Skript. Sie können die Befehle aus der Ausgabeanzeige oder dem Protokoll kopieren.
Sie können auch die vorläufige Fassung des Befehls CVSEVALUATE kopieren, die in die Ausgabe von CVS-Stichprobe aufgenommen wird.
Falls notwendig, können Sie einen oder mehrere der CVS-Befehle aus dem Skript heraus erneut ausführen. Stellen Sie allen Befehlen, die Sie nicht ausführen möchten, COMMENT voran. Die vorläufige Version des CVSEVALUATE-Befehls müssen Sie möglicherweise aktualisieren. Weitere Informationen finden Sie unter Klassische Stichprobe von Variablenausprägungen durchführen.
Schichtung
Mit der klassischen Erhebung einer Stichprobe von Variablenausprägungen können Sie die Datensätze innerhalb einer Grundgesamtheit numerisch schichten, bevor Sie die Stichprobe ziehen.
Der Vorteil einer Schichtung besteht in einer oftmals dramatischen Verringerung des benötigten Stichprobenumfangs, während die statistische Gültigkeit jedoch erhalten bleibt. Durch eine Verringerung des Stichprobenumfangs wird die notwendige Datenanalysearbeit bis zum Erreichen Ihres Ziels verringert.
Funktionsweise

Im Rahmen der Schichtung wird eine Grundgesamtheit in eine gewisse Anzahl von Untergruppen oder Ebenen namens Schichten aufgeteilt. Idealerweise sind die Werte innerhalb jeder Schicht relativ homogen.
Ein statistischer Algorithmus (die Neyman-Methode) legt die Begrenzungen zwischen den Schichten fest. Der Algorithmus positioniert die Begrenzungen, um die Streuung von Werten innerhalb jeder Schicht zu minimieren. Dadurch sinkt die Auswirkung der Varianz innerhalb der Grundgesamtheit. Durch eine niedrigere Varianz oder „Schwankungsbreite“ wird der benötigte Stichprobenumfang verringert. Mit Absicht ist der Bereich jeder Schicht nicht einheitlich.
Die benötigte Stichprobenanzahl wird dann pro Schicht berechnet und summiert, anstatt die gesamte, nicht in Schichten aufgeteilte Grundgesamtheit als Basis heranzuziehen. Für eine identische Datenmenge ergibt der geschichtete Ansatz in der Regel einen wesentlich geringeren Stichprobenumfang als die ungeschichtete Vorgehensweise.
Vorschichtung mit Zellen
Im Rahmen der Schichtenbildung geben Sie die Anzahl der Zellen an, die zur Vorschichtung der Grundgesamtheit verwendet werden sollen. Zellen sind einheitliche numerische Bereiche, die enger als Schichten sind.
Ein statistischer Algorithmus verwendet die Anzahl der Datensätze in jeder Zelle als ein Bestandteil der Berechnung, die optimale Schichtbegrenzungen zuweist. In der endgültigen geschichteten Ausgabe werden Zellen nicht beibehalten.
Die Anzahl der angegebenen Zellen muss mindestens das doppelte der Anzahl festgelegter Schichten sein.
Hinweis
Zellen in der Vorschichtung und die für die Stichprobenauswahl in der Zellenmethode verwendeten Zellen sind nicht identisch.
Zu viel des Guten
Zur Steuerung des Stichprobenumfangs ist die Schichtung ein leistungsfähiges Werkzeug. Sie sollten jedoch bei der Festlegung der Schichten- und der Zellenanzahl vorsichtig sein.
Verwenden Sie als Ausgangspunkt
- 4 bis 5 Schichten
- 50 Zellen
Ab einem gewissen Wert hat eine Anhebung der Schichten- oder Zellenanzahl nur eine geringe oder gar keine Auswirkung auf den Stichprobenumfang mehr. Diese Anhebungen können aber den Entwurf der Stichprobe oder die Analytics-Performance beeinträchtigen, falls Sie große Datasets schichten.
Im Rahmen des Stichprobenplans benötigen Sie beim Erreichen der Auswertungsphase eine Mindestanzahl von Fehlerbeträgen in jeder Schicht, damit der fehlerhafte Ausweis verlässlich auf die Grundgesamtheit hochgerechnet werden kann. Wenn es im Verhältnis zur Anzahl der Fehlerbeträge zu viele Schichten gibt, können bei der Hochrechnung Probleme auftreten.
Die Sicherheitsschicht
Durch die Definition einer Sicherheitsschicht steht eine weitere Schichtungsoption zur Verfügung.
Die Verwendung einer Sicherheitsschicht hat zwei Vorteile:
- Einzeln erhebliche Elemente bzw. Elemente mit hohem Wert werden automatisch in die Stichprobe aufgenommen, sodass kein Risiko besteht, dass sie im Rahmen der zufälligen Auswahlmethode ausgeschlossen werden.
- Elemente der Sicherheitsschicht werden aus der Berechnung des Stichprobenumfangs entfernt. Hochwertige Elemente können die Varianz der Grundgesamtheit naturgemäß beträchtlich vergrößern und damit auch den Stichprobenumfang, solange sie in die Berechnung aufgenommen werden.
Eine Sicherheitsschicht definieren
Um eine Sicherheitsschicht zu definieren, legen Sie einen numerischen Grenzwert fest. Alle Buchwerte des Schlüsselfelds, die mindestens dem Grenzwert entsprechen, werden automatisch ausgewählt und in die Stichprobe aufgenommen. Für den Rest der Grundgesamtheit wird mit der zufälligen Auswahlmethode eine Stichprobe gezogen.
Hinweis
Je niedriger Sie den Grenzwert der Sicherheitsschicht ansetzen, umso mehr erhöhen Sie den gesamten Stichprobenumfang.
Sie sollten es vermeiden, den Grenzwert zu niedrig einzustellen. Wenn Sie sich nicht sicher sind, wie Sie den Wert festlegen sollen, ziehen Sie einen Stichprobenspezialisten zurate.
Obere und untere Sicherheitsschicht
Die Option der Sicherheitsschicht in Analytics definiert lediglich eine obere Sicherheitsschicht. Beträge, die mindestens dem Grenzwert entsprechen, werden in die Sicherheitsschicht aufgenommen.
Unter Umständen möchten Sie auch eine untere Sicherheitsschicht festlegen, um große negative Werte automatisch in die Stichprobe aufzunehmen und die Varianz zu verringern.
Um eine untere Sicherheitsschicht zu erstellen, können Sie eine der folgenden Methoden verwenden:
- Bevor Sie mit der klassischen Erhebung einer Stichprobe von Variablenausprägungen beginnen, verwenden Sie einen Filter und extrahieren alle Werte der Grundgesamtheit, die einem unteren Grenzwert entsprechen oder darunter liegen.
Sie können diese Datensätze in einer getrennten Tabelle belassen oder sie an die Ausgabetabelle anhängen, welche die Stichproben der restlichen Grundgesamtheit enthält.
Weitere Informationen finden Sie unter Extrahieren und Anhängen von Daten.
- Während der Phasen „CVS-Vorbereitung“ und „CVS-Stichprobe“ verwenden Sie eine Wenn-Bedingung, um die Elemente der unteren Sicherheitsschicht auszufiltern.
Achtung
Diese Methode ist riskanter und wird weniger empfohlen, weil Sie sich daran erinnern müssen, die Wenn-Bedingung in beiden Phasen und auch in folgenden Wiederholungen dieser Phasen konsistent anzuwenden.
Wie Datensätze in der klassischen Stichprobe von Variablenausprägungen ausgewählt werden
Die klassische Erhebung einer Stichprobe von Variablenausprägungen nutzt den folgenden Ablauf, um aus einer Analytics-Tabelle Datensätze für eine Stichprobe auszuwählen:
- Sie legen ein numerisches Feld als Grundlage für die Stichprobe fest. Die Stichprobeneinheit ist ein individueller Datensatz der Tabelle.
- Mit der zufälligen Auswahlmethode zieht Analytics aus den Datensätzen der Tabelle eine Stichprobe.
- Wenn Sie die Schichtung verwenden, wird aus jeder Schicht eine ungefähr gleiche Datensatzanzahl zufällig ausgewählt.
- Wenn Sie die Schichtung nicht verwenden, werden die Datensätze zufällig aus der Grundgesamtheit ausgewählt.
- Die ausgewählten Datensätze werden in die Ausgabetabelle der Stichprobe aufgenommen.
Beispiel
In einer Tabelle mit 300 Datensätzen, die in drei Schichten aufgeteilt ist, könnte Analytics die folgenden Datensatznummern auswählen:
Schicht 1 | Schicht 2 | Schicht 3 |
---|---|---|
|
|
|
In einer Tabelle mit 300 Datensätzen ohne Schichten könnte Analytics die unten angezeigten Datensatznummern auswählen. Sie sehen, dass die ausgewählten Datensatznummern weniger einheitlich verteilt sind.
Hinweis
Für einen einfacheren Vergleich werden die folgenden Datensatznummern in drei Spalten gruppiert. Diese Spalten sind jedoch keine Schichten.
|
|
|
Unverzerrte Stichprobenauswahl
Die klassische Erhebung einer Stichprobe von Variablenausprägungen ist unverzerrt und basiert nicht auf Beträgen eines Datensatzes. Die Auswahlwahrscheinlichkeit hinsichtlich einer Einbeziehung in die Stichprobe ist für alle Datensätze gleich. Ein Datensatz mit einem Betrag von $1000, ein Datensatz mit einem Betrag von $250 und ein Datensatz mit einem Betrag von $1 haben allesamt dieselbe Wahrscheinlichkeit ausgewählt zu werden.
Die Wahrscheinlichkeit, dass ein bestimmter Datensatz ausgewählt wird, steht also anders ausgedrückt in keinem Zusammenhang zur Höhe des in ihm enthaltenen Betrags.