OMIT( )-Funktion

Gibt eine Zeichenfolge an, bei der eine oder mehrere angegebene Teilzeichenfolgen entfernt werden.

Syntax

OMIT(Zeichenfolge1; Zeichenfolge2 <;Groß-/Kleinschreibung beachten>)

Parameter

Name	Typ	Beschreibung
Zeichenfolge1	Zeichen	Das Feld, der Ausdruck oder tatsächliche Wert, aus dem ein oder mehrere Teilzeichenfolgen entfernt werden sollen.
Zeichenfolge2	Zeichen	Ein oder mehr zu entfernende Teilzeichenfolgen. Trennen Sie mehrere Teilzeichenfolgen mit Semikolons. Fügen Sie nach dem Komma lediglich ein Leerzeichen ein, wenn dieses Teil der Unterzeichenfolge ist, die Sie entfernen möchten. Wenn das doppelte Anführungszeichen in einer der Teilzeichenfolgen vorkommt, schließen Sie den gesamten Parameter Zeichenfolge2 in einfache Anführungszeichen (‘ ’) statt doppelte Anführungszeichen ein. Um ein Komma auszulassen, fügen Sie ein Komma an letzter Stelle der Liste der Unterzeichen ein, dem unmittelbar abschließende Anführungszeichen folgen (s. Beispiel unten).
Groß-/Kleinschreibung beachten Optional	logisch	Geben Sie T an, um für Teilzeichenfolgen zwischen Groß-/Kleinschreibung zu unterscheiden, oder F, um Groß-/Kleinschreibung zu ignorieren. Wenn Groß-/Kleinschreibung beachten ausgelassen wird, wird der Standardwert „T“ verwendet.

Name

Typ

Beschreibung

Zeichenfolge1

Zeichen

Das Feld, der Ausdruck oder tatsächliche Wert, aus dem ein oder mehrere Teilzeichenfolgen entfernt werden sollen.

Zeichenfolge2

Zeichen

Ein oder mehr zu entfernende Teilzeichenfolgen.

Trennen Sie mehrere Teilzeichenfolgen mit Semikolons.
Fügen Sie nach dem Komma lediglich ein Leerzeichen ein, wenn dieses Teil der Unterzeichenfolge ist, die Sie entfernen möchten.
Wenn das doppelte Anführungszeichen in einer der Teilzeichenfolgen vorkommt, schließen Sie den gesamten Parameter Zeichenfolge2 in einfache Anführungszeichen (‘ ’) statt doppelte Anführungszeichen ein.
Um ein Komma auszulassen, fügen Sie ein Komma an letzter Stelle der Liste der Unterzeichen ein, dem unmittelbar abschließende Anführungszeichen folgen (s. Beispiel unten).

Groß-/Kleinschreibung beachten

Optional

logisch

Geben Sie T an, um für Teilzeichenfolgen zwischen Groß-/Kleinschreibung zu unterscheiden, oder F, um Groß-/Kleinschreibung zu ignorieren.

Wenn Groß-/Kleinschreibung beachten ausgelassen wird, wird der Standardwert „T“ verwendet.

Ausgabe

Zeichen.

Beispiele

Einfache Beispiele

Literale Zeicheneingabe

Gibt „Intercity Couriers“ zurück:

OMIT("Intercity Couriers Corporation"; " Corporation, Corp.")

Gibt „Inter-city Couriers“ zurück:

OMIT("Inter-city Couriers Corp."; " Corporation, Corp.")

Hinweis

Die Levenshtein-Distanz zwischen den zurückgegebenen Werten in den ersten beiden Beispielen beträgt „1“. Wenn die generischen Elemente nicht entfernt werden, beträgt die Distanz zwischen den beiden Beispielen 8, sodass die Werte möglicherweise nicht als Fuzzy-Duplikate erkannt werden.

Feldeingabe

Gibt alle Werte des Felds Lieferantenname zurück, wobei generische Elemente wie „Corporation“ und „Corp“ entfernt wurden:

OMIT(Lieferant;" Corporation, Corp., Corp, Inc., Inc, Ltd., Ltd")

Gibt alle Werte des Felds Lieferantenname zurück, wobei generische Elemente wie „Corporation“ und „Corp“ entfernt wurden:

OMIT(Lieferant;" ,.,Corporation,Corp,Inc,Ltd")

Hinweis

Die beiden vorherigen Beispiele geben die gleichen Ergebnisse zurück, die Syntax des zweiten Beispiels ist jedoch effizienter.

Gibt alle Werte des Felds Lieferantenname zurück, wobei „Corporation“ und „Corp“ sowie sämtliche Kommata entfernt wurden:

OMIT(Lieferant;" Corporation, Corp,")

Bemerkungen

OMIT( ) kann Teilzeichenfolgen als Einheiten entfernen

Die OMIT( )-Funktion entfernt eine oder mehrere Teilzeichenfolgen aus einer Zeichenfolge. Sie unterscheidet sich von Funktionen wie CLEAN( ), EXCLUDE( ), INCLUDE( ) und REMOVE( ), da sie Zeichen auf Basis von Teilzeichenfolgen anstatt auf zeichenweiser Basis abgleicht und entfernt. Dadurch können Sie bestimmte Wörter, Abkürzungen oder wiederholte Zeichensequenzen aus einer Zeichenfolge entfernen, ohne den Rest der Zeichenfolge zu beeinträchtigen.

Eine Hilfsfunktion für Fuzzy-Vergleiche

OMIT( ) kann die Effektivität der LEVDIST( )-Funktion, der ISFUZZYDUP( )-Funktion oder der FUZZYDUP- bzw. FUZZYJOIN-Befehle verbessern, indem generische Elemente wie „Corporation“ oder „Inc.“ entfernt werden. aus den Feldwerten entfernt werden. Durch das Entfernen generischer Elemente richtet sich der Zeichenfolgenvergleich mit diesen Funktionen und Befehlen nur auf den Teil der Zeichenfolge aus, in dem aussagekräftige Unterschiede auftreten.

Wie die Anordnung von Teilzeichenfolgen die Ergebnisse beeinflusst

Wenn Sie mehrere Teilzeichenfolgen zum Entfernen angeben, kann die Reihenfolge, in der Sie diese in Zeichenfolge2 auflisten, die Ausgabeergebnisse beeinflussen.

Beim Verarbeiten der OMIT( )-Funktion wird die erste Teilzeichenfolge aus allen Werten entfernt, die sie enthalten, anschließend wird die zweite Teilzeichenfolge aus allen Werten entfernt, die sie enthalten usw. Wenn eine Teilzeichenfolge Teil einer anderen Teilzeichenfolge ist – z.B. "Corp" und "Corporation" –, werden durch das Entfernen der kürzeren Teilzeichenfolge auch Werte geändert, welche die längere Teilzeichenfolge enthalten ("Corporation" wird zu "oration"), wodurch die längere Teilzeichenfolge nicht gefunden wird.

Geben Sie daher längere Teilzeichenfolgen vor darin enthaltenen, kürzeren Teilzeichenfolgen an, um diese Situation zu vermeiden. Beispiel:

OMIT(Lieferant;" Corporation, Corp, Corp")

Versuchen Sie, Sonderzeichen zuerst zu entfernen

Sie können Teilzeichenfolgen mit nur einem Zeichen angeben, wie z.B. Interpunktionszeichen, Sonderzeichen und ein Leerzeichen, sodass der generische Teil in Zeichenfolgen weiter reduziert wird. Es kann effizienter sein, erst ein einzelnes Zeichen zu entfernen, wie z.B. einen Punkt oder ein Leerzeichen, sodass die Anzahl von Teilzeichenfolgevariationen, die nachfolgend angegeben werden müssen, reduziert wird. Vergleichen Sie das dritte und das vierte obige Beispiel. Beide geben die gleichen Ergebnisse zurück, das vierte Beispiel ist jedoch effizienter.

Umgang mit leeren Werten oder Leerzeichen

Leerzeichen oder -stellen werden in Teilzeichenfolgen genauso behandelt wie jedes andere Zeichen. Jedes Leerzeichen, das Sie als Teil einer Teilzeichenfolge entfernen möchten, muss explizit angegeben werden. Zum Beispiel wird aus „Ricoh Sales & Service“, wenn Sie das &-Zeichen ohne Leerstellen angeben, der Wert „Ricoh Sales Service“. Wenn Sie die Leerstellen einbeziehen („ & “) wird aus „Ricoh Sales & Service“ der Wert „Ricoh SalesService“.

Wenn Sie ein Leerzeichen angeben, das nicht Teil einer Teilzeichenfolge ist, kann die Teilzeichenfolge nicht gefunden werden. Wenn Sie das &-Zeichen mit Leerzeichen festlegen („ & “), bleibt „Ricoh Sales&Service“ beispielsweise unverändert.

Bei der Verwendung von Kommata zur Trennung mehrerer Teilzeichenfolgen, fügen Sie nach dem Komma nur ein Leerzeichen ein, wenn dies ebenfalls in der entsprechenden Teilzeichenfolge enthalten ist, die Sie entfernen möchten.

Bei einer Vorgehensweise zur Bearbeitung von Leerzeichen werden zunächst alle Leerzeichen aus einem Feld entfernt, indem ein Leerzeichen als Einzelzeichen-Teilzeichenfolge spezifiziert wird, bevor andere Teilzeichenfolgen angegeben werden.

Ergebnisse der Verwendung von OMIT( ) überprüfen

Prüfen Sie, nachdem Sie mit OMIT( ) ein Kalkulationsfeld erstellt haben, den Inhalt des Felds, um sicherzustellen, dass Sie nicht versehentlich aussagekräftige Teile von Zeichenfolgen ausgelassen haben. Beispielsweise wird durch Auslassen von „Co“ eine geläufige Abkürzung für „Company“ entfernt, gleichzeitig werden jedoch auch die Buchstaben „Co“ an zwei Stellen in „Coca-Cola“ entfernt.