Gibt eine Zeichenfolge an, bei der eine oder mehrere angegebene Teilzeichenfolgen entfernt werden.
Syntax
OMIT(Zeichenfolge1; Zeichenfolge2 <;Groß-/Kleinschreibung beachten>)
Parameter
Name | Typ | Beschreibung |
---|---|---|
Zeichenfolge1 | Zeichen | Das Feld, der Ausdruck oder tatsächliche Wert, aus dem ein oder mehrere Teilzeichenfolgen entfernt werden sollen. |
Zeichenfolge2 | Zeichen |
Ein oder mehr zu entfernende Teilzeichenfolgen.
|
Groß-/Kleinschreibung beachten
Optional |
logisch |
Geben Sie T an, um für Teilzeichenfolgen zwischen Groß-/Kleinschreibung zu unterscheiden, oder F, um Groß-/Kleinschreibung zu ignorieren. Wenn Groß-/Kleinschreibung beachten ausgelassen wird, wird der Standardwert „T“ verwendet. |
Ausgabe
Zeichen.
Beispiele
Einfache Beispiele
Literale Zeicheneingabe
Gibt „Intercity Couriers“ zurück:
OMIT("Intercity Couriers Corporation"; " Corporation, Corp.")
Gibt „Inter-city Couriers“ zurück:
OMIT("Inter-city Couriers Corp."; " Corporation, Corp.")
Hinweis
Die Levenshtein-Distanz zwischen den zurückgegebenen Werten in den ersten beiden Beispielen beträgt „1“. Wenn die generischen Elemente nicht entfernt werden, beträgt die Distanz zwischen den beiden Beispielen 8, sodass die Werte möglicherweise nicht als Fuzzy-Duplikate erkannt werden.
Feldeingabe
Gibt alle Werte des Felds Lieferantenname zurück, wobei generische Elemente wie „Corporation“ und „Corp“ entfernt wurden:
OMIT(Lieferant;" Corporation, Corp., Corp, Inc., Inc, Ltd., Ltd")
Gibt alle Werte des Felds Lieferantenname zurück, wobei generische Elemente wie „Corporation“ und „Corp“ entfernt wurden:
OMIT(Lieferant;" ,.,Corporation,Corp,Inc,Ltd")
Hinweis
Die beiden vorherigen Beispiele geben die gleichen Ergebnisse zurück, die Syntax des zweiten Beispiels ist jedoch effizienter.
Gibt alle Werte des Felds Lieferantenname zurück, wobei „Corporation“ und „Corp“ sowie sämtliche Kommata entfernt wurden:
OMIT(Lieferant;" Corporation, Corp,")
Bemerkungen
OMIT( ) kann Teilzeichenfolgen als Einheiten entfernen
Die OMIT( )-Funktion entfernt eine oder mehrere Teilzeichenfolgen aus einer Zeichenfolge. Sie unterscheidet sich von Funktionen wie CLEAN( ), EXCLUDE( ), INCLUDE( ) und REMOVE( ), da sie Zeichen auf Basis von Teilzeichenfolgen anstatt auf zeichenweiser Basis abgleicht und entfernt. Dadurch können Sie bestimmte Wörter, Abkürzungen oder wiederholte Zeichensequenzen aus einer Zeichenfolge entfernen, ohne den Rest der Zeichenfolge zu beeinträchtigen.
Eine Hilfsfunktion für Fuzzy-Vergleiche
OMIT( ) kann die Effektivität der LEVDIST( )-Funktion, der ISFUZZYDUP( )-Funktion oder der FUZZYDUP- bzw. FUZZYJOIN-Befehle verbessern, indem generische Elemente wie „Corporation“ oder „Inc.“ entfernt werden. aus den Feldwerten entfernt werden. Durch das Entfernen generischer Elemente richtet sich der Zeichenfolgenvergleich mit diesen Funktionen und Befehlen nur auf den Teil der Zeichenfolge aus, in dem aussagekräftige Unterschiede auftreten.
Wie die Anordnung von Teilzeichenfolgen die Ergebnisse beeinflusst
Wenn Sie mehrere Teilzeichenfolgen zum Entfernen angeben, kann die Reihenfolge, in der Sie diese in Zeichenfolge2 auflisten, die Ausgabeergebnisse beeinflussen.
Beim Verarbeiten der OMIT( )-Funktion wird die erste Teilzeichenfolge aus allen Werten entfernt, die sie enthalten, anschließend wird die zweite Teilzeichenfolge aus allen Werten entfernt, die sie enthalten usw. Wenn eine Teilzeichenfolge Teil einer anderen Teilzeichenfolge ist – z.B. "Corp" und "Corporation" –, werden durch das Entfernen der kürzeren Teilzeichenfolge auch Werte geändert, welche die längere Teilzeichenfolge enthalten ("Corporation" wird zu "oration"), wodurch die längere Teilzeichenfolge nicht gefunden wird.
Geben Sie daher längere Teilzeichenfolgen vor darin enthaltenen, kürzeren Teilzeichenfolgen an, um diese Situation zu vermeiden. Beispiel:
OMIT(Lieferant;" Corporation, Corp, Corp")
Versuchen Sie, Sonderzeichen zuerst zu entfernen
Sie können Teilzeichenfolgen mit nur einem Zeichen angeben, wie z.B. Interpunktionszeichen, Sonderzeichen und ein Leerzeichen, sodass der generische Teil in Zeichenfolgen weiter reduziert wird. Es kann effizienter sein, erst ein einzelnes Zeichen zu entfernen, wie z.B. einen Punkt oder ein Leerzeichen, sodass die Anzahl von Teilzeichenfolgevariationen, die nachfolgend angegeben werden müssen, reduziert wird. Vergleichen Sie das dritte und das vierte obige Beispiel. Beide geben die gleichen Ergebnisse zurück, das vierte Beispiel ist jedoch effizienter.
Umgang mit leeren Werten oder Leerzeichen
Leerzeichen oder -stellen werden in Teilzeichenfolgen genauso behandelt wie jedes andere Zeichen. Jedes Leerzeichen, das Sie als Teil einer Teilzeichenfolge entfernen möchten, muss explizit angegeben werden. Zum Beispiel wird aus „Ricoh Sales & Service“, wenn Sie das &-Zeichen ohne Leerstellen angeben, der Wert „Ricoh Sales Service“. Wenn Sie die Leerstellen einbeziehen („ & “) wird aus „Ricoh Sales & Service“ der Wert „Ricoh SalesService“.
Wenn Sie ein Leerzeichen angeben, das nicht Teil einer Teilzeichenfolge ist, kann die Teilzeichenfolge nicht gefunden werden. Wenn Sie das &-Zeichen mit Leerzeichen festlegen („ & “), bleibt „Ricoh Sales&Service“ beispielsweise unverändert.
Bei der Verwendung von Kommata zur Trennung mehrerer Teilzeichenfolgen, fügen Sie nach dem Komma nur ein Leerzeichen ein, wenn dies ebenfalls in der entsprechenden Teilzeichenfolge enthalten ist, die Sie entfernen möchten.
Bei einer Vorgehensweise zur Bearbeitung von Leerzeichen werden zunächst alle Leerzeichen aus einem Feld entfernt, indem ein Leerzeichen als Einzelzeichen-Teilzeichenfolge spezifiziert wird, bevor andere Teilzeichenfolgen angegeben werden.
Ergebnisse der Verwendung von OMIT( ) überprüfen
Prüfen Sie, nachdem Sie mit OMIT( ) ein Kalkulationsfeld erstellt haben, den Inhalt des Felds, um sicherzustellen, dass Sie nicht versehentlich aussagekräftige Teile von Zeichenfolgen ausgelassen haben. Beispielsweise wird durch Auslassen von „Co“ eine geläufige Abkürzung für „Company“ entfernt, gleichzeitig werden jedoch auch die Buchstaben „Co“ an zwei Stellen in „Coca-Cola“ entfernt.