Excel prob-brauch Hilfe

Hi ihr,

eigentlich dacht ich immer das ich mich mit Excel auskenne, aber egal.

Habe einen doofen Fall:

Habe eine riesiege Tabelle von über 60000 Adressdaten. Das dumme ist das hier nun einige doppelte Dabei sind.

Es ist eine unmenschliche Arbeit diese doppelten Adresszeilen zu suchen. Kennt jemand von euch einen weg wie man das automatisch machen könnte??

Würde mich sehr über Hilfe freuen.

Danke im Vorraus.

Nonpetrium
 
Ja, mit VBA
Genau für solche Zwecke gibt es das.....

Mal schaun, vielleicht hab ich heute Zeit und schreib sowas, weiss aber nicht ob ich dazu komm

Mfg MrGoatee
 
Hi,

habe auch nochmal die ganze zeit gegoogelt, aber habe leider mit Makros noch nie gearbeitet, geschweige denn selbst gescriptet.... .

Ja wäre cool wenn du es mir zeigen könntest, wäre dir sehr verbunden... .

THX, im vorraus... Nonpetrium
 
LÖsung

Hi,
hatte vor kurzer zeit das gleiche problem (mit einer wesentlich kleineren Menge an daten... 60'000 lol...). Ist zwar eine etwas "dumme" Methode aber es hat problemlos funktioniert(Man könnte es auch Zweckentfremdung nennen...). Ich bin wie folgt vorgegangen:

1. Datei Öffnen
2. Klicke in die Spaltenüberschrift wo die doppelten Werte vorkommen.
3. Menüleiste => Daten => Filter => Spezialfilter
4. Im nächsten Fenster einen Hacken bei "Keine Duplikate" setzen
5. Mit OK bestätigen.
Nun sind alle duplikate "ausgeblendet, d.h. sie sind noch da aber du siehts sie nicht. Falls du das nicht möchtest drücke jetzt [strg]+[A] (Alles Markieren) und dann [Strg]+[C] (kopieren). Neue Excel-Liste öffnen/erstellen und mit [Strg]+[V] alles wieder einfügen.
Er hat jetzt nur die sichtbaren daten kopiert und die "unsichtbaren" die du durch den filter versteckt hast nicht. Naja, it's not a bug, it's a feature...
Hoffe ich konnte helfen
MFG
Co1m-Co1tus
 
möchtest du die doppelten daten loeschen oder was? schau dir auf jedenfall mal den offset-befehl von vba an. Willst du immer die ganze Zeile löschen? gibt es jeweils eine bestimmte zelle woran man erkennt ob der datensatz doppelt ist oder muss immer die ganze zeile ausgelesen werden?
 
Gruß,

hey, freue mich das es scheinbar doch auf die leichtere Art geht. Wäre ja super toll.
habe das hier vor ca 10 Min gelesen und gleich ausprobiert.

Habe meine gesamten Adressen in den Listenbereich eingefügt und die entscheidenten doppelten Daten, also Straße, Ort, PLZ, Hnr., an was man es halt erkennt, in den Kriterienbereich eingefügt, das Ja/Nein Feld mit den keine Duplikate angeklickst und auf "ok" gegdrückt.

Warte nun voller Hoffnung und mit großen Erwartungen darauf das mein Mauszeiger Sanduhr Symbol verschwindet und er mir alle Duplikate filtert. Wäre ja eine coole Sache.

Dauert nur halt schon 8 Min, hab inzwischen die Prozessleistung minimiert damit ich daweil was anderes machen kann, zb hier posten.

Wofür ist eigentlich dieser Speziel, oder auch der Autofilter da. Klar man kann einen Bereich auswählen und dann auf ok klicksen, gegebenfalls auch vorher dieses entscheidente Duplikate Feld aktivieren, aber sonst?

Was macht er sonst?

Nagut, ich sag euch dann beschied wenn er mal fertig sein sollte mit laden. Ich betone das ich an diesem LapTop 2,4 GHz habe und der Kühler nun auch wieder angesprungen ist *haha*.

Nagut, hoff das die Datenmenge nicht zu groß ist.

Bis später...

Nonpetrium

---------

edit: @ JayS:

Ja möchte die doppelten Zeilen löschen.

Leider sind die Zeilen nicht vollständig gleich, aber 3 Spalten! Der Rest der insgesamt 25 Spalten ist und kann unterschiedlich sein. Sind meist nur Tippfehler oder EMail Adressen die ja immer sehr variabel sind... .

--------

Also er ist nun tatsächlich fertig mit Laden und präsentiert mir nun sein Ergebnis, komischer Weise finde ich immenroch doppelte Daten in den 3 Spalten Kriterienbereich die ich angegeben habe... .

Was hab ich falsch gemacht? (Siehe oben meine Vorgehensweise)

Das dumme ist, es dürfen nicht einfach die doppelten Zeilen in den 3 Spalten gelöscht werden, sondern auch die Zellen die in der Zeile sind und über diese 3 Spalten hinaus gehen. Ähnlich wie als würde man eine Spalte nach den höheren Wert sortieren wollen.

Es darf sich nichts verschieben oder so, außer die dadurch entstandenen freien Bereiche, die dürfen natürlich wieder ausgefüllt werden.

Hmm, werde noch ca 30 Min rumexperimentieren, danach muss ich erstmal weg von Arbeit... .

Habe im übrigen vorher auch schon angefangen so per Augenmaas Duplikate zu finden, glaube aber das ich dafür Wochen brauche :|

Freundliche Grüße Nonpetrium


------
edit:

Hi nochmal,

also habe nun rausgefunden, dass wenn man im Listenbereich die gesamte Tabelle markiert, er nun jede Duplikatzeile einfach so löscht. Das ist ja schonmal annähernd das was ich wollte. Dummerweise scheint das mit den Kriterienberiech nicht zu funzen.
Wähle ich nämlich diese 3 entscheidenten Spalten als Kriterienbereichaus, löscht er keinen einzige Zeile, deswegen fand ich auch vorhin noch immer eine doppelte vor.

Nur warum funzt das nicht??
Wozu ist denn der Kriterienbereich sonst da??

Ich mach hier mal ne kleine Tabelle damit ihr euch das veranschaulichen könnt:

Name: Nachname: Straße: Wohnort: Email: Tel: Interessen:

Hans Wurst Hansstraße Hansort hans@wurst.de Wurst essen
Fred Knüppf Talgut Buchtel - muffeln
Wuschl Mania Volksweg Düsseldorf Rüdiger@hsi.fr keine
Hans Wurst Hansstraße Hansort Hansi3@wurst.de weiß nich, wurst essen zb
Fred Baumwolle Suffhausenstr. Citygu M_w@osdif.de keine

So, hier seht ihr also das Straße und Ort der entscheidente Kriterienberiech ist, der Rest der Listenbereich. Würde ich keinen Kriterienberiech bestimmen, würde er keinen löschen, da er keinen erkennt.

Tu ich jedoch einen Kriterienbereich, die 2 spalten bestimmen, findet er außerdem nichts.

Tu ich eine Zeile völlig kopieren und unten einfügen, würde er diese löschen, wenn ich nun nochmal keine Kriterienbereiche auswähle, sondern nur den Listenbreich... .

Versteht ihr nun die Sache etwas genauer?

So, ich mach nun erstmal heim.
Werd Heime nochmal tüfteln, dann morgen weiter machen.

Danke im Vorraus für eure Antworten....
 
Ich bin grad an keinem Excel-fähigen Arbeitsplatz aber ich schreibe dir noch heute abend die antwort auf dein Problem. Wusste nicht das die daten die sich nicht wiederholen dürfen über 3 spalten verteilen...
Im Notfall bin ich gerne bereit, wenn du das File rar'st, mir es mal anzuschauen und für dich zu machen.
Bis gleich.
Co1m-Co1tus
------------------
habe es eben gelesen und mir ist die Lösung sofort ins Auge gesprungen als ich es bildlich sah...
Also das Problem liegt daran das es für Excel verschiedene werte sind und deswegen nicht weggeleasen werden. Siehe einfache tabelle

Name | Alter | E-Mail
Ich 15 ich@15.de
Ich 15 ichnicht@15.de

Du möchtest jetzt das einer der beiden datensätze "wegkommt". Und wie du schon selber gesagt hast: du hast alle 3 Spalten ausgewählt...
Excel denkt sich jetzt : Spalte "Name" ist gleich, Splate "Alter" ist gleich aber Spalte "E-Mail" unterscheidet sich. Also ist der ganze Datensatz (die ganze zeile) ungleich der oberen. Wenn du über 3 Spalten gehen willst dann musst du das einzeln machen. Erst alle Dopellten aus Spalte Nr1 löschen dann aus splate Nr. 2 usw.
Wenn ich z.B. jetzt in den Kriterien nur Alter und Name drinne hätte würde tatsachlich eine der beiden verschwinden.
Nochmal zum verständnis. Dieser "Spezialfilter" verbirgt die anderen daten nur, die werden NICHT gelöscht. Das erkennt man auch an der Excel Datensatznummerierung an der linken seite. die ist dann nicht mehr druchgängig, da fehlen ein paar zahlenzwischendrinne, die, die excel halt verbirgt. Deswegen musst du nach dem "Verstecke die doppelten Datensätze"-Spiel die Restdaten nur in ein Neues Excelblatt (leer) reinkopieren.
Das mit der Ausgrenzung war ein logikfehler von dir. Stell dir vot du sagst: "verstecke" alle Zeilen wo Spalte 1 UND Spalte 2 UND Spalte 3 EXAKT gleich sind. Bei deinen dopelten datensätzen hast aber du selber ja gesagt das sie sich nur leicht in der schreibweise unterscheiden. Deshalb musst du die ausgrenzen.
Hoffe ich konnte helfen
MFG
Daniel alias Co1m-Co1tus

PS: Sorry für rechtschreibfehler, bin seit 13 stunden auf der arbeit und es ist echt noch kein ende in sicht... (IT-Infrastruktur einer Firma einrichten...)

***************************************
Mir ist eben nochwas eingefallen, aber das wird dich nicht begeistern bei 60'000 Datensätzen....
Ich glaube der Spezialfilter vergleicht nicht die Komplette Tabelle sondern nur zeilenweise damit meine ich er vergleicht Zeile 1 mit 2, 2 mit 3, 3 mit 4... und das würde bedeuten das du erst die datensätze sortieren musst. Bin mir aber nicht sicher, und da ich hier immer npoch dem arbeitsplatz ohne excel sitze kann ich es nicht schnell testen, sobald ich mehr weis sage ich bescheid. Das würde auch erklären warum die auswahlökriterien bei dir nichts gebracht haben (falls ich vorhin deine logik falsch verstanden habe)
Aber falls es so ist wäre die verfahrensweise so:
1. Sortieren nach den schlüsselkrieteriern die doppelt vorkommen (Ich glaube es war Ort+Strasse+Name wenn mich nicht alles täuscht...)
2. Filter setzen
3. kopieren in neues leeres Excelfile
4. TV schauen gehen weil das relativ lange dauern wird alle datensätze zu kopieren ;-)
MFG
Daniel alias Co1m-Co1tus
PS: Eine weitere Fehlerquelle sind "Leerzeichen" nach einem Text. Excel sieht das, du nicht... und du denkst dir, das ist exakt gleich aber wenn du mit der Maus reinklickst siehst du das leerzeichen am um ein Feld "verrückten" Cursor.
 
Hallo,

GEIL!

Habe vorhin mir alles nochmal hier durchgelesen und anschließend die 3 Spalten nochmal nach den einfachen Listenkriterium gefiltert. Hat wieder 10 Min gebraucht.

Der Ansatz mit den blauen Zahlen am Rand war gut. Ja er blendet die doppelten Zeilen nur aus, sprich die Zeilenfolge ist 15002; 15004;... Cool cool.

Jedenfalls hab ich alles markiert und sah gleich beim kopieren einige ungereimtheiten. So hat er seltsamer Weiße bestimmte Zeilen bei STRG A einfach ausgelassen.

Beim einfügen in ein neues Datenblatt sah ich dann nach eingen Warten das von mir gewünschte Ergebnis!

Geil!

Hat fette gefunzt:

Vorher: 60344
Nacher: 59349

Krass krass, cool, kann ich nun eindlich meinen Chef vorliefern, der hat das als Wochenaufgabe für mich gedacht ;).

Danke euch jedenfalls, hat super gefunzt, dank euch ist mir ne Harte weitere Woche erspart geblieben.

Besten Dank
 
Zurück
Oben