Path: csiph.com!fu-berlin.de!uni-berlin.de!individual.net!not-for-mail From: Reinhard Zwirner Newsgroups: de.comp.software.misc Subject: Re: Suche Aussortier-Programm Date: Sun, 2 May 2021 15:38:33 +0200 Lines: 79 Message-ID: References: Mime-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit X-Trace: individual.net gcHKI6x+W+jofk+WUKip2AHG5CX9X7VMbaV5y4TM7j0q8= Cancel-Lock: sha1:/+DES6WsKDQShRaOtIJ9l5vfyls= User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:60.0) Gecko/20100101 Firefox/60.0 SeaMonkey/2.53.7.1 In-Reply-To: Xref: csiph.com de.comp.software.misc:195 Wendelin Uez schrieb: > Die Daten liegen im sog. XML-Format vor, wobei nicht sicher ist, ob > zwischen den Datensätzen ein Trennzeichen existiert. Das ist das > eigentliche Problem. > > Ziel ist es, eine Datei zu erhalten, in der pro Zeile genau ein > Datensatz steht. Ein Datensatz beginnt mit " "". > > Kann man eine solche Datei in ein Tabellenkalkulationsprogramm > einlesen, auch wenn nur die gesamte Zeile in der ersten Spalte steht, > dann können die heutigen Tabellenprogramme doppelte Zeilen mit > eingebauten Mitteln entfernen und es bleiben nur die ersten Zeilen > übrig. > > > > Ich würde so vorgehen: > > - Datei mit Dateiendung .xml versehen > > - diese versuchen OHNE Trennzeichen zu spezifizieren einzulesen (also > nicht Tab, Komma, Semikolon etc. angeben, nur reinen Text) > > - bingo, wenn alles zeilenweise angezeigt wird, dann Doubletten > löschen und fertig > > > > - falls nicht, erstmal mit allen anderen verfügbaren Text- und > Kalkulationsprogrammen versuchen mit dem Ziel, eine zeilenweise > Anzeigei zu erzeugen > > > - falls auch das alles nicht geht, das geht garantiert: > unter heise.de/software den Notepad++ downloaden (opensource,free), > damit Datei einlesen und "" ersetzen durch "/nl" - das > /nl steht für new line und fügt einen Zeilenvorschub ein. > > Außerdem kann Notepad++ auch doppelte Zeilen entfernen. > > That's it. Hi, mittlerweile hat GPSBabel dafür gesorgt, daß die Datei nicht mehr ein "Endlos-String" ist, sondern die einzelnen Trackpunkte jeweils vierzeilig untereinander stehen (sorry für den Irrtum in meinem OP!): mmm.mmm Derzeit bin ich auch tatsächlich mit Notepad++ zugange, kenne aber leider nicht so die Feinheiten. Da hat die Datei jetzt übrinx knapp 23,4 Mi. Zeilen! Am liebsten würde ich, nachdem ich im jeweils 1. "neuzeitlichen" Trackpunkt die Sekundenangabe geändert habe, im Menü Suchen -> Suchen, Reiter "Ersetzen", _sowas_wie_ <.*mm:ssZ> ^^^^^ (Zeitpunkt, für den die jeweils überflüssigen Trackpunkte gelöscht werden sollen) eingeben und durch <"leeres Feld"> ersetzen lassen. Aber zum einen weiß ich nicht, was ich da genau eingeben müßte, zum anderen hätte ich dann riesige Lücken zwischen den einzelnen Trackpunkten, die dann auch noch zu löschen wären. Seufzend Reinhard (kein Programmierer, nur Anwender, aber das auch nur, solange es nicht zu kompliziert wird ...)