Path: csiph.com!fu-berlin.de!uni-berlin.de!not-for-mail From: Stefan Schwarzer Newsgroups: de.comp.lang.python Subject: Re: [Python-de] Gruppen in sich wiederholenden Sub-Patterns Date: Fri, 16 Nov 2018 09:10:16 +0100 Lines: 39 Message-ID: References: <3baad237-6d51-8748-bf15-c9cd66ca5aff@sschwarzer.net> <20581260.EYh6DxOs2F@palindrom> Mime-Version: 1.0 Content-Type: text/plain; charset=utf-8 Content-Transfer-Encoding: 8bit X-Trace: news.uni-berlin.de qhBpVdUmFMFC68rAnjW1iQUyl7EwVZ7W9sxLsLjADoPw== Return-Path: X-Original-To: python-de@python.org Delivered-To: python-de@mail.python.org Openpgp: preference=signencrypt Autocrypt: addr=sschwarzer@sschwarzer.net; prefer-encrypt=mutual; keydata= xsFNBFW78IwBEADMkDDhNj/nvNT5J/uqPYGte7bB4N3w5F9uwvHR1Mnm7DTMtzNaheVv6wWF ZdHNkq+PWqYaJZQ0m12Nso31YKHdSm+Bw1ppYQGg5Jv5sJKzTE47FvzVylh63dHjOTXhLDHX HNLOssVvr8xl6LJOoC2pvtD+fdGUvGEeyso+WbgmgjlSh/2AhO8hg9FUcxCHzcCvIrC/c+ot 8Fnf/MXpI+4sytBQscEAGo8YSLqXqs8dOOd1NONghSlfyWWz32quXX1qyN4ptjVpMQxRgabm 4HDaUQqL/WbNde815n4I2jGvLZVV3+MVeZ+3pI1FduH7+HQOARO98b98AZ+kUXP7bn4TOgNT zRMdOO8lF26T2Og5ELZWm4yan4gNUdIFbE7a7UBv+Pf99zQEYcGFbpG6i1an4R+KWUFAQmwT gEvxGW4tTFLkYnJTuvptW4sCaO5JSDfKTrYBHVlIxUP6yY/EaRsjTalESy3YYFg36sKp4URu 6mrxdNs+dRxpkTTfDdnmQkz2DRks7qBwfXJZncD2U70+5q4cp2P9hLEGvCskpaMBy2D1zTdh +TZW0tHQAvCvQKYNlXKdtqsTHMWhGKTheTKfNOAR6NlJxhlHmWFT2KXE54E0dKZSWbZzAP4b pVeHQpB7b/5Qvrylq70KdPwh7q0IS3xGRPutekW9Dznm1VKOhQARAQABzSxTdGVmYW4gU2No d2FyemVyIDxzc2Nod2FyemVyQHNzY2h3YXJ6ZXIubmV0PsLBewQTAQIAJQIbAwYLCQgHAwIG FQgCCQoLBBYCAwECHgECF4AFAlW9ApICGQEACgkQrRxpUjCGWJ7rLA/8DFFU8aJTtbMDXm8o OTIc+1uuAeYhw/5VWcT4NxoztIN5UHY/07F/AXsCLkqydX4+/5VxmTl4U/e0U1pz8LTiZAaK zP9YPrqRfrB8v6ARh26yNPyABcUH+DDMNLNj4228xK0bwPfmWnPx0B39kGD6DVn9DfPz8sIg hkCKCRqNZhTbfUy307NWmZK0MZRMEe/H1oKGQsXUwWu5aSJcCezQsly7vfpVwne3RbDYrJRb xmDI9LfJ1wvg+vIfYeYEVR6/hKFrEqxhVdGDgAtqzSvZxy/ySfmnjFf4aMti2hktDvRN5D+3 z5mhl4oIFXJk1KgbUk84umumGXqks3PTOiDnWh4t8A9QC9hFpU3dcM0AGbYywE55Xtvquzoh Sy90nTaC94RCs8vlPyU4oYDrKRvqnv6zfREpsk9eccrsfWEqGXyj02dFSW48mdpFT+yXrKFp pAW2dv6C0TpTBRGr/WmGdbxvduJbuEak9bJGtb1sNOaRD7kmDdv+qJqisbmAAOv+pTnvmjuh aRdzzl0G/uv8ixbL8HX7cX143v9D9U4HIBRr/7sECMf1x9FBfqm7rInP5MYWk5a9QaMeL1an xMn80zkTP2V8QIleVfQT3kZ71IEVF7ouPGwepm6oPbKhW0NOU1mQcwHYClDKhoyc4sfCP9tl 3T/y+2Gsoo+05DWrBDLOwU0EVbvwjAEQAJsFeIY0q0IJuyJNIjsfitKVU12sMDn2hV043SRz 2S7ApNclcY8Y2xEh+q+GXFzMDLAgOijmWN93eOryzcswhgXKiMoVbQeRoSFa0WQv2ozR8Jzs X6KBETSF7PnMC8ymxP2JEbIbUZyyhcwXvtd2EZLSTHlQoQzmm6+MEQ09cpRJpkf/KYsc4S+J 2JXq7GgHYNDyBYCIR4QOPZVA3oPt6DBPVMwc7rRjnfhBlVvDwCsUlmrqJwY0ysTF7V2Ud079 JlsbNzIp49WAwCSvivgl3HdpqW1gv/UnK1PtG3Crsb1yvLIBCPGcb1SIifc5HUFGWgD1r0Y3 Q9e15scLMqHazFBUkvnsS4U2qrPqJJPwbxpGj16/d62rIwiHMHtGxHazaPlbb9hLRFj96Vx4 +v8/02mj+pbkXbKf8Kc4+i4MBKjZ4tYi8UFT2uC9GNYMH7Ajf3w17HRvIbBX7K/0QnI9GF/P o/NRKv66YpZGXwRqMwcC8sAfEHmNa9x3PTH6IvveBo6w/MyJ0KQhawRMSTSeKsKHSvnzqp7l 9u1cpKpi5FzFgumJKCxbR3fJgKV11Ia+PvXRoOkvt/7bROgc+E86HUdxVhOIk4qvt+ztbI4B jyho/u+C7OP/xWAdztyZNbA4sIdbwJ8LghT0CvB40n+dzPzwBu43SFaEcvabidO9PO9XABEB AAHCwV8EGAECAAkFAlW78IwCGwwACgkQrRxpUjCGWJ6Niw/8DQIQ7wxb9C0AdCAasxTOwRVG 0d/99vs1HhyR2s8OmGZjHqtXHCl08tkf5fcncIl/628ZjiugtZAvft4KkxGWNzmF97LgHZ+0 v005/t+6YnaRODS4IRM/mB6SDEiNW3Yraxwf2hcXwF9Hjy8zNgWve2UYzlJsrQqDYyO/ktxB ucu1bCfmuClY1VqipL0hQQVPjjC7BKhti3gdOKNNdsx3FAba6hqOgU5zbHAkLhFGY83ppn/t tBT5OULZ3JUmceELWGnNhO+REfokDmvQIWFQ1eo4eZjL27rPn/EXJFtf0o7woyfGj0/0htzr UNrEqoumSep/RmSSG29vyNQqS5kKmNCeBmSZXR39nkVVk+gOFsic78HoAZDMGblv3aIMbc85 DR+Q8bpdhmcvV049/CirqHkKaOYcblPvKhuZf7fmUbZSDjryvEaVSZmZO/TrNQXnbzNBHc10 PcZBnHb76fvGjXCnThgoXHXS38+SUGisGrpIRRZuFl9icE9J8L/FMvodycrkthbEKds777p0 dkgvDeD8Wvr+5orkt6fEC4gczOD0oK46KYqOSWGCim3FyAm0EDIMHtra+wLlyzv5MGHbnjzl BjkNbYpaPBfkwACkk5hclu9jAOx4aBHeXpHyRDbsoJJ5yoTx3qZKT14kPO8aytDwukobeW03 WdtUokwYRxk= User-Agent: Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.8.1.24) Gecko/20100411 Thunderbird/2.0.0.24 Mnenhy/0.7.6.666 In-Reply-To: <20581260.EYh6DxOs2F@palindrom> Content-Language: de-DE X-Provags-ID: V03:K1:sF4JfhpeFEkR2ARhMi5lEKzWft3bnJw20VEHFJ0CKY7VDo5PiX9 tKX3eWJ4qd0vvm289rKSDKKE1ewu72//PrKQKx92qOos6CLv7Fu5aNEItjCUn1vYIY/2krR 77BW0Tpbjyw9Z09DE+CmSh0jiRzVO+ZqxouD30U6yeFmeIDrGGGCmsBoMh7btWB2NFSnwAz Qj9Q/IIFektGHDGxHXHkw== X-Spam-Flag: NO X-UI-Out-Filterresults: notjunk:1;V01:K0:T8cggx2x6Bw=:ug+geqOdZTdvNmJPgYvdQP jlrXa2LBXi2ADLAb8esTn/q4YzUSvHhwyeD74I0UJcdcPcYFFUzgCVtTL4b36HaIWxirr1fwP t/5fDigU/FGpRzkXvorlQgylsN5NjfugQu06iu31NGdLIn2aeRuOFqm1TQ7TBpX4+2sa4Vk3e gar6ThrLf7Dqgub831QLRnhDONS40PxBZBOc7SbKMrM7JLAt5Fn5KzQ347MiY+eLHDqZgjyq0 idJRr2HEIw+LteCUmutedTspP1sT2yvqz6rUD+f+49XTMY5+zLJD3lXvc1B/t5MWFZb6+5qLW vB/D6FHjdc/pnx9r0yurSasEKNH1nBvSgm8e25as0cpTYn2hhV2Unp0ApOuNDycTuhkM4HczR oSq3PNfoW/a2jQvamY45SazE2Sj171ASSNRMrnRoxJaGWgfdMvrYSVjhEAq026GmHpvNsAagm D8XuI1ALDZviauxbY3qswiJ+6iX+oql43jBVk2TZER0ELmQma2w1Cp8wkO2K2EzfLSSiwDPOu iqj7UNUC64SwYZOGXXKPcgBClbjYH0MdGOreM8J2aQvVaqgY2zzTfZagtnUwZajDcQStICLiy HaIFlyelP4bwtQ0ITCpO6MMSNe1wt6+9EtmVyUohS5dnXx1IBBnzL3k3vy1L5Vi7kyoJLdwDC VwKWpsf0HR1R1N7dOJyGpE0pRPfuAcdEzTXLPqi7sevWpkcmGGPD0/41X1xE7EREqvMDu3mWH R7/RFP1Sr5MEF3Eq1UfHpgIijy1LcVLSrzWd6M1NSa5Z73vFdVFEOV3B4JTqSJ9NObslwC15r kW9ZRa0COce6thwGbU9Ljg7O7XcKI/lMVxb/bNhLEtu5kA6DEg= X-BeenThere: python-de@python.org X-Mailman-Version: 2.1.29 Precedence: list List-Id: Die Deutsche Python Mailingliste List-Unsubscribe: , List-Archive: List-Post: List-Help: List-Subscribe: , X-Mailman-Original-Message-ID: X-Mailman-Original-References: <3baad237-6d51-8748-bf15-c9cd66ca5aff@sschwarzer.net> <20581260.EYh6DxOs2F@palindrom> Xref: csiph.com de.comp.lang.python:5333 On 16/11/2018 00.22, Peter Otten wrote: >> Kann man erklären, warum sich der Match anders als erwartet >> verhält (ohne nur das zu wiederholen, was ich schon gesagt >> habe ;-) )? > > Nein, aber wenn ich es als Zitat der Dokumentation verpacke > > """ > If a group is contained in a part of the pattern that matched multiple times, > the last match is returned. > """ > > strahlt es doch hoffenlich die nötige Autorität aus ;) Ok, tut es. ;-) Das hatte ich dann wohl übersehen. >> Falls nicht, wie würdet ihr das Problem sonst lösen? Mir sind >> mögliche Ansätze eingefallen, aber die wirken alle ziemlich >> frickelig. > > Das alternative regex-Modul von Matthew Barnett sammelt alle captures: > >>>> import regex >>>> m = regex.compile("(\w+( \w+)*)").search("ab cd ef") >>>> m.groups() > ('ab cd ef', ' ef') >>>> m.captures(2) > [' cd', ' ef'] Interessant. Danke! :-) Anscheinend gibt es das Modul schon einige Jahre, aber ich hatte nie davon gehört, vermutlich, weil für die meisten Anwendungen das `re`-Modul in der Standardbibliothek reicht. Viele Grüße Stefan