Groups | Search | Server Info | Keyboard shortcuts | Login | Register
Groups > de.comp.os.unix.apps.misc > #3506
| From | Patrick Rudin <taxi_bs@gmx.ch> |
|---|---|
| Newsgroups | de.comp.os.unix.apps.misc |
| Subject | R, dplyr und summarize |
| Date | 2022-02-01 19:27 +0100 |
| Message-ID | <j5tcclF3dchU1@mid.individual.net> (permalink) |
Jemand im Usenet unterwegs, der sich mit R auskennt? Auch nach dem Durchkämmen sämtlicher Tutorials und Cheatsheets ist mir die Funktionsweise von group_by in Kombination mit summarize noch irgendwie schleierhaft. Konkret habe ich folgende Fahrzeug-Datenbank: marke farbe vw rot skoda rot merz blau vw rot vw blau lambo rot skoda blau merz rot skoda rot skoda rot vw blau lambo rot merz rot Daraus möchte ich eine Liste machen und die Marken zählen. marke anzahl lambo 2 merz 3 skoda 4 vw 4 Das ist soweit simpel. Wenn ich dann aber zusätzlich als weitere Spalte auch die Prozentzahl an blauen Fahrzeugen (anteilblue) pro Marke möchte, muss ich noch auf die Farbe selektieren, und sobald ich das als zweites Feld in summarize einbaue aggregiert er nicht mehr pro Marke sondern listet alles einzeln auf. fahrzeug <- datenbank %>% group_by (marke) %>% summarize (anzahl = n(), anzblue = ifelse (farbe == "blau", 1, 0)) %>% mutate (anteilblue = anzblue * 100 / anzahl) Hat möglicherweise jemand den Überblick, wie group_by und summarize zusammenspielen? Es wäre schön, sowas in einem Rutsch mit einer Pipe zu erledigen... Grüsse Patrick
Back to de.comp.os.unix.apps.misc | Previous | Next — Next in thread | Find similar
R, dplyr und summarize Patrick Rudin <taxi_bs@gmx.ch> - 2022-02-01 19:27 +0100
Re: R, dplyr und summarize Patrick Rudin <taxi_bs@gmx.ch> - 2022-02-02 19:19 +0100
Re: R, dplyr und summarize Martin Klaiber <usenet.martinkl@gmx.de> - 2022-02-03 02:08 +0100
Re: R, dplyr und summarize Martin Klaiber <usenet.martinkl@gmx.de> - 2022-02-03 10:04 +0100
Re: R, dplyr und summarize Patrick Rudin <taxi_bs@gmx.ch> - 2022-02-03 17:29 +0100
Re: R, dplyr und summarize Patrick Rudin <taxi_bs@gmx.ch> - 2022-02-03 18:09 +0100
Re: R, dplyr und summarize Martin Klaiber <usenet.martinkl@gmx.de> - 2022-02-04 10:23 +0100
Re: R, dplyr und summarize Patrick Rudin <taxi_bs@gmx.ch> - 2022-02-04 14:41 +0100
Re: R, dplyr und summarize Patrick Rudin <taxi_bs@gmx.ch> - 2024-08-21 23:06 +0200
Re: R, dplyr und summarize Thomas Klix <wotokl@web.de> - 2024-08-22 03:32 +0200
Re: R, dplyr und summarize Patrick Rudin <taxi_bs@gmx.ch> - 2024-08-22 12:51 +0200
Re: R, dplyr und summarize Patrick Rudin <taxi_bs@gmx.ch> - 2024-08-24 11:26 +0200
csiph-web