Groups | Search | Server Info | Keyboard shortcuts | Login | Register


Groups > de.comp.os.unix.apps.misc > #3506

R, dplyr und summarize

From Patrick Rudin <taxi_bs@gmx.ch>
Newsgroups de.comp.os.unix.apps.misc
Subject R, dplyr und summarize
Date 2022-02-01 19:27 +0100
Message-ID <j5tcclF3dchU1@mid.individual.net> (permalink)

Show all headers | View raw


Jemand im Usenet unterwegs, der sich mit R auskennt?

Auch nach dem Durchkämmen sämtlicher Tutorials und Cheatsheets ist mir 
die Funktionsweise von group_by in Kombination mit summarize noch 
irgendwie schleierhaft.

Konkret habe ich folgende Fahrzeug-Datenbank:

marke	farbe

vw	rot
skoda	rot
merz	blau
vw	rot
vw	blau
lambo	rot
skoda	blau
merz	rot
skoda	rot
skoda	rot
vw	blau
lambo	rot
merz	rot

Daraus möchte ich eine Liste machen und die Marken zählen.

marke	anzahl

lambo	2
merz	3
skoda	4
vw	4

Das ist soweit simpel.

Wenn ich dann aber zusätzlich als weitere Spalte auch die Prozentzahl an 
blauen Fahrzeugen (anteilblue) pro Marke möchte, muss ich noch auf die 
Farbe selektieren, und sobald ich das als zweites Feld in summarize 
einbaue aggregiert er nicht mehr pro Marke sondern listet alles einzeln auf.

fahrzeug <- datenbank %>%
group_by (marke) %>%
summarize (anzahl = n(), anzblue = ifelse (farbe == "blau", 1, 0)) %>%
mutate (anteilblue = anzblue * 100 / anzahl)

Hat möglicherweise jemand den Überblick, wie group_by und summarize 
zusammenspielen? Es wäre schön, sowas in einem Rutsch mit einer Pipe zu 
erledigen...


Grüsse

Patrick

Back to de.comp.os.unix.apps.misc | Previous | NextNext in thread | Find similar


Thread

R, dplyr und summarize Patrick Rudin <taxi_bs@gmx.ch> - 2022-02-01 19:27 +0100
  Re: R, dplyr und summarize Patrick Rudin <taxi_bs@gmx.ch> - 2022-02-02 19:19 +0100
  Re: R, dplyr und summarize Martin Klaiber <usenet.martinkl@gmx.de> - 2022-02-03 02:08 +0100
    Re: R, dplyr und summarize Martin Klaiber <usenet.martinkl@gmx.de> - 2022-02-03 10:04 +0100
    Re: R, dplyr und summarize Patrick Rudin <taxi_bs@gmx.ch> - 2022-02-03 17:29 +0100
      Re: R, dplyr und summarize Patrick Rudin <taxi_bs@gmx.ch> - 2022-02-03 18:09 +0100
      Re: R, dplyr und summarize Martin Klaiber <usenet.martinkl@gmx.de> - 2022-02-04 10:23 +0100
        Re: R, dplyr und summarize Patrick Rudin <taxi_bs@gmx.ch> - 2022-02-04 14:41 +0100
  Re: R, dplyr und summarize Patrick Rudin <taxi_bs@gmx.ch> - 2024-08-21 23:06 +0200
    Re: R, dplyr und summarize Thomas Klix <wotokl@web.de> - 2024-08-22 03:32 +0200
      Re: R, dplyr und summarize Patrick Rudin <taxi_bs@gmx.ch> - 2024-08-22 12:51 +0200
      Re: R, dplyr und summarize Patrick Rudin <taxi_bs@gmx.ch> - 2024-08-24 11:26 +0200

csiph-web