Path: csiph.com!fu-berlin.de!uni-berlin.de!not-for-mail
From: Peter Otten <__peter__@web.de>
Newsgroups: de.comp.lang.python
Subject: Re: [Python-de] Anfaengerfrage: Dataframe - Zeilenmittel - Spaltenmittel
Date: Wed, 19 Jun 2019 22:35:31 +0200
Organization: None
Lines: 120
Message-ID: <mailman.155.1560976545.21674.python-de@python.org>
References: <1825444.o0KX4FVeTt@host> <9390763f-1e2a-fb62-50ed-6b776764aec9@goebel-consult.de> <8217725.EGQyf2vfZd@host> <2233175.VqSBi401Pp@palindrom>
Mime-Version: 1.0
Content-Type: text/plain; charset="iso-8859-1"
Content-Transfer-Encoding: quoted-printable
User-Agent: KMail/4.13.3 (Linux/3.13.0-170-generic; KDE/4.13.3; x86_64; ; )
In-Reply-To: <8217725.EGQyf2vfZd@host>
Precedence: list
Xref: csiph.com de.comp.lang.python:5496

eilfh wrote:

> Am Mittwoch, 19. Juni 2019, 14:08:33 CEST schrieb Hartmut Goebel:
>> immer "i-1" verwendest, kannst Du hier
>> "range(spalten_anzahl)" verwenden. Das l=E4uft von 0 und bis
>=20
>=20
> Danke f=FCr eure schnellen Antworten
>=20
> @ Hartmut:
> klappt tats=E4chlich,
> nur ein Verst=E4ndnisproblem meinerseits :
> Indizierung f=E4ngt bei 0 an (=3D das sind aber die Spalten-/bzw. die=

> Zeilenk=F6pfe)

Die "K=F6pfe" sind nicht per Index erreichbar:

>>> df =3D pd.DataFrame([[1,2], [3,4], [5,6]], columns=3D["foo", "bar"]=
)
>>> df.iloc[0,0]
1

Indizes einer Sequenz der L=E4nge N laufen von 0 bis N-1,

>>> for i in range(3):
...     print(i, "abc"[i])
...=20
0 a
1 b
2 c

negative Indizes z=E4hlen vom Ende einer Sequenz:

>>> df.iloc[-1,0]
5

>>> "abc"[-1]
'c'
>>> "abc"[-2]
'b'
>>> "abc"[-3]
'a'

> und dann aber i - 1, bzw. j - 1   --> 0 - 1 --> -1 ???
> aber Ergebnis stimmt (f=FCr dich sicher trivial!)
> (irgendwie denk man wohl
> -- auch nach vielen Jahren --
> immer noch in Turbo-Pascal-Strukturen)

In deinem Code-Beispiel hast du aber von 0 bis N-1 indiziert, nur etwas=
=20
umst=E4ndlich erst mit 1...N begonnen und dann jeweils 1 abgezogen.=20
Auf das Endergebnis hatte das keinen Einfluss:

>>> [i-1 for i in range(1, N+1)]  # du
[0, 1, 2]

>>> [i for i in range(N)] # =FCblich
[0, 1, 2]


> @Peter:
> df1 =3D df.copy()
> habe ich dankend =FCbernommen
>=20
> df.as_matrix()
> FutureWarning: Method .as_matrix,
> das k=F6nnte ich aktualisieren (Use .values instead)

M=F6glicherweise ist meine Pandas-Version ein bisschen =E4lter als dein=
e ;)

> aber:
> meine DataFrames sind nicht quadratisch
> (vermutl. deshalb scheitert das)
> (hier im Testbsp.: 5 Spalten, 30 Zeilen)
> Abbruch, Fehlermitteilung:
> ValueError: Shape of passed values is (5, 30), indices imply (30, 30)=


Das sollte eigentlich kein Problem sein. Hier ein vollst=E4ndiges Scrip=
t, mit=20
3 Spalten und 4 Zeilen:

$ cat tmp.py
import pandas as pd

df =3D pd.DataFrame(
    [[1.,2.,3.], [10, 20, 30], [7, 23, 64], [6, 6, 7]],
    columns=3D["foo", "bar", "baz"]
)
print(df)

a =3D df.values
b =3D (a.T - a.mean(axis=3D1)).T - a.mean(axis=3D0) + a.mean()
df1 =3D pd.DataFrame(b, columns=3Ddf)

print(df1)

Das gibt bei mir Folgendes aus:

$ python3 tmp.py
   foo  bar  baz
0    1    2    3
1   10   20   30
2    7   23   64
3    6    6    7

[4 rows x 3 columns]
         foo       bar        baz
0   7.916667  2.166667 -10.083333
1  -1.083333  2.166667  -1.083333
2 -15.416667 -6.166667  21.583333
3   8.583333  1.833333 -10.416667

[4 rows x 3 columns]
$=20

Produziert das bei dir ein Traceback (wenn ja, was genau)?