Pandas Sum Column

Pandas Sum Column



'Den här artikeln kommer att visa hur man summerar alla eller särskilda kolumner i en Pandas DataFrame med Python. Funktionen DataFrame.sum() kommer att användas tillsammans med några användbara parametrar i de många exemplen i denna handledning.'

När den här handledningen är över kanske du vet hur du:







    • Hitta summan av dataramkolumnen i Pandas.
    • Lägga samman dataramkolumnerna
    • Lägg till kolumner i en Pandas dataram som uppfyller det angivna villkoret.
    • Bestäm summan efter att ha grupperat dataramen.

Hur bestämmer man summan av dataramkolumner?

Funktionen “dataframe.sum()” i Pandas returnerar den totala summan för den angivna axeln. Om indata är en axel i indexet, lägger funktionen till varje kolumns värden individuellt och gör sedan samma sak för varje kolumn och returnerar en serie som lagrar summan av data/värden i varje kolumn. Dessutom stöder den beräkning av dataramens summa genom att ignorera de saknade värdena.



Syntax: DataFrame.sum(axis = Ingen, skipna = Ingen, nivå = Ingen, numeric_only = Ingen, min_antal = 0, **kwargs)



Var,





axel: {kolumner (1), index (0)}

ordning: Ignorera NA/null-värden när du beräknar resultatet.



nivå: Om den angivna axeln är hierarkisk (ett multiindex), räkna till en viss indexnivå innan du konverterar till en serie.

numeric_only: Bara float-, int- och booleska kolumner är acceptabla. Om ingen, försök att använda allt; om inte, endast numeriska data. För serier, inte implementerad.

min_count: Antalet möjliga värden som krävs för att slutföra operationen. Resultatet blir NA om det finns färre icke-NA-värden närvarande än min_count.

Returnerar: DataFrame (om nivå anges) eller Series.

Exempel # 01: Bestäm summan av en dataramkolumn och alla kolumner

Vi har krävt en dataram först med de giltiga datatyperna, dvs int, float, etc., kolumn eller kolumner för vilka vi kan hitta summan av data. Dataramen kommer att skapas med hjälp av funktionen pd.DataFrame() .


Vi har skapat den nödvändiga dataramen från en python-ordbok i pd.DataFrame()-funktionen. I den ovan skapade dataramen finns det fyra kolumner 'Namn', 'dag1', 'dag2' och 'dag3'. Av fyra kolumner är de tre kolumnerna, dvs. 'dag1', 'dag2' och 'dag3' numeriska kolumner med datavärdena (4, 4, 3, 2, 4, 6, 5, 3), (2, 4, 5, 2, 3, 4, 6, 2) respektive (7, 4, 3, 5, 6, 2, 1, 4). Vi kan bara hitta summan för dessa tre kolumner. Summan för både serier (d.v.s. en kolumn) och en hel dataram kan bestämmas med metoden sum(). Låt oss börja med att lära oss hur man summerar all data i en Panda-kolumn.


För att bestämma summan använde vi metoden sum() i kolumnen 'day2'. Funktionen har returnerat summavärdet 28. På samma sätt som detta kan vi bestämma summan av varje Dataframe-kolumn. Att helt enkelt använda metoden sum() över hela dataramen kommer att åstadkomma detta.


Som det kan ses är summan av kolumn 'dag1' 31; för 'dag2' är summavärdet 28, medan för kolumn 'dag3' är summavärdet 32.

Exempel # 02: Använda funktionen sum() för att summera dataramkolumnvärdena tillsammans

Som du kan se från resultatet från föregående exempel returnerade funktionen inte de faktiska dataramkolumndata som utgjorde summan. Men genom att tilldela metoden 'DataFrame.sum()' till en DataFrame-kolumn kan du komma åt varje kolumn i DataFrame, inklusive summakolumnen. Först skapar vi en annan dataram för detta exempel.


Med hjälp av pd.DataFrame() har vår dataram skapats. Vi har skapat dataramen med tre kolumner: artikel, pris och moms. Kolumnobjektet som innehåller strängvärdena ('penna', 'markör', 'linjal', 'radergummi', 'penna', 'klippbord', 'häftapparat', 'stift'), kolumnpriset som lagrar värdena (20, 15, 10, 3, 5, 30, 35, 10), och kolumnen 'skatt' består av värden (8, 5, 3, 3, 4, 10, 5, 2). Låt oss nu lägga ihop värdena för pris- och momskolumnen och lagra resultaten i en ny kolumn genom att behålla de ursprungliga dataramkolumnerna.


Som det kan märkas tillsammans med den nya kolumnen 'total', returneras de ursprungliga kolumnerna i den givna dataramen också av funktionen. Kolumnen 'totalt' lagrar summan av värden för kolumnerna 'pris' och 'skatt' mot varje 'artikel'-data.

Exempel # 03: Använda funktionen sum() för att bestämma summan av specificerade dataramkolumner

För att summera de flera kolumnerna i dataramen kan vi specificera en lista med kolumnetiketter och sedan använda metoden sum() på listan för att hitta summan. Liksom tidigare exempel kommer vi först att skapa dataramen.


Vi har skapat vår dataram med fyra kolumner 'studenter', 'marks1', 'marks2' och 'marks3'. Kolumnen 'studenter' lagrar data ('Larry', 'James', 'Rob', 'Arya', 'Max', 'Ben', 'Gwen', 'Bill') och kolumnen 'marks1' som lagrar värden (8, 9, 6, 8, 10, 7, 9, 9), medan kolumnerna 'marks2' och 'marks3' lagrar de numeriska värdena (6, 6, 8, 6, 7, 9, 10, 9 (7, 6, 9, 7, 8, 7, 10, 10).


Först har vi skapat ett listobjekt med kolumnetiketter 'studenter', 'marks1' och 'marks3'. Sedan tillämpas sum()-metoden på listan. Funktionen har summerat värdena för kolumnerna marks1 och marks3 endast eftersom kolumnen 'studenter' är icke-numerisk, så funktionen sum() kan inte hitta summan för värdena i kolumnen 'elever'. Vi har lagrat summan av värden för kolumnerna 'marks1' och 'marks3' i kolumnen 'summa'.

Exempel # 04: Lägg till kolumner av Pandas dataram som uppfyller ett specificerat villkor

I det här exemplet kommer vi att lägga till värdena för specificerade kolumner om de uppfyller det angivna villkoret.


Det finns 5 kolumner i den nyskapade dataramen, d.v.s. 'företag', 'vecka1_försäljning', 'vecka2_försäljning', 'vecka3_försäljning' och 'grenar'. Låt oss nu anta att vi inte vill lägga till värdet för den sista kolumnen när vi lägger till eller hittar summan av värdena för de givna dataramraderna. Låt oss säga att vi bara ville lägga till kolumnvärdena med ordet 'vecka' i deras etiketter. En listförståelse kan skapas för att avgöra om ordet 'vecka' finns i en kolumnetikett eller inte.


Nu har vi hämtat de kolumner som har ordet 'vecka' i sina etiketter. Vi kan sammanfatta kolumnerna som innehåller ordet 'vecka' med argumentet axis=1 i sum()-funktionen.


På detta sätt kan vi säkert summera data över kolumner radvis utan att inkludera några kolumner vi inte vill ha.

Exempel # 5: Bestäm summan efter att ha grupperat data i dataramen

Vi kan också hitta summan av dataramkolumner efter att ha grupperat data från en eller flera kolumner. Metoden groupby() kommer att användas för att gruppera data i kategorier i kolumnen. Låt oss skapa en dataram så att vi kan gruppera data från en av dess kolumner.


Nu kommer vi att gruppera data i kolumnen 'ålder' och summera värdena för kolumnerna 'score1' och 'score2' för varje kategori i gruppen.


Vi kan se att summering av data i dataramen efter att först grupperat datavärdena efter ålder resulterar i en kolumnvis summa beroende på åldersgrupperna.

Slutsats

I den här handledningen försökte vi lära dig hur du beräknar summan över dataramar med Pandas summametoden. Vi har diskuterat rad- och kolumnvis tillägg av värden i exemplen i det här inlägget. Dessutom lärde du dig hur du lägger till kolumner villkorligt och hur du summerar värdena efter att ha grupperat kolumnen i dataramen. Nu kanske du kan summera kolumnerna i dataramen tillsammans eller summera värdena i dataramkolumnen själv.