Pandas Join vs Merge

Pandas Join Vs Merge



'Pandas' är ett högpresterande verktyg för pythonmiljön. Det är en 'öppen' källkod för analys av data. Pandas sammanfogning och pandor sammanfogningsmetoden används för att sammanfoga de två dataramarna till en enda dataram. I båda metoderna för pandor är skillnaden att pandas 'join'-funktionen går med i dataramen med hjälp av ett index. Medan pandas 'sammanfoga'-funktionen går med i dataramen genom att använda indexet och kolumnmetoden där vi själva kan välja önskad kolumn. Sammanfogningsmetoden för pandor används mest jämfört med sammanfogningsmetoden för pandor. Mjukvaran vi kommer att använda för implementeringen är 'spyder'-mjukvaran, som finns i python-miljön som kommer att ge oss fördelar för kodimplementeringen av pandas join method() och pandas merge() metodfunktionen.

Syntax för Pandas Join()-metoden

'df1. Ansluta sig ( df2 )

'df' i ovanstående syntax är förkortningen av 'dataramen'. Det finns två dataramar i syntaxen med funktionen 'dot join', som är till för att anropa metoden. Det är pandasmetoden att sammanfoga två dataramar. Det fungerar genom att använda indexet för att kombinera dataramarna i en enda.







Syntax för Pandas Merge()-metoden

'df1. sammanfoga ( df2 , = kolumnnamn )

Syntaxen för pandas merge-metoden har två dataramar som 'df1' och 'df2'. Funktionen 'punktsammanfogning' anropar metoden för att sammanfoga båda dataramarna med utseendet av kolumner inverterade.



Vi kommer att täcka följande sätt att kombinera två dataramar för att använda metoderna för panda sammanslagning och pandor gå med:



  • Pandas Join-metod överlappande.
  • Pandas går med i metoden med hjälp av en indexåterställning.
  • Pandas sammanslagningsmetod (kolumn 'vänster och höger').
  • Pandas sammanslagningsmetod explicit.

Skapa dataramarna för implementeringen av Pandas Merge och Pandas Join-metoden

Först måste vi skapa en dataram. För det kommer vi att använda verktyget 'spyder'. När du har öppnat den, börja skriva koden. Importera pandor som 'pd' för pandornas biblioteksförening. Vi har dataramvariablerna som 'x', 'y', 'p' och 'q på motsvarande sätt och 'a' med värdena '1' och 'b' med värdet tilldelat som '2'.





Utgången är en 'df' skapad med de tilldelade värdena. Vi kan göra det så stort som data är.



Skapa en annan dataram

Vi måste skapa en annan dataram för att förstå metoderna för att pandor går samman och pandor går samman tydligt. Här har vi 'df' skapat samma som ovanstående 'df', bara de värden som variabler tilldelas är olika. Vi har 'h', 'j', 's' och 'd', medan tilldela värdena 'b' med värdet '8' och 'Y' med värdet '3'.

Utdata visar en enkel 'df' skapad.

Exempel # 01: Pandas sammanfogningsmetod (överlappande)

Nu kommer vi att se hur man kopplar ihop två dataramar med pandas join-metoden. För den här metoden kan vi välja den kolumn vi vill arbeta på från dataramen. Vi har tagit exemplet med den överlappande kolumnen 'vänster' från 'df', så vi kan fixa detta med 'suffixet' för att övervinna överlappningen av data. Här är variablerna som används 'x', 'z', 'v', 'd'. 'p', 'o', 'l' och 'y' med värdena tilldelade som '3', '6', '7' och '9'. '.join' anropar metoden, med align inställd på left join med det högra 'df'-suffixet. ”. 'Suffixet' som används i koden beror på att det i dataramen finns två kolumner som har samma namn som är 'nyckel' och som inte kommer att överlappa data.

Utdata visar inga överlappande data med metoden att sammanfoga två 'df' med hjälp av pandas join-metoden.

Exempel # 02: Pandas gå med metod med hjälp av en indexåterställning

I det här exemplet kommer vi separat att specificera kolumnen med parametern 'on' för att använda som 'nyckel' i metoden join som hjälper till att sammanfoga de två dataramarna. det kombinerade görs med denna parameter. Dessutom bör indexet för en av de två 'df' vara liknande för att ansluta dem. Liknande typer av data eller data som används för samma ändamål kan vara tillsammans för behandling. Detta kommer att använda indexstillbilden, med från höger. Variablerna är 's', 't', 'u', 'v', 'n', 'w', 'k' och 'q'. De tilldelade värdena är '3', '6', '7' och '9'. 'Återställ punktindex' är en metod för pandor för att återställa indexet för 'df'. Återställningsindexet ställer in alla heltal i din dataramslista från 0 tills dataramdatan förlängs upp.

Här är utgången som visas med index-”nyckel”-anslutningsmetoden för pandor.

Exempel # 03: Pandas sammanfogningsmetod (kolumn 'vänster och höger')

Merge-metoden utför en liknande operation som pandas join-metoden. Båda metoderna är för att kombinera data på en liknande dataram. Sammanfogningsmetoden är mer mångsidig och kräver att du anger nyckeln. Vi kan också specificera det på vänster och höger kolumner beroende på hur din dataram fungerar. Variablerna i koden är 's', 'd', 'g', 'f', 'k', 'j', 'b' och 'q'. de tilldelade värdena är '9', '5', '6' och '7'. Den yttre 'join'-implementeringen görs på båda 'df' genom att använda parametern 'how' för pandas merge-metodens funktion.

Utdatan vi ser visar de sammanslagna data för de två dataramarna. 'NaN' representerar 'inte ett nummer', vilket betyder att där det inte finns något nummer tilldelat i data, visar 'NaN' där.

Exempel # 04: Sammanfogningsmetoden uttryckligen

Här, i detta exempel, är sammanslagningsmetoden förstörelsen av indexet och indexvärdet antas inte på dataramen. Vi kommer att göra denna metod i enlighet med det arbete som behövs göras, där den specificerande explicita är att följa upp. Det kommer att slå samman data baserat på ett vänsterindex eller ett högerindex med parametern. Variablerna i denna dataram är 't', 'r', 'I', 'u', 'h', 'o', 'e' och 'e'. De tilldelade värdena är '2', '4', '6' och '4'. Ovanstående exempel på metoden för sammanslagning av pandor med kolumnvalet efter behov är den mest presentabla och värdefulla metoden för att sammanfoga de två dataramarna. Kontrollera i slutet av kodraden om sammanslagningsnyckeln är unik i datamängden.

I utgången nedan visas inte index utan index utan funktionen utförs baserat på höger och vänster index.

Slutsats

Merge()- och join()-metoderna är båda metoderna som är mycket bekväma och effektiva. Båda dessa funktioner används för att sammanfoga de två separata dataramarna på samma dataram men har olika användning beroende på fallet. I den här artikeln har vi lärt oss de viktigaste skillnaderna mellan metoden för sammanfogning och sammanslagning av pandor. Efter att ha gjort exemplen och förstått pandas join-metoden kommer vi att avsluta det med vetskapen om att om vi vill ha mer flexibel och databasstil sammanfogning är det att föredra att gå med pandas merge-metoden. Å andra sidan, om vi vill kombinera dataramen med indexet i stor utsträckning, kan vi använda metoden pandas join()-metoden.