Pandas Reindex

Pandas Reindex



'I 'pandas' kan vi lagra mycket information i tabellform, som också kallas DataFrame. 'Pandas' underlättar oss med 'DataFrame()'-metoden för att konstruera DataFrame. DataFrame innehåller index, och vi kan också ändra indexen för DataFrame genom att använda 'pandas'-funktionerna. Metoden som vi använder för att återindexera DataFrame är metoden 'reindex()'. Denna metod hjälper till att ändra radens indexvärden såväl som indexvärdena för kolumnerna. Genom att använda den här metoden kan vi ändra standardindexet för DataFrame, och vi kan också ändra det index som vi ställer in när vi skapar DataFrame. Vi kommer att använda metoden 'reindex()' i våra 'pandas'-exempel i denna handledning och kommer att förklara detta koncept på djupet här.'

Exempel # 01

'Spyder'-verktyget hjälper oss att utveckla 'pandas'-koden här i denna handledning, och vi börjar vår kod med nyckelordet 'import', vilket kommer att hjälpa till att importera 'pandas'-funktionen. Vi placerar 'pandas som pd' efter att ha skrivit 'import'. Efter detta skapar vi DataFrame genom att skriva 'pd.DataFrame()'. Vi skriver denna 'pd' här eftersom 'DataFrame()' är metoden för 'pandas'. 'value_df' är namnet på variabeln i vilken DataFrame är sparad. Vi lägger till 'RandomName', som är kolumnnamnet, och 'RandomName' innehåller 'Thomas, Oscar, Lilly, Rowan, John, Bromley, Peter, Alexander och Samuel'.







Sedan har vi 'Value_1', där vi har infogat '16, 29, 24, 35, 44, 50, 69, 74 och 88'. Sedan kommer 'Value_2' och vi har lagt till '25, 38, 42, 56, 54, 65, 78, 89 och 99'. Nu kommer 'Value_3' nästa, och vi placerar '36, 48, 52, 69, 74, 75, 87, 91 och 69' i den. Kolumnen 'Value_4' finns efter detta, där vi har infogat '52, 64, 72, 88, 82, 95, 97, 21 och 39'. Den sista kolumnen är kolumnen 'Value_5' här, och i denna kolumn är värdena vi har lagt till '66, 78, 82, 99, 34, 45, 57, 61 och 89'. Efter detta använder vi funktionen 'print()' där 'Values_df' läggs till så. Det kommer att skrivas ut på terminalen.




Efter att ha tryckt på 'Shift+Enter' kan vi enkelt få resultatet av våra koder i appen 'Spyder'. Här returnerar den här koden DataFrame med standardindex. Nu kommer vi att tillämpa metoden 'reindex()' för att återindexera denna DataFrame i 'pandas'.




Funktionen 'reindex()' används här för att återindexera radens indexvärde. I ovanstående DataFrame kan du se att standardindexvärdena för raden visas, och nu använder vi metoden 'reindex()' för att återindexera dessa radindex. Vi placerar DataFrames namn och sedan metoden 'reindex()' där vi placerar de indexvärden som vi vill lägga till ovanstående DataFrame. Vi lägger 'ind_A, ind_B, ind_C, ind_D, ind_E, ind_F, ind_G, ind_H och ind_I' i funktionen 'reindex()'. Så dessa raders index kommer att uppdateras på DataFrame när vi kör den här koden.






Värdena för radens index visas i det här resultatet, och du kan notera att DataFrame-värdena inte visas här, och 'NaN'-värdena har dykt upp. Detta beror på att de nya indexvärdena inte matchar de tidigare indexvärdena för DataFrame. När det nya indexet och det gamla indexet inte matchar, visar det 'Nan' där. Dessa 'NaN'-värden visas som standard när vi ändrar indexet, och det matchar inte föregående index.



Exempel # 02

Vi ändrar nu kolumnindexvärdena för 'Value_df', som vi tidigare har skapat i exempel 1. Efter att ha skrivit ut 'Value_df', lägger vi in ​​variabeln 'column' och lade till några värden till den. Vi lägger till 'a_1, b_1, c_1, d_1 och e_1'. Nu vill vi justera dessa värden som index för kolumnerna, så för detta använder vi metoden 'reindex()' och placerar namnet på variabeln 'kolumn' där de nya kolumnindexvärdena lagras och ställ också in 'axeln' till 'kolumner', så att kolumnaxelns index uppdateras. Vi lägger in metoden 'reindex()' i 'print()', så att den också renderas på terminalen.


Eftersom vi har använt metoden 'reindex()' uppdateras kolumnindexvärdena som finns i den första DataFrame och nya värden läggs till i den uppdaterade DataFrame. Du kan också notera att alla värden i DataFrame konverteras till 'NaN' eftersom båda indexvärdena för kolumner är olika.

Exempel # 03

'Programmeringsdata' i den här koden innehåller 'P_Languages', där vi har lagt till 'JavaScript, CSS, Web Engineering, OOP, C#, AI, Java och JavaScript'. Sedan har vi 'Hours' där vi placerar '4_hrs, 2_hrs, 3_hrs, 7_hrs, 6_hrs, 5_hrs, 8_hrs och 6_hrs'. Efter detta skrivs 'P_Code' in och vi infogar '11523, 12423, 12321, 11456, 11454, 12267, 13106 och 14123'. Vi lägger till variabeln 'p_index' och sätter 'Pro_A, Pro_B, Pro_C, Pro_D, Pro_E, Pro_F, Pro_G och Pro_H'.

Dessa värden kommer att användas som indexvärden för raderna. Vi ändrar 'Programming_data' i 'Programming_df' DataFrame. Vi lägger också till 'p_index' till denna DataFrame genom att använda metoden 'index'. Vi sätter 'Programming_df' och sedan 'index'-metoden och tilldelar 'p_index' till detta. Nu läggs ovanstående indexvärden till som radindexvärden till DataFrame. Vi skriver ut 'Programming_df' också.

Efter detta lägger vi till några nya indexvärden i variabeln 'new_index', och dessa är 'P_1, P_2, P_3, P_4, P_5, P_6, P_7 och P_8'. Eftersom vi vill uppdatera indexvärdena för rader använder vi metoden 'reindex()' och sätter 'new_index' som parameter för denna funktion och lagrar även den uppdaterade DataFrame i 'newProgramming_df' och placerar 'newProgramming_df' i ' print()' för visning.


Indexvärdena uppdateras, och vi kan också säga att vi har omindexerat DataFrame som vi har skapat. Alla värden i DataFrame konverteras också till 'NaN' eftersom båda indexvärdena är olika.

Exempel # 04

Vi håller för närvarande på att ändra 'Programming_df's' indexvärden för kolumner, som vi tidigare utvecklat i exempel 3. Vi placerar 'column'-variabeln och infogar nya värden i den. 'P_Code, P_Languages, Hours, and New' läggs till i variabeln 'column'. Sedan använder vi återigen metoden 'reindex()' där vi ställer in variabeln 'column', som kommer att uppdatera de tidigare kolumnindexvärdena och lägga till dessa nya kolumnindexvärden till DataFrame.

Här kan du notera att de nya värdena som vi har lagt till i 'kolumn' är desamma som vi har lagt till i ovanstående DataFrame, men sekvensen är annorlunda, så det kommer att ändra sekvensen på kolumnerna och justera alla kolumner när vi nämns i variabeln 'kolumn'. Dessutom lägger vi till ytterligare ett indexvärde som inte finns i ovanstående DataFrame, som är 'Ny' här, så 'NaN'-värdena kommer att visas i den här kolumnen.


Sekvensen för kolumnerna ändras här, och alla värden visas som de finns i den ursprungliga DataFrames kolumner och kolumnen 'Ny' i den uppdaterade DataFrame innehåller alla 'NaN'-värden eftersom denna kolumn inte finns i den ursprungliga DataFrame.

Slutsats

Vi har presenterat denna handledning som hjälper oss att förstå begreppet 'pandas reindex' i detalj. Vi har diskuterat hur vi kan återindexera en DataFrames kolumn såväl som radens indexvärden. Vi har förklarat att 'reindex()'-funktionen för 'pandas' används för att göra detta. Vi har gjort olika exempel där vi har ändrat indexvärdena för raderna i DataFrame och även indexvärdena för kolumnindexet i DataFrame. Vi har återgett resultaten av alla koder som vi har gjort här i denna handledning och även förklarat dem på djupet.