Pandas Fyll Nan med 0

Pandas Fyll Nan Med 0



Datavetenskap innebär vanligtvis att data saknas. Antingen kan hela raden kasseras eller så kan ett värde läggas till rad-kolumnkombinationen. Att ta bort raden/kolumnen skulle vara absurt eftersom det eliminerar ett visst mått för varje rad. NaN, som står för 'Not a Number', är ett av de typiska sätten att visa ett värde som saknas i en uppsättning data. För att få de avsedda resultaten är det ganska viktigt att hantera NaN. Så låt oss ta reda på hur du ändrar NaN-värdena i en rad eller kolumn i en Pandas DataFrame till 0.

Pandas fyller NaN-värden

Om en kolumn i din dataram har NaN- eller None-värden, kan du använda funktionerna 'fillna()' eller 'replace()' för att fylla dem med noll (0).

Fillna()







NA/NaN-värdena fylls med det angivna tillvägagångssättet med funktionen 'fillna()'. Det kan användas genom att överväga följande syntax:



Om du vill fylla NaN-värdena för en enskild kolumn är syntaxen följande:




När du måste fylla i NaN-värdena för hela DataFrame, är syntaxen som tillhandahålls:






Byta ut()

För att ersätta en enda kolumn med NaN-värden är syntaxen som följer:




För att ersätta hela DataFrames NaN-värden måste vi använda följande syntax:


I den här texten kommer vi nu att utforska och lära oss den praktiska implementeringen av båda dessa metoder för att fylla NaN-värdena i vår Pandas DataFrame.

Exempel 1: Fyll i NaN-värden med Pandas “Fillna()”-metoden

Den här illustrationen visar tillämpningen av Pandas 'DataFrame.fillna()'-funktion för att fylla NaN-värdena i den givna DataFrame med 0. Du kan antingen fylla de saknade värdena i en kolumn eller så kan du fylla dem för hela DataFrame. Här kommer vi att se båda dessa tekniker.

För att omsätta dessa strategier i praktiken måste vi få en lämplig plattform för genomförandet av programmet. Så vi bestämde oss för att använda verktyget 'Spyder'. Vi startade vår Python-kod genom att importera 'pandas'-verktygslådan till programmet eftersom vi behöver använda Pandas-funktionen för att konstruera DataFrame och fylla i de saknade värdena i den DataFrame. 'pd' används som alias för 'pandas' genom hela programmet.

Nu har vi tillgång till Pandas funktioner. Vi använder först dess 'pd.DataFrame()'-funktion för att generera vår DataFrame. Vi åberopade denna metod och initierade den med tre kolumner. Titlarna på dessa kolumner är 'M1', 'M2' och 'M3'. Värdena i kolumnen 'M1' är '1', 'Ingen', '5', '9' och '3'. Posterna i 'M2' är 'Ingen', '3', '8', '4' och '6'. Medan 'M3' lagrar data som '1', '2', '3', '5' och 'Ingen'. Vi kräver ett DataFrame-objekt i vilket vi kan lagra denna DataFrame när metoden 'pd.DataFrame()' anropas. Vi skapade ett 'saknat' DataFrame-objekt och tilldelade det av resultatet som vi fick från funktionen 'pd.DataFrame()'. Sedan använde vi Pythons 'print()'-metod för att visa DataFrame på Python-konsolen.


När vi kör denna kodbit kan en DataFrame med tre kolumner ses på terminalen. Här kan vi observera att alla de tre kolumnerna innehåller nollvärdena i dem.


Vi skapade en DataFrame med några nollvärden för att tillämpa Pandas 'fillna()'-funktion för att fylla de saknade värdena med 0. Låt oss lära oss hur vi kan göra det.

Efter att ha visat DataFrame anropade vi Pandas 'fillna()'-funktion. Här kommer vi att lära oss att fylla de saknade värdena i en enda kolumn. Syntaxen för detta nämns redan i början av handledningen. Vi angav namnet på DataFrame och specificerade den specifika kolumntiteln med funktionen '.fillna()'. Mellan parenteserna för denna metod angav vi värdet som kommer att läggas på nollplatserna. DataFrame-namnet 'saknas' och kolumnen som vi valde här är 'M2'. Värdet som anges mellan klammerparenteserna i 'fillna()' är '0'. Till sist kallade vi 'print()'-funktionen för att se den uppdaterade DataFrame.


Här kan du se att kolumnen 'M2' i DataFrame inte innehåller några saknade värden nu eftersom NaN-värdet är fyllt med 0.


För att fylla NaN-värdena för en hel DataFrame med samma metod kallade vi 'fillna()'. Detta är ganska enkelt. Vi försåg DataFrame-namnet med funktionen 'fillna()' och tilldelade funktionsvärdet '0' mellan parenteserna. Slutligen visade 'print()'-funktionen oss den fyllda DataFrame.


Detta ger oss en DataFrame utan NaN-värden eftersom alla värden fylls på med 0 nu.

Exempel 2: Fyll i NaN-värden med Pandas “Replace()”-metoden

Den här delen av artikeln visar en annan metod för att fylla NaN-värdena i en DataFrame. Vi kommer att använda 'replace()'-funktionen i Pandas för att fylla värdena i en enda kolumn och i en komplett DataFrame.

Vi börjar skriva koden i verktyget 'Spyder'. Först importerade vi de nödvändiga biblioteken. Här laddade vi Pandas-biblioteket för att göra det möjligt för Python-programmet att använda Pandas-metoderna. Det andra biblioteket som vi laddade är NumPy och alias det till 'np'. NumPy hanterar de saknade data med metoden 'replace()'.

Sedan genererade vi en DataFrame med tre kolumner - 'skruv', 'spik' och 'borr'. Värdena i varje kolumn anges respektive. Kolumnen 'skruv' har värden '112', '234', 'Ingen' och '650'. Kolumnen 'spik' har '123', '145', 'Ingen' och '711'. Slutligen har kolumnen 'borrning' '312', 'Ingen', '500' och 'Ingen' värden. DataFrame lagras i 'tool' DataFrame-objektet och visas med metoden 'print()'.


En DataFrame med fyra NaN-värden i posten kan ses i följande utdatabild:


Nu använder vi Pandas 'replace()'-metoden för att fylla nollvärdena i en enda kolumn i DataFrame. För uppgiften anropade vi funktionen 'replace()'. Vi tillhandahöll DataFrame-namnet 'verktyg' och kolumn 'skruv' med metoden '.replace()'. Mellan dess klammerparenteser ställer vi in ​​värdet '0' för 'np.nan'-posterna i DataFrame. Metoden 'print()' används för att visa resultatet.


Den resulterande DataFrame visar oss den första kolumnen med NaN-poster som ersätts med 0 i kolumnen 'skruv'.


Nu ska vi lära oss att fylla värdena i hela DataFrame. Vi kallade metoden 'replace()' med namnet på DataFrame och angav värdet som vi vill ersätta med np.nan-poster. Slutligen skrev vi ut den uppdaterade DataFrame med funktionen 'print()'.


Detta ger oss den resulterande DataFrame utan saknade poster.

Slutsats

Att hantera de saknade posterna i en DataFrame är en grundläggande och är ett nödvändigt krav för att minska komplexiteten och hantera data trotsigt i dataanalysprocessen. Pandas ger oss några alternativ för att hantera detta problem. Vi tog in två praktiska strategier i den här guiden. Vi tillämpar båda teknikerna med hjälp av 'Spyder'-verktyget för att exekvera exempelkoderna för att göra saker lite förståeligt och lättare för dig. Att få kunskap om dessa funktioner kommer att vässa dina Pandas färdigheter.