Rensa DataFrame i Pandas

Rensa Dataframe I Pandas



Att ta bort data från Pandas DataFrame görs med funktionen pandas.DataFrame.drop() . Förutom denna funktion kan vi välja raderna från DataFrame utan att ta hänsyn till kolumnerna/raderna. Detta kan också göras med hjälp av hakparenteserna. I den här guiden kommer vi också att använda nyckelordet 'del' och pop()-funktionen för att radera alla rader genom att iterera DataFrame med en 'för'-loop.

Använda Pandas.DataFrame.Drop

Vi använder funktionen pandas.DataFrame.drop() för att ta bort specifika rader eller specifika kolumner från Pandas DataFrame. Låt oss använda den här funktionen för att släppa alla rader och kolumner.

Syntax :







Följande är syntaxen för funktionen pandas.DataFrame.drop(). Vi använder endast tre parametrar och diskuterar endast dessa tre i den här guiden. En detaljerad handledning finns om denna funktion:



pandor. DataFrame . släppa ( etiketter , axel , index , kolumner , nivå , på plats , fel )
  1. Vi måste skicka en lista med radindex till parametern 'etiketter' för att radera alla rader från DataFrame. Vi kan också skicka attributet DataFrame.index som väljer alla radindex. På samma sätt måste vi skicka alla kolumnnamn till denna parameter eller skicka egenskapen DataFrame.columns.
  2. Ställ in parametern 'axel' till 1 om du skickar kolumnerna till parametern 'etiketter'. Som standard är axel = 0 vilket hänvisar till raderna.
  3. Vi kan göra operationen (Delete) på den befintliga DataFrame. Ställ in parametern 'inplace' på 'True'.

Exempel 1:

Tänk på 'Campaign1' DataFrame med fyra rader och två kolumner. Släpp först alla rader genom att skicka radindexen till parametern 'labels' och släpp sedan alla kolumner genom att skicka kolumnetiketterna till parametern 'labels'.



importera pandor

# Skapa DataFrame - Kampanj1 med 2 kolumner och 4 poster
Kampanj 1 = pandor. DataFrame ( [ [ 'java camp' , 'Indien' ] , [ 'linux camp' , 'USA' ] , [ 'c/c++ camp' , 'Indien' ] , [ 'pytonläger' , 'USA' ] ] ,
kolumner = [ 'Kampanj namn' , 'Plats' ] )
skriva ut ( Kampanj 1 , ' \n ' )

# Släpp alla rader
Kampanj 1. släppa ( etiketter = [ 0 , 1 , 2 , 3 ] , på plats = Sann )
skriva ut ( Kampanj 1 , ' \n ' )

# Släpp alla kolumner
Kampanj 1. släppa ( etiketter = [ 'Kampanj namn' , 'Plats' ] , på plats = Sann , axel = 1 )
skriva ut ( Kampanj 1 , ' \n ' )

Produktion :





Efter att raderna har släppts tas raderna bort men kolumnerna finns. Efter att kolumnerna har tagits bort är 'Campaign1' tom.



Exempel 2:

Använd den tidigare 'Campaign1' DataFrame och släpp raderna genom att skicka 'Campaign1.index' till parametern 'labels' och släpp sedan kolumnerna genom att skicka 'Campaign.columns' till parametern 'labels'.

importera pandor

# Skapa DataFrame - Kampanj1 med 2 kolumner och 4 poster
Kampanj 1 = pandor. DataFrame ( [ [ 'java camp' , 'Indien' ] , [ 'linux camp' , 'USA' ] , [ 'c/c++ camp' , 'Indien' ] , [ 'pytonläger' , 'USA' ] ] ,
kolumner = [ 'Kampanj namn' , 'Plats' ] )
skriva ut ( Kampanj 1 , ' \n ' )

# Släpp alla rader
Kampanj 1. släppa ( etiketter = Kampanj 1. index , på plats = Sann )

# Släpp alla kolumner
Kampanj 1. släppa ( etiketter = Kampanj 1. kolumner , på plats = Sann , axel = 1 )
skriva ut ( Kampanj 1 )

Produktion :

Efter att raderna har släppts tas raderna bort men kolumnerna finns. Efter att kolumnerna har tagits bort är 'Campaign1' tom.

Använda Iloc[]

Egenskapen pandas.DataFrame.iloc[] används för att välja data baserat på indexpositionen. Vi kan använda den här egenskapen för att välja 0 rader och 0 kolumner från DataFrame. Här tar vi inte bort själva DataFrame, utan vi kommer att välja 0 poster.

Syntax :

Först måste vi ta bort kolumnerna och sedan raderna.

  1. Välj 0 kolumner – DataFrame.iloc[:,0:0]
  2. Välj 0 rader – DataFrame.iloc[0:0]

Exempel :

Använd samma DataFrame och välj den tomma DataFrame med egenskapen iloc[].

importera pandor

# Skapa DataFrame - Kampanj1 med 2 kolumner och 4 poster
Kampanj 1 = pandor. DataFrame ( [ [ 'java camp' , 'Indien' ] , [ 'linux camp' , 'USA' ] , [ 'c/c++ camp' , 'Indien' ] , [ 'pytonläger' , 'USA' ] ] ,
kolumner = [ 'Kampanj namn' , 'Plats' ] )
skriva ut ( Kampanj 1 , ' \n ' )

# Släpp alla rader
Kampanj 1. släppa ( etiketter = [ 0 , 1 , 2 , 3 ] , på plats = Sann )
skriva ut ( Kampanj 1 , ' \n ' )

# Släpp alla kolumner
Kampanj 1. släppa ( etiketter = [ 'Kampanj namn' , 'Plats' ] , på plats = Sann , axel = 1 )
skriva ut ( Kampanj 1 , ' \n ' )

Produktion :

Använd nyckelordet Del

Hela data kommer att raderas från DataFrame med hjälp av nyckelordet 'del' genom att iterera alla rader inuti 'för'-loopen.

importera pandor

# Skapa DataFrame - Kampanj1 med 4 kolumner och 4 poster
Kampanj 1 = pandor. DataFrame ( [ [ 'java camp' , 'Indien' ] , [ 'linux camp' , 'USA' ] , [ 'c/c++ camp' , 'Indien' ] , [ 'pytonläger' , 'USA' ] ] ,
kolumner = [ 'Kampanj namn' , 'Plats' ] )
skriva ut ( Kampanj 1 , ' \n ' )

# Använda del nyckelord
för i i Kampanj 1:
av Kampanj 1 [ i ]
skriva ut ( Kampanj 1 )

Produktion :

Nu är DataFrame tom.

Använda Pop()-funktionen

Hela data kommer att raderas från DataFrame med pop()-funktionen genom att iterera alla rader inuti 'for'-loopen. Denna funktion är specificerad i 'för'-slingan.

importera pandor

# Skapa DataFrame - Kampanj1 med 4 kolumner och 4 poster
Kampanj 1 = pandor. DataFrame ( [ [ 'java camp' , 'Indien' ] , [ 'linux camp' , 'USA' ] , [ 'c/c++ camp' , 'Indien' ] , [ 'pytonläger' , 'USA' ] ] ,
kolumner = [ 'Kampanj namn' , 'Plats' ] )
skriva ut ( Kampanj 1 , ' \n ' )

# Använder pop()
för i i Kampanj 1:
Kampanj 1. pop ( i )
skriva ut ( Kampanj 1 )

Produktion :

Nu är DataFrame tom.

Slutsats

Vi lärde oss hur man rensar Pandas DataFrame genom att ta bort raderna och kolumnerna. Först släppte vi rader från DataFrame med funktionen drop() och släppte sedan kolumnerna efter att vi använde egenskapen iloc[] för att välja 0 rader. Slutligen diskuterade vi hur man tar bort posterna från DataFrame med hjälp av nyckelordet 'del' och pop()-funktionen.