Pandas dataram unik

Pandas Dataram Unik



Det mest populära Python-biblioteket som används inom datavetenskap kallas Pandas. Det erbjuder Python-programmerare högpresterande, användarvänliga och dataanalysverktyg. När du väl förstår de grundläggande funktionerna och hur man använder dem är Pandas ett kraftfullt verktyg för att ändra data. I 'pandas' är standardmetoderna för att lagra data i tabellform DataFrames. Vi kan använda några 'pandas'-metoder för att få de unika värdena i 'pandas' DataFrames kolumn. När vi behöver få unika värden i DataFrames kolumner och inte vill ha dubblering av värden i 'pandas' DataFrames kolumn, kan vi använda metoderna som 'pandas' tillhandahåller för att göra detta. Låt oss titta på sådana metoder i den här guiden, tillsammans med några exempel och utdata för att få unika värden i DataFrames kolumn med 'pandas'.

Metoder för att få unika värden i 'pandas' DataFrames kolumner

Vi kan använda två metoder för att få de unika värdena i 'pandas' DataFrames kolumner. Vi släpper dubblettvärdena och får bara de unika värdena i kolumnerna i DataFrames. Metoderna som 'pandas' tillhandahåller för att utföra denna uppgift är:







  • Genom att använda metoden unique().
  • Genom att använda metoden drop_dupliactes().

Nu kommer vi att använda båda metoderna i 'pandas'-koderna för att få de unika värdena i 'pandas' DataFrames kolumner.



Exempel # 01

'Spyder'-appen används här för att generera dessa 'pandas'-koder för att använda de metoder som hjälper oss att få de unika värdena i 'pandas' DataFrames kolumner. Vi måste importera 'pandas'-modulerna, som är nödvändiga för 'pandas'-koden, innan vi skapar DataFrame. Genom att använda termen 'import' och placera 'pandas som pd' importerar vi dessa moduler.



Nu, med hjälp av 'pd', kan vi snabbt få 'pandas' funktioner eller metoder. Vi lägger sedan in 'Subject_data' där vi lägger till 'Name' och i 'Name' lägger vi till namnets data som är 'Roman, William, Peter, Smith, John, Milli, Thomas och James'. Sedan lägger vi till ämnesdata i 'Ämnet' som är 'Matematik, ekonomi, naturvetenskap, matematik, statistik, statistik, statistik och dator'. Sedan konverterar vi denna 'Subject_data' till 'Subject_df' DataFrame genom att använda metoden 'pd.DataFrame()'. Vi placerar 'Subject_df' i metoden 'print()' så att den visas på terminalen.





Nu vill vi få de unika värdena i 'pandas' DataFrames kolumn 'Subj'. För detta ändamål använder vi metoden 'unique()' här och vi lägger till namnet på kolumnen och även namnet på DataFrame som visas nedan. Vi lägger till den här metoden i 'print()' så att resultatet också visas på terminalen.



Nu trycker vi på 'Shift+Enter' för att få resultatet av denna kod och den återges på terminalen och visas också här, som innehåller DataFrame med alla värden. Detta är den ursprungliga DataFrame som vi har lagt till i koden och nedanför den visar de unika värdena för 'Subj'-kolumnen. Den tar bort dubblettvärdena och visar de unika värdena för 'Subj'-kolumnen i DataFrame.

Exempel # 02

Vi skapar 'Sample_list' som innehåller lite information. Vi infogar 'Layla, 21, 28, 31, 14 och 39' som kommer att visas som den första kolumnen när vi konverterar den här listan till DataFrame. Sedan lägger vi till 'Lusy, 31, 25, 34, 26 och 21' som den andra raden i DataFrame. Efter detta har vi 'Peter, 38, 20, 20, 35 och 24' och 'Layla 38, 23, 39 24, 23' som kommer att vara den tredje och fjärde raden i DataFrame. Vi lägger också in ytterligare tre data som är 'Stella, 21, 24, 24, 28, 31', 'Layla, 33, 32, 26, 30, 25' och även 'Peter, 21, 21, 31, 21, 29' .

Nu konverterar vi 'Sample_list' till 'DF_Sample' som är namnet på DataFrame här genom att sätta funktionen 'pd.DataFrame()'. Vi anger också namnet på kolumnerna i denna DataFrame och dessa namn är 'Name, Ass_1, Ass_2, Ass_3, Ass_4 och Ass_5'. Sedan använder vi 'print()' som hjälper till att visa DataFrame 'DF_Sample'. Nu använder vi en annan metod i det här exemplet för att få de unika värdena i DataFrames kolumn. Denna metod är metoden 'drop_duplicates()' för 'pandas'.

I metoden 'drop_duplicates()' anger vi namnet på kolumnen där vi vill få de unika värdena i DataFrames kolumn. Vi får unika värden för kolumnen 'Namn' genom att släppa dubblettvärdena i denna kolumn med hjälp av metoden 'drop_duplicates()' och även återge dessa unika värden med 'print()'-funktionen här.

Namnen som dupliceras tas bort och unika värden återges efter tillämpning av metoden 'drop_duplicates()'. Du kan notera att 'Layla'-namnet visas i tre celler i kolumnen 'Namn'. Men när metoden 'drop_duplicates()' tillämpas på den här kolumnen, tas alla dubbletter av värden bort och ett 'Layla'-namn har dykt upp på skärmen. Efter att ha släppt dubblettvärdena dök den nya DataFrame upp som innehåller de unika värdena i denna 'Namn'-kolumn. På så sätt kan vi släppa dubblettvärdena och få det unika värdet i DataFrames kolumn med hjälp av metoden 'drop_duplicates()'.

Exempel # 03

Samma DataFrame används igen och nu använder vi metoden 'unique()' här. Med metoden 'unique()' placerar vi namnet på kolumnen såväl som DataFrames namn på vilket vi vill använda denna 'unika()'-metod för att få de unika värdena. Detta kommer bara att återge de unika värdena för den kolumnen och kommer inte att visa dessa värden i form av DataFrame.

Här innehåller DataFrame sju värden i kolumnen 'Namn', men när vi använder metoden 'unique()' på den här kolumnen har bara fyra värden dykt upp och dessa är de unika värdena för den kolumnen. Det återger inte dubbletter av värden.

Exempel # 04

DataFrame som vi skapar i detta exempel är 'F_G_df'. Vi infogar 'My_fruits' och 'my_Vegs' i denna DataFrame. Kolumnen 'My_fruits' innehåller 'Äpple, apelsin, äpple, päron, litchi, äpple, äpple, päron och äpple'. Därefter har vi 'My_Vegs' som innehåller namnen på grönsakerna som är 'Chili, Bringle, Morot, Potatis, Potatis, Morot, Lök, Vitlök och Ingefära'. Denna DataFrame innehåller endast två kolumner.

Nu får vi de unika värdena i båda kolumnerna med hjälp av metoden 'unique()'. Vi nämner namnet på DataFrame. Ange sedan kolumnen första kolumnnamnet. Efter detta använder vi metoden append(). I det här tillägget placerar vi återigen namnet på DataFrame och det andra kolumnnamnet och placerar metoden 'unique()'. Detta kommer att få de unika värdena för båda kolumnerna och sedan lägga till de unika värdena för båda kolumnerna och visa dem på skärmen.

DataFrame renderas först och innehåller alla värden. Efter detta tillämpas metoden 'unique()' och de unika värdena för båda kolumnerna renderas nedan. I den här koden får vi de unika värdena i de flera kolumnerna i DataFrame genom att använda metoden 'unique()'.

Slutsats

Den fullständiga förklaringen av att få de unika värdena i DataFrames kolumn finns i den här guiden. Vi har diskuterat metoderna 'unique()' och 'drop_duplicates()' som hjälper oss att få de unika värdena i DataFrames kolumn. Vi har utforskat hur man använder dessa metoder i 'pandas'-koden genom att använda dessa metoder här i våra koder. Vi har illustrerat olika exempel i den här guiden och har visat dig hur du får de unika värdena för en kolumn genom att använda metoden 'unique()' såväl som metoden 'drop_duplicates()'. Vi har också utforskat hur man får de unika värdena i flera kolumner genom att använda metoden 'unique()' i den här guiden.