Panda Qcut

Panda Qcut



'Python' innehåller många bibliotek, och när vi vill analysera eller manipulera data använder vi dessa 'Pythons' bibliotek, och 'pandas' är också biblioteket för det. 'Pandas'-biblioteket används inom datavetenskapsområdet, och det används också i maskininlärningsaktiviteter. 'Pandas' DataFrame hjälper oss att spara data. I 'pandas', när vi vill ha databinning, använder vi metoden 'qcut()'. Metoden 'qcut()' används för att konvertera kontinuerliga funktioner till kategoriska. Vi kan lägga till olika typer av parametrar i denna 'qcut()'-metod för att få olika typer av resultat. Denna handledning handlar om metoden 'qcut()', och vi kommer att förklara i detalj 'qcut()'-metoden här. Vi kommer att förklara för dig hur vi gör datainsamlingen med hjälp av 'qcut()'-funktionen i 'pandas' i denna handledning.'

Exempel # 01

Vi kommer att tillämpa metoden 'qcut()' i dessa koder, och vi kommer att göra dessa koder i 'Spyder'-appen. När vi måste arbeta med 'pandas' kan vi bara komma åt dess funktioner när vi importerar 'pandas'-biblioteket till våra koder. Först lägger vi 'import' och sedan skriver vi 'pandas som pd'. Nu måste vi tillämpa metoden 'qcut()', så för detta skapar vi DataFrame här. Vi konstruerar 'Random_df' som innehåller 'R_ID, R_name och R_age' som kolumner, och även i 'R_ID' placerar vi 'R_17, R_21, R_24, R_29, R_31, R_34, R_44, R_46, R_50, R_51, R_55 R_61, R_73 och R_81”. Sedan lägger vi till 'Theodore, Teddy, Noah, Leo, Ivy, Henry, Freddie, Evelyn, Ava, Willow, Theo, Oscar, Jacob och Harper' i kolumnen 'R_name'. Efter detta infogar vi '21, 33, 12, 43, 22, 7, 21, 51, 72, 19, 10, 9, 37 och 40' i kolumnen 'R_age'. Nu använder vi 'print()', som innehåller 'Random_df', och det kommer att hjälpa till att rendera 'Random_df' DataFrame. Vi har precis skapat DataFrame och använder inte metoden 'qcut()' ännu.








'Kör'-ikonen hjälper oss att köra koderna. När vi trycker på den här 'kör'-ikonen visas resultatet av denna kod på terminalen i 'Spyder'-appen. 'Random_df' DataFarme visas som resultatet av koden som vi har skrivit i detta exempel. Nu kommer vi att tillämpa metoden 'qcut()' och kommer också att visa resultatet.




Vi samlar data här. Vi binnar kolumnen 'R_age' och placerar metoden 'pd.qcut()', vilket är metoden för 'pandas' som hjälper till med databinning. I den här metoden infogar vi namnet på DataFrame och även kolumnnamnet som vi vill använda denna 'qcut()'-metod på. Vi ställer också in värdet på 'q' till '5', och det används för att skära upp data i kolumnen 'R_age' i fem lika stora kvantiler. Vi lägger till metoden 'qcut()' i 'print()', så att den också visar binning-data på terminalen.




Här visas data efter binning, och den skär 'R_age' i fem kvantiler. Den visar också kategorierna i vilka kolumndata 'R_age' är lagrade. Den kategoriska serien representerar 'R_age'-fack.






Vi kan även justera etiketten för dessa papperskorgar. Vi lägger till dessa papperskorgsetiketter för att göra dem lätta att tolka. Vi lägger till en 'R_age_qcut'-kolumn till 'Random_df' där vi lägger till etiketterna för dessa fack. Vi använder återigen metoden 'pd.qcut()' för att märka dem. Vi lägger till etiketterna som är 'liten, inte så liten, mediokra, hög och högst' i den. Sedan lägger vi igen 'Random_df' i 'print()'.


Alla papperskorgar är märkta och presenterade i detta resultat. Kolumnen 'R_age_qcut' visas i denna DataFrame där märkta fack visas.



Exempel # 02

För att skapa DataFrame lägger vi först till 'betyg', som är '3, 6, 8, 7, 2, 5, 1, 9, 4, 7 och 8'. Sedan lägger vi till namn på elever i 'studenter', som är 'Peter, Bromley, James, David, Allies, John, James, Samuel, William, Howard och Alexander'. Sedan genererar vi 'Grades_df' där vi har lagt till metoden 'pd.DataFrame()', och i denna metod lägger vi 'Std_name', som kommer att visas som kolumnnamnet, och tilldelar värden för 'studenter' till detta. Sedan ställer vi in ​​'Students_grades' som kolumnnamn för DataFrame och tilldelar även 'betyg' här, som vi har skapat ovan. Efter detta har vi 'print()' där vi lägger till 'Grades_df' för utskrift.


DataFrame som innehåller två kolumner visas i resultatet av denna kod. Nu kommer vi att tillämpa metoden 'qcut()' på kolumnen 'Students_grades' för att samla in data för denna kolumns värden.


Vi lägger till en ny kolumn 'betyg' här där vi har tillämpat 'pd.qcut()' på kolumnen 'Students_grades', och vi har också använt '4' för värdet på 'q', så det kommer att skäras data i fyra lika stora kvantiler. Efter detta specificerar vi dessa kvantiler här genom att placera värden i 'q', som är '0, .4, .8 och 1'. Sedan visar vi även detta. Nu märker vi dessa arkiverade data, och etiketterna vi lägger till här är 'D, C, A och B' och lagras också i kolumnen 'betyg'.


Här visas data efter binning här i kolumnen 'betyg', och den skär upp data i kolumnen 'Student_grades' i fyra lika stora kvantiler.


DataFrame som vi får efter att ha tillämpat metoden 'qcut()' och specificerat kvantilerna visas i detta resultat.


Nu, efter att etiketterna lagts till i dessa fack återges också i detta utfall i kolumnen 'betyg', och du kan se att den tilldelar etiketterna enligt bin-värdena.

Exempel # 03

Vi kan också använda metoden 'qcut()' på data i CSV-filen. För detta läser vi först CSV-filens data med hjälp av metoden 'read_csv()'. Vi läser data från filen 'office2.csv', och sedan placeras data för denna fil i 'Office_df'. Denna metod kommer att konvertera 'office2'-filens data till DataFrame och spara den i 'Office_df'. Sedan visar vi också dessa data genom att sätta 'Office_df' i 'print()'. Efter detta lägger vi till en ny kolumn som heter 'Units_qcut', som vi tillämpar funktionen 'pd.qcut()' på i kolumnen 'Units'.

Dessutom ställer vi in ​​värdet på variabeln 'q' till '5', vilket delar upp data i fem lika stora kvantiler. Datan, efter att ha klippts i 5 lika stora kvantiler, lagras i kolumnen 'Units_qcut' och denna kolumn läggs också till i 'Office_df' och 'Office_df' återges här med 'print()'. Vi etiketterar nu dessa arkiverade data, lägger till etiketterna i metoden 'qcut()', som är 'Enhet 1, Enhet 2, Enhet 3, Enhet 4 och Enhet 5' och lagrar dem också i kolumnen 'Etiketter' . Vi återger också denna DataFrame där kolumnen 'Etiketter' läggs till.


Datan som vi får efter att ha läst filen 'office2.csv' renderas här i form av DataFrame. Sedan läggs 'Units_qcut'-kolumnen till, där de arkiverade värdena för 'Units'-kolumnen visas. Efter detta läggs även kolumnen 'Etiketter' till, som tilldelar etiketterna till dessa arkiverade värden. Allt detta görs genom att använda metoden 'qcut()' i 'pandas'.

Slutsats

Vi har förklarat 'qcut()'-metoden i detalj i den här handledningen som hjälper till att lagra data i 'pandas'. Vi har diskuterat att data lagras i enlighet med kvantilens 'q'-värde som vi har lagt till i metoden 'qcut()', och vi har också justerat etiketterna till dessa lagrade data. Vi har utforskat metoden 'qcut()' och har tillämpat den här metoden på kolumnerna i DataFrame, och vi har även tillämpat denna 'qcut()'-metod på data i CSV-filen efter att ha läst CSV-filerna. Vi har presenterat resultatet av alla koder i denna handledning för att tydligt förklara och visa resultatet av metoden 'qcut()'.