Contoh Data Frame
Penggunaan Data Frame¶
Diberikan file excel bernama nilai.xlsx yang berisi rekap nilai UTS, UAS, Kuis dan Latihan.
Unduh data pada laman : https://drive.google.com/drive/folders/18SQffd2ZvdDVCH2ZIQhYsxAlN2_Hxj0q?usp=sharing
In [1]:
import pandas as pd
In [2]:
data=pd.read_excel("nilai.xlsx")
print("Tampilan 5 data teratas :")
data.head()
Tampilan 5 data teratas :
Out[2]:
No | Nama Alias | UTS | UAS | Kuis | Latihan | |
---|---|---|---|---|---|---|
0 | 1 | Francis Aguilar | 35.6 | 23.4 | 6.5 | 10 |
1 | 2 | Morris Wallace | 20.9 | 24.3 | 10.8 | 10 |
2 | 3 | Santiago Hicks | 30.0 | 13.1 | 2.7 | 10 |
3 | 4 | Forrest Nash | 15.6 | 25.3 | 13.1 | 8 |
4 | 5 | Manuel Lawson | 25.0 | 30.9 | 1.8 | 10 |
In [3]:
print("Tampilan 3 data terbawah :")
data.tail(3)
Tampilan 3 data terbawah :
Out[3]:
No | Nama Alias | UTS | UAS | Kuis | Latihan | |
---|---|---|---|---|---|---|
57 | 58 | Clifton Sharp | 28.1 | 26.2 | 11.0 | 9 |
58 | 59 | Adam Horton | 25.9 | 30.0 | 8.2 | 10 |
59 | 60 | Antoinette Newton | 24.3 | 13.1 | 11.1 | 10 |
In [4]:
print("Sari numerik dari data")
data.describe()
Sari numerik dari data
Out[4]:
No | UTS | UAS | Kuis | Latihan | |
---|---|---|---|---|---|
count | 60.000000 | 60.000000 | 60.000000 | 60.000000 | 60.000000 |
mean | 30.500000 | 24.436667 | 23.931667 | 8.481667 | 8.900000 |
std | 17.464249 | 7.549340 | 8.519041 | 2.757762 | 2.214743 |
min | 1.000000 | 0.000000 | 0.000000 | 1.800000 | 2.000000 |
25% | 15.750000 | 21.200000 | 19.375000 | 6.875000 | 9.000000 |
50% | 30.500000 | 24.300000 | 24.300000 | 8.400000 | 10.000000 |
75% | 45.250000 | 30.000000 | 29.250000 | 10.500000 | 10.000000 |
max | 60.000000 | 37.500000 | 37.500000 | 13.700000 | 10.000000 |
Akses elemen data frame
In [5]:
print("Akses kolom \"Nama Alias\" pada data :")
print(data["Nama Alias"])
Akses kolom "Nama Alias" pada data : 0 Francis Aguilar 1 Morris Wallace 2 Santiago Hicks 3 Forrest Nash 4 Manuel Lawson 5 Carrie Douglas 6 Claire Walton 7 Kenny Peters 8 Ivan Carroll 9 Andres Lee 10 Lula Rivera 11 Marcia Holt 12 Cedric Arnold 13 Alfredo Barker 14 Doyle Clarke 15 Jennie Boone 16 Walter Payne 17 Rochelle Maxwell 18 Luz Christensen 19 Bertha Washington 20 Georgia Butler 21 Cathy Baldwin 22 Tim Holland 23 Ira Guerrero 24 Eddie Taylor 25 Bryant Miller 26 Nina Burton 27 Mindy Hall 28 Erika Watts 29 Elizabeth Henderson 30 Lucas Cox 31 Irene Flowers 32 Amanda Owen 33 Hattie Rhodes 34 Warren Herrera 35 Molly Estrada 36 Bernice Park 37 Cristina Wilkerson 38 Willis Simmons 39 Dolores Hoffman 40 Jerald Webb 41 Mattie Hardy 42 Minnie Abbott 43 Tonya Martin 44 Gerard Daniel 45 Marie Doyle 46 Bert Banks 47 Wilfred Soto 48 Lynn Crawford 49 Beatrice Sandoval 50 Edmund Miles 51 Bill Powers 52 Leslie Burke 53 Chester Benson 54 Jorge Cain 55 Audrey Richards 56 Robin Love 57 Clifton Sharp 58 Adam Horton 59 Antoinette Newton Name: Nama Alias, dtype: object
In [6]:
print("Akses baris ke 4 pada data :")
#index python dimulai dari 0,
#sehingga baris ke 4 data adalah baris ke-3 pada dataframe
print(data.iloc[3])
Akses baris ke 4 pada data : No 4 Nama Alias Forrest Nash UTS 15.6 UAS 25.3 Kuis 13.1 Latihan 8 Name: 3, dtype: object
In [7]:
print("Akses baris ke 4, kolom \"UTS\" pada data :")
print(data["UTS"][3])
Akses baris ke 4, kolom "UTS" pada data : 15.600000000000001
In [8]:
print("Akses baris ke 4, kolom \"UTS\" menggunakan index :")
#Kolom "UTS" merupakan kolom ke 3 pada data,
#karena index pada python dimulai dari 0, maka "UAS" adalah kolom ke 2
print(data.iloc[3][2])
Akses baris ke 4, kolom "UTS" menggunakan index : 15.600000000000001
Menambahkan kolom baru pada data frame
In [9]:
#Misalkan buat kolom baru "Latihan 100", merupakan nilai latihan dengan skala 100
Latihan100=data["Latihan"]*10
print(Latihan100)
0 100 1 100 2 100 3 80 4 100 5 100 6 100 7 100 8 90 9 90 10 50 11 100 12 30 13 100 14 100 15 100 16 90 17 100 18 100 19 100 20 90 21 100 22 100 23 100 24 90 25 20 26 100 27 20 28 100 29 100 30 80 31 100 32 20 33 100 34 50 35 100 36 100 37 100 38 100 39 100 40 100 41 100 42 90 43 100 44 100 45 100 46 60 47 90 48 100 49 100 50 90 51 100 52 100 53 90 54 40 55 90 56 100 57 90 58 100 59 100 Name: Latihan, dtype: int64
In [10]:
data["Latihan 100"]=Latihan100
data.head()
Out[10]:
No | Nama Alias | UTS | UAS | Kuis | Latihan | Latihan 100 | |
---|---|---|---|---|---|---|---|
0 | 1 | Francis Aguilar | 35.6 | 23.4 | 6.5 | 10 | 100 |
1 | 2 | Morris Wallace | 20.9 | 24.3 | 10.8 | 10 | 100 |
2 | 3 | Santiago Hicks | 30.0 | 13.1 | 2.7 | 10 | 100 |
3 | 4 | Forrest Nash | 15.6 | 25.3 | 13.1 | 8 | 80 |
4 | 5 | Manuel Lawson | 25.0 | 30.9 | 1.8 | 10 | 100 |
Menambahkan baris baru pada data frame
Misalkan kita ingin menambahkan nilai maksikum di akhir baris data.
In [11]:
baris_baru = {"Nama Alias":"Nilai Maksimum", "UTS":max(data["UTS"]), "UAS":max(data["UAS"]), "Kuis":max(data["Kuis"])}
#append row to the dataframe
data = data.append(baris_baru, ignore_index=True)
In [12]:
print("Tampilan data terbawah :")
data.tail()
Tampilan data terbawah :
Out[12]:
No | Nama Alias | UTS | UAS | Kuis | Latihan | Latihan 100 | |
---|---|---|---|---|---|---|---|
56 | 57.0 | Robin Love | 30.6 | 1.8 | 4.5 | 10.0 | 100.0 |
57 | 58.0 | Clifton Sharp | 28.1 | 26.2 | 11.0 | 9.0 | 90.0 |
58 | 59.0 | Adam Horton | 25.9 | 30.0 | 8.2 | 10.0 | 100.0 |
59 | 60.0 | Antoinette Newton | 24.3 | 13.1 | 11.1 | 10.0 | 100.0 |
60 | NaN | Nilai Maksimum | 37.5 | 37.5 | 13.7 | NaN | NaN |
Kita bisa mencetak dataframe yang kita miliki menjadi file excel atau csv.
Misalkan kita ingin membuat file excel nilai baru.xlsx
dengan isi kolomnya hanya kolom Nama Alias
dan kolom Latihan 100
, berikut kode yang digunakan
In [13]:
data.to_excel("nilai baru.xlsx", sheet_name='Tes',columns=["Nama Alias","Latihan 100"],index = False)
data.to_csv("nilai baru.csv",columns=["Nama Alias","Latihan 100"],index = False)
index = False
digunakan index data frame tidak dicetak.
Gunakan header=False
apabila judul kolom tidak ingin dicetak
Comments
Post a Comment