K-Means Contoh Soal
Using K-means algorithm find the best groupings and means of two clusters of the 2D data below. Show all your work, assumptions, and regulations. M1 = (2, 5.0), M2 = (2, 5.5), M3 = (5, 3.5), M4 = (6.5, 2.2), M5 = (7, 3.3), M6 = (3.5, 4.8), M7 = (4, 4.5)
Jawab
Gambar 1. Plot dari semua data
Anti Aliasing
Anti-aliasing adalah suatu proses yang mencoba untuk meminimalkan munculnya diagonal alias atau tepi-tepi bergerigi, disebut “jaggies.” Ini memberikan teks atau gambar digital kasar penampilan:
300% |
||
Anti-aliasing menghilangkan jaggies ini dan memberikan munculnya tepi halus dan resolusi yang lebih tinggi. Cara kerjanya adalah dengan memperhatikan seberapa banyak tumpang tindih ideal tepi pixel yang berdekatan. Tepi alias hanya di putaran atas atau bawah tanpa nilai menengah, sedangkan anti-alias tepi memberikan nilai yang sebanding dengan berapa banyak dari tepi itu dalam setiap pixel:
Interpolasi
Interpolasi (kadang-kadang disebut resampling) adalah sebuah metode pencitraan untuk meningkatkan (atau mengurangi) jumlah piksel dalam gambar digital. Beberapa kamera digital menggunakan interpolasi untuk menghasilkan gambar yang lebih besar daripada sensor ditangkap atau untuk membuat zoom digital. Hampir semua perangkat lunak editing gambar mendukung satu atau lebih metode interpolasi. Bagaimana gambar yang diperbesar bisa halus tanpa meninggalkan kesan pecah sangat tergantung pada kecanggihan algoritma interpolasi tersebut.
Metode Kuadrat Terkecil – Least Square Method
Metode kuadrat diterapkan untuk mendekati solusi dari sistem overdetermined, yaitu sistem persamaan di mana terdapat banyak persamaan yang belum diketahui. Kuadrat terkecil (least square) sering diterapkan dalam konteks statistik, khususnya analisis regresi.
Tujuan dari Metode Kuadrat-adalah untuk menemukan estimasi parameter yang baik yang sesuai dengan fungsi, f (x), dari suatu kumpulan data, x 1 … x n. Metode Kuadrat-Terkecil (Least-Squares Method) mensyaratkan bahwa fungsi yang diperkirakan menyimpang sesedikit mungkin dari f (x). Secara umum, Metode Kuadrat-Terkecil memiliki dua kategori, linear dan non-linear. Kita juga dapat mengelompokkan metode-metode ini lebih lanjut: kuadrat terkecil biasa (ordinary least squares-OLS), kuadrat tertimbang (weighted least squares-WLS), dan kuadrat terkecil alternatif (alternating least squares-ALS) dan kuadrat parsial (PLS).
JPEG-Compression
Dalam komputasi JPEG (diucapkan / dʒeɪpɛɡ /, JAY-peg) yang umum digunakan adalah metode lossy kompresi (kompresi dengan menghilangkan beberapa informasi) untuk gambar dan foto. JPEG biasanya mencapai kompresi 10:1 dapat dimaklumi dengan sedikit kerugian pada kualitas gambar.
K-Mean Algorithm Clustering – Pnegklasteran dengan Algoritma K-Mean
Clustering adalah pengelompokan sejumlah besar obyek berdasarkan ciri atau atribut tertentu kedalam sejumlah kelompok atau cluster. Dengan clustering, dan dengan menggunakan algoritma clustering tertentu, sejumlah obyek yang memiliki nilai parameter atau atribut yang mendekati sama akan dapat dikelompokkan dengan mudah. Tujuan dari pengelompokan bisa untuk berbagai keperluan, salah satunya adalah untuk keperluan pengenalan pola (pattern recognition) dimana setelah data dikelompokkan, akan lebih mudah melakukan analisa selanjutnya untuk meng enali secara lebih rinci pola-pola yang dimiliki oleh suatu kumpulan obyek. Untuk pengelompokan obyek, terdapat sejumlah a lgoritma yang banyak digunakan dalam melaku kan clustering, antara lain C-Means, Isodata, dan K-Means.
K-Means merupakan metode klasterisasi yang paling terkenal dan banyak digunakan di berbagai bidang karena sederhana, mudah diimplementasikan, memiliki kemampuan untuk mengklaster data yang besar, mampu menangani data outlier, dan kompleksitas waktunya linear O(nKT) dengan n adalah jumlah dokumen, K adalah jumlah kluster, dan T adalah jumlah iterasi. Algoritma K-Mean berfungsi untuk mengelompokkan suatu obyek yang memiliki kesamaan (proses pengelompokan biasa disebut clustering) dengan berdasar K cluster, dimana K adalah bilangan integer positif. K-means merupakan metode pengklasteran secara partitioning yang memisahkan data ke dalam kelompok yang berbeda. Dengan partitioning secara iteratif, KMeans mampu meminimalkan rata-rata jarak setiap data ke klasternya. Metode ini dikembangkan oleh Mac Queen pada tahun 1967.
Computer Vision
Computer vision adalah ilmu dan teknologi dari sebuah mesin (dalam hal ini komputer dan perangkat tambahan lainnya) yang dapat melihat. Computer vision juga merupakan studi tentang metode yang memungkinkan sebuah komputer dapat memahami citra dan data multi dimensi secara umum. Sebagai disiplin ilmu, computer vision juga meliputi teori-teori sistem artifisial yang mengekstrak informasi dari sebuah citra.
Teori Keputusan Bayesian (Bayesian Decision Theory)
Bayesian Decision Theory adalah teori pengambilan keputusan pada sebuah proses pengklasifikasian. Masalah ini biasa di pelajari pada mata kuliah Pattern Recognition dan Computer Vision
Semisal diasumsikan ada dua buah kelas / kelompok / grup w1 dan w2 . Kemudian kita bisa menentukan probabilitas dari suatu data apakah termasuk dalam kelas w1 atau w2 . Sebagai contoh kita akan menentukan apakah seekor ikan yang ditangkap nelayan merupakan kelompok salmon atau sea-bass. Semisal kita tidak tahu apa perbedaan antara sea-bass dan salmon, maka kita akan bisa mengambil beberapa ciri yang akan kita gunakan untuk membedakan keduanya. ciri tersbut bisa panjang, cerah dan tidaknya warna, dan sebagainya. Setelah itu kita akan menentukan berapa besar probabilitas seekor ikan tergolong ke sea-bass dan atau salmon.
Lena atau Lenna
Lena atau Lenna adalah gambar yang sering digunakan dalam pengolahan citra. Gambar ini biasa digunakan untuk menerapak proses pemberian derau mapun kompresi. Siapakah dia? Apakah dia ahli Pengolahan Citra? Ternyata bukan. Dia adalah seorang foto model asal swedia yang perna terpampang dalam salah satu majalah terkenal pada November 1972. Foto tersbut di krop, kemudian dijadikan gambar standar di proses pengolahan citra. Gambar tersebut bisa ditemukan pada bawaan dari perangkat lunak seperti Matlab, dan sebagainya.
CImg Library,open source C++ toolkit untuk pengolahan citra
Karena aku menggunakan c++ untuk thesis, dan aku bekerja di lingkup pengolahan citra, lewat search sebentar dari Mr. Google, aku mendapatkan link toolkit mudah dan gratis ini. sangat memuaskan. Karena aku bekerja under windows aku download Standard Package-nya yang berisi contoh dan purtakanya. selain itu aku juga download pre-compiled binary yang berisi contoh-contoh yang sangat membantu.
Setelah aku ekstrak file zip dari standard package CImg ini kemudian aku coba build solution. Untuk membuat program (bisa pake Win 32 Console Application) file Cimg.h aku kopi ke folder yang sama dengan projectku. Kadang juga aku tambahkan folde img/ untuk menambahkan pustaka yang sering diikutkan dalam contoh-contoh programnya, seperti tetris.h. Pokoknya menyenangkan.

