Sebenarnya
pada tau ngga sih Web Clustering itu apa? Gunanya untuk apa? Dan banyak
pertanyaan lainnya yang kita belum tahu. Jujur sebenarnya saya juga pada
awalnya ngga tau sama sekali, tapi dengan adanya tugas ini saya mulai paham
sedikit.
Jadi,
Web Clustering itu merupakan kumpulan dari komputer server yang biasanya
dikelola oleh suatu perusahaan untuk mencapai kebutuhan server yang jauh
melampaui kemampuan satu mesin. Web Clustering juga biasa disebut dengan Server
Farm. Web Cluster memiliki server cadangan yang dapat mengambil alih fungsi
server utama bila terjadi kegagalan server primer. Web Cluster biasa
mengalokasikan dengan switch jaringan dan router yang memungkinkan komunikasi
antara berbagai bagian dan pengguna dari cluster.
Software
yang bisa kita gunakan untuk Web Clustering misalnya Carrot dan Carrot2. Yang
akan saya bahas disini adalah Carrot2. Carrot2 adalah sebuah mesin open source
pencari hasil clustering. Carrot2 menawarkan komponen siap pakai untuk
mengambil hasil pencarian dari berbagai sumber. Carrrot2 ditulis di Java dan
didistribusikan dibawah lisensi BSD. Komponen pengolahan pada Carrot2 dibagi
menjadi dua kelompok besar, yaitu dokumen sumber dan algoritma clustering.
Untuk
saat ini Carrot2 memiliki built-in dukungan untuk sumber-sumber dokumen seperti
Bing Search API, Google Search API, Google Desktop, Lucene Indeks, PubMed, Generic
XML File, eTools metasearch engine, Solr Server. Sumber dokumen lainnya dapat
diintegrasikan berdasarkan contoh kode yang tersedia dengan Carrot distribusi.
Carrot2 menawarkan dua algoritma clustering dokumen khusus yang menempatkan
penekanan pada kualitas label cluster, yaitu Lingo (sebuah algoritma clustering
berdasarkan dekomposisis nilai singular) dan STC (Suffix Tree Clustering).
Carrot2
dapat dipanggil melalui beberapa API seperti Java API, C # / . NET API. Platform lain juga dapat
memanggil Carrot2 pengelompokkan SISA layanan terpapar oleh Server.Clustering
Dokumen. Contoh kode integrasi disediakan untuk PHP5, C#, Ruby dan CURL. Carrot2
menawarkan sejumlah alat pendukung yang dapat digunakan untuk membuat
pengelompokan pada data kustom lebih cepat,tuning dari hasil clustering lebih
lanjut dan pengelompokkan carrot2 sebagai layanan remote, contohnya : Carrot2
Dokumen Clustering Workbench, Carrot2 Document Clustering Server, Carot2
Command Line Interface, Carrot2 Aplikasi Web.
Berikut
ini beberapa tampilan dari Carrot2 :
Ingin
punya software Carrot2? Silahkan klik disini .
Sekian
penjelasan dari saya mengenai Web Clustering dan Carrot2. Maaf kalau masih ngga begitu jelas. hehe :)
Sumber
: