Analisis Kumpulan Dokumen dengan RapidMiner



Proses menganalisis kumpulan dokumen menggunakan RapidMiner dilakukan menggunakan Operator Text Processing yang terlebih dahulu di install dengan memilih menu Help dan kemudian Update RapidMiner. Setelah itu, operator yang dibutuhkan tinggal dipilih dari beberapa operator yang disajikan di dalam daftar, termasuk operator Text Processing. Setelah diinstall, maka Operator Text Processing (48) akan muncul di daftar Operator, begitu juga dengan Operator Feature Selection Extension (31) yang juga diinstall dengan cara yang sama.

rapid1Tahap pertama untuk melakukan analisis terhadap kumpulan dokumen adalah memasukkan dokumen tersebut ke dalam RapidMiner. Dokumen yang akan dimasukkan ke dalam RapidMiner pada laporan ini berupa 3 folder berbeda dengan nama folder ekonomi, politik, ti. Sementara itu, isi masing-masing folder adalah 10 file text (.txt) yang didalamnya berisi sekumpulan kata yang membentuk paragraf yang berbeda-beda. Untuk memasukkan ketiga folder tersebut secara langsung ke RapidMiner, Operator yang digunakan adalah di bagian Utility, dan menggunakan operator Process Documents from Files di halaman Main Process.

rapid2

Selanjutnya, pada bagian text directories, dapat dilihat Edit List (0), hal ini menandakan bahwa dokumen masih kosong. Dengan mengedit List Dokumen tersebut, maka dokumen yang akan dianalisis akan masuk.

rapid3rapid4rapid5rapid6

Hasil yang diperoleh setelah menjalankan Process Document from Files adalah 30 record yang menunjukkan ada 30 file dokumen yang diproses. Masing-masing record dapat diketahui kemunculannya pada folder yang mana (Ekonomi, Politik, atau TI) dan berapa banyak frekuensi kemunculannya pada kolom Total Occurences dan Document Occurences.

rapid7

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.