softovator.com

Analisis Kumpulan Dokumen dengan RapidMiner

Proses menganalisis kumpulan dokumen menggunakan RapidMiner dilakukan menggunakan Operator Text Processing yang terlebih dahulu di install dengan memilih menu Help dan kemudian Update RapidMiner. Setelah itu, operator yang dibutuhkan tinggal dipilih dari beberapa operator yang disajikan di dalam daftar, termasuk operator Text Processing. Setelah diinstall, maka Operator Text Processing (48) akan muncul di daftar Operator, begitu juga dengan Operator Feature Selection Extension (31) yang juga diinstall dengan cara yang sama.

Tahap pertama untuk melakukan analisis terhadap kumpulan dokumen adalah memasukkan dokumen tersebut ke dalam RapidMiner. Dokumen yang akan dimasukkan ke dalam RapidMiner pada laporan ini berupa 3 folder berbeda dengan nama folder ekonomi, politik, ti. Sementara itu, isi masing-masing folder adalah 10 file text (.txt) yang didalamnya berisi sekumpulan kata yang membentuk paragraf yang berbeda-beda. Untuk memasukkan ketiga folder tersebut secara langsung ke RapidMiner, Operator yang digunakan adalah di bagian Utility, dan menggunakan operator Process Documents from Files di halaman Main Process.

Selanjutnya, pada bagian text directories, dapat dilihat Edit List (0), hal ini menandakan bahwa dokumen masih kosong. Dengan mengedit List Dokumen tersebut, maka dokumen yang akan dianalisis akan masuk.

Hasil yang diperoleh setelah menjalankan Process Document from Files adalah 30 record yang menunjukkan ada 30 file dokumen yang diproses. Masing-masing record dapat diketahui kemunculannya pada folder yang mana (Ekonomi, Politik, atau TI) dan berapa banyak frekuensi kemunculannya pada kolom Total Occurences dan Document Occurences.

Exit mobile version