Melanjutkan tulisan sebelumnya tentang Data Mining alias menambang data. Artikel ini hanya membahas OSINT sependek pengetahuan penulis. Jadi, no debat.

Kita saring dulu definisi OSINT dan Data Mining.

Digging data – for informed decisions. Data Mining. OSINT Analytics delivers leading edge technology for data mining. (osinanalytics.com)

Data Mining: Data mining is a process used by companies to turn raw data into useful information. (wikipedia)

OSINT: Open source intelligence is a form of intelligence collection management that involves finding, selecting, and acquiring information from PUBLICY AVAILABLE sources and analyzing it to produce actionable intelligence.

Intelijen sumber terbuka adalah bentuk manajemen pengumpulan data intelijen yang melibatkan menemukan, memilih, dan memperoleh informasi dari sumber-sumber yang TERSEDIA PUBLIK dan menganalisisnya untuk menghasilkan laporan intelijen yang dapat ditindaklanjuti.

Singkatnya, Data mining itu mengumpulkan data dari berbagai sumber, baik secara organik maupun menggunakan tools, dengan tujuan menghasilkan analisa data berguna untuk suatu tujuan.

Sedangkan OSINT (Open Source Intelligence / Intelijen Sumber Terbuka) lebih ke runtutan pengumpulan data, mensortir data, dan menganalisanya dari SUMBER YANG TERSEDIA SECARA PUBLIK. Bukan sumber tertutup.

Misalkan, jika Anda ingin mengetahui siapa Abu Janda, anda bisa mulai menelusuri sosial media, lalu dari situ Anda mendapatkan email dan no telpon, lanjut ke pengembangan data berdasarkan email dan telpon tadi. Bisa jadi email dia terkait di marketplace tertentu, atau terekam melakukan komunikasi publik (semisal didaftarkan ke forum tertentu). Klik contoh di sini

Dari sosial media, didapat siapa nama, kebiasaan, visited place, pertemanan, event, dsb.

Itu dari SUMBER TERBUKA.

Namun ada juga sumber yang sebenarnya tertutup, tapi karena kelalaian user, menjadi sumber terbuka. Kok bisa?

Maksudnya gini, sekarang era google. kemampuan indexing mesin pencari googel ini bukan ecek-ecek. Ada yang disebut googlebot, yang bertugas menghampiri sumber data. Googlebot ini bekerja secara default tanpa permisi, mengcrawl data, lalu mengindeks data dalam database mereka.

Googlebot ini tau diri, dia tidak akan mengcrawl suatu sumber data jika ditolak oleh ROBOTS.txt yang dipasang di server. Jika suatu server tidak memasang ini, googlebot secara default akan mengcrawl. termasuk mengindex direktori sumber yang kadang berisi informasi penting.

Sebagai pemakai google, biasa mencari data dengan Google Dork (http://dork.izulthea.com) . Google dork ini semacam ‘mantra’ agar menhasilkan hasil pencarian yang lebih informatif.


Misalnya begini. Jika saya ingin mencari folder backup dari suatu website pemerintahan, dengan mudah ketikkan berikut:
intitle:”Index Of/” “backup” site:*.go.id

Akan menghasilkan data seperti ini.

Nah, sebenarnya, web go.id itu ada bagian tertutupnya, tapi karena dia tidak melarang googlebot mampir, data itu terekspos. di sinilah celahnya.

OSINT bekerja pada sumber terbuka. tapi, dengan adanya aksi googlebot ini, sumber tertutup menjadi terbuka dan bisa diakses publik.

Google Dork ini pula yang biasa dipakai hacker, biasa disebut teknik google hacking.

Dengan demikian, menggabungkan konsep Data Mining dengan OSINT (grey area, seperti sampel tadi) menjadi suatu kekuatan data intelijen. Ini serius.