Google Integrasikan Kaggle Dengan BigQuery


Integrasi Kaggle BigQuery Header[Ilustrasi Oleh Pixabay]

Setelah lebih dari dua tahun dibeli oleh Google untuk melengkapi perlengkapan pengolah big data di Google Cloud, Kaggle akhirnya diintegrasikan secara langsung dengan BigQuery – gudang data cloud milik Google.

Tepatnya hari ini (25/6), Google mengumumkan integrasinya tersebut melalui halaman blog miliknya. Dengan integrasi ini, pengguna BigQuery sudah bisa menganalisis data-datanya menggunakan Kaggle.

Secara lebih khusus, para pengguna bisa lebih mudah membangun sebuah model di dalam Kaggle  Jupyter Notebook, atau yang di dalam komunitas biasanya disebut dengan Kaggle Kernels.

Selanjutnya, pengguna pun bisa menautkannya secara langsung ke BigQuery melalui perlengkapan Antarmuka Pemrograman Aplikasi (API), sehingga mereka bisa melakukan query data dengan SQL.

Apa keuntungannya? Seperti yang kita tahu bersama, query data dengan SQL akan cenderung lebih mudah dipahami oleh para ilmuwan data, karena SQL merupakan bahasa yang sudah cukup akrab bagi mereka.

Selain itu, Google juga mengungkapkan keuntungan lain dengan menggunakan metode pendekatan ini, yang mana para ilmuwan yang bertindak sebagai pengguna tidak harus benar-benar memindahkan atau mengunduh data saat akan menggunakannya dalam pembelajaran mesin (machine learning).

Dalam GoogleCloudBlog, Google menegaskan bahwa setelah pengguna menautkan akun Google Cloud miliknya ke notebook atau script dalam sebuah Kernel, mereka bisa membuat query secara langsung di notebook melalui BigQuery API Client library, menjalankannya di BigQuery dan melakukan hampir semua jenis analisis dari sana dengan data yang ada.

Para ilmuwan data yang memiliki metode khusus pun dapat langsung bekerja dengan cara yang sudah akrab dengan mereka, dengan permasalahan yang lebih kecil saat harus membangun model atau menjalankan pembelajaran mesin.

Alih-alih mereka harus bolak-balik dari perlengkapan satu ke perlengkapan yang lainnya, mereka kini pun dapat bekerja dengan lebih efisien melalui metode yang lebih terintegrasi, sehingga mereka dapat lebih menghemat waktu dan usaha dalam jangka panjang.

Kabar baiknya lagi, karena Kaggle merupakan basis data publik, maka para pengguna bisa membagikan dengan mudah Kernels miliknya jika mereka menginginkannya.

Atau sebaliknya, para pengguna pun dapat lebih mudah untuk mencari repository publik dan menggunakan Kernels yang sudah ada sebagai batu loncatan atau sebagai referensi saat bereksperimen dengan set data yang berbeda.

Saat ini pun, Kaggle telah memiliki komunitas yang sangat besar untuk diajak berdiskusi mengenai berbagai permasalahan yang ada. Saat ini, sudah ada sekitar 3 juta pengguna dengan 200.000 Kernels yang bisa diakses secara publik.

[Sumber: TechCrunch]