Google Luncurkan Framework Untuk Reinforcement Learning Secara Terbuka


Framework Reinforcement Learning Google[Ilustrasi Oleh Flickr]

Google secara resmi telah mengenalkan kerangka reinforcement learning berbasis pustaka mesin pembelajaran TensorFlow miliknya, melalui laman Google AI Blog. Hal ini bertujuan untuk memudahkan para peneliti dalam melakukan reinforcement learning.

Sebagai tambahan informasi, reinforcement learning merupakan sebuah teknik yang digunakan dalam kecerdasan buatan atau AI (artificial intelligence) guna mengarahkan agen untuk mencapai tujuan tertentu melalui sistem hadiah (dan hukuman).

Teknik pembelajaran sistem ini adalah teknik yang menjadi inti dalam melatih beberapa agen sehingga beberapa agen tersebut dapat memainkan beberapa permainan pada level manusia super, dan bahkan berhasil mengalahkan pemain-pemain profesional.

Dalam catatannya, beberapa sistem telah berhasil mengalahkan juara dunia Alpha Go dan juga pemain profesional permainan Dota 2, serta deep Q-network (DQN) milik anak perusahaan Google DeepMind telah berhasil memain Atari 2600 dengan sangat baik.

Meskipun demikian, terdapat sebuah masalah besar di dalam teknik reinforcement learning ini, di mana framework-nya membutuhkan waktu untuk menguasai suatu hal, namun cenderung tidak fleksibel dan tidak stabil.

Menjawab permasalahan ini, Google pun meluncurkan framework berbasis pustaka TensorFlow miliknya secara open source, dengan tujuan untuk memungkinkan berbagai jenis penelitian spekulatif dapat mendorong penemuan-penemuan yang mendasar.

Anggota Google Brain Team, yakni Pablo Samuel Castro dan  Marc G. Bellemare, menuliskan dalam artikelnya bahwa peluncuran framework ini juga mencakup seperangkat ekosistem guna memperjelas cara menggunakannya.

Mereka berdua dan anggota Google Brain Team telah mengembangkan framework untuk reinforcement learning tersebut dengan tiga pemikiran mendasar, termasuk di antaranya adalah fleksibilitas, stabilitas, dan reproduktifitas.

Bersamaan dengan peluncuran framework tersebut, Google juga meluncurkan situs web khusus yang dapat digunakan oleh para pengembang untuk mempercepat visualisasi dari pelatihan beberapa agen yang sedang berjalan.

Situs ini juga menyediakan model terlatih, raw statistics logs, dan TensorFlow event files untuk digunakan pada TensorBoard, yaitu alat visualisasi perusahaan dari Mountain View untuk program TensorFlow.

Bagi Anda yang ingin mempelajari hal ini lebih lanjut, Anda dapat mengunjungi halaman GitHub dari framework tersebut dan juga halaman situs web yang diluncurkan bersamaan dengannya.

[Sumber: Venturebeat]