knowledge

SEARCH KNOWLEDGE

Google Hadirkan M...

Google Hadirkan Model AI Canggih yang Dapat Menerjemahkan Gambar Menjadi Teks

22 Feb ·

2 min read

1.924

Teknologi

Perkembangan teknologi kecerdasan buatan (AI) terus melesat dan semakin canggih. Baru-baru ini, Google menghadirkan lompatan besar dalam dunia robotika dengan meluncurkan model AI terbaru yang diberi nama Robotics Transformer 2 atau RT-2.

Model RT-2 ini menjadi salah satu terobosan yang menggabungkan kemampuan visual dan pemrosesan bahasa alami (VLA), dilatih dari berbagai sumber informasi dan gambar dari internet, untuk mengendalikan robot secara lebih fleksibel dan cerdas.

Robot ini memiliki kapasitas besar dalam mengolah data, memahami konsep-konsep umum, dan menerapkannya dalam tindakan nyata. Hasilnya, robot mampu beroperasi dengan efektif.

Kelebihan utama model AI ini adalah kemampuannya dalam penalaran kompleks dan memberikan arahan pada robot.

Namun, untuk mencapai level kompetensi tertentu, robot perlu mengumpulkan data langsung dari objek, lingkungan, tugas, dan situasi yang dihadapinya. Proses ini menjadi kunci pengembangan kemampuan robot yang lebih baik.

Adaptasi Perkembangan Teknologi Kecerdasan Buatan

Adaptasi VLM untuk Pengendalian Robotik

1. Pengembangan Data dari RT-1 Menjadi RT-2

Visual Language Model (VLM) belajar dari data robotika RT-1 untuk menjadi RT-2, Visual Language Action Model (VLA) yang mengendalikan robot.

Perkembangan ini menghadirkan langkah maju dalam pengembangan robot, sebab RT-2 merupakan hasil dari pengembangan model bahasa visual (VLM) yang bisa memproses gambar menjadi teks alami.

Sebelumnya, VLM telah sukses digunakan untuk berbagai tugas, termasuk menjawab pertanyaan visual, memberikan keterangan gambar, dan mengenali objek.

Seperti terlihat dalam ilustrasi di atas, RT-2 menunjukkan kemampuan umum dan pemahaman visual di luar data robotik yang digunakan dalam pelatihannya.

Ini termasuk interpretasi perintah baru dan respons terhadap perintah pengguna melalui penalaran, seperti kategori objek atau deskripsi tingkat tinggi.

Dengan kombinasi kemampuan visual dan pemrosesan bahasa alami, robot mampu beradaptasi di lingkungan baru tanpa pemrograman ulang, sesuatu yang sangat sulit dicapai robot tradisional.

2. Pemahaman Akan Konsep yang Lebih Lengkap

Selama bertahun-tahun, para peneliti berupaya meningkatkan kemampuan robot untuk menyelesaikan masalah dalam kehidupan sehari-hari. Google sendiri telah menguji model RT-2 dalam lebih dari 6.000 percobaan robot.

Hal ini sejalan dengan penjelasan dalam postingan resmi di Google DeepMind Blog, RT-2 diperkenalkan sebagai model AI multimodal yang dilatih menggunakan kombinasi data visual, teks, serta pengalaman robotik.

Dengan pendekatan ini, RT-2 digadang-gadang mampu memahami konsep abstrak, menghubungkannya dengan aksi fisik, hingga mengambil keputusan berbasis konteks di dunia nyata.

Google Robotics Transformer 2

Mengapa Google Robotics Transformer 2 (RT-2) Revolusioner?

RT-2 bukan sekadar model AI biasa. Google merancangnya sebagai solusi atas keterbatasan model robotik tradisional yang hanya bisa melakukan tugas-tugas spesifik yang telah diprogram sebelumnya.

Jika dibandingkan dengan chatbot biasa, jelas Google AI RT-2 ini jauh berbeda. RT-2 memiliki koneksi dengan dunia nyata dan pemahaman tentang kemampuannya.

Dikutip dari blog resmi Google, RT-2 meningkatkan kemampuan robot menyelesaikan tugas di skenario baru hingga lebih dari 2 kali lipat dibandingkan model pendahulunya, RT-1.

Karena memiliki basis pengetahuan yang lebih lengkap dan bisa “belajar sendiri”, maka robot memiliki kemampuan yang lebih baik dalam memahami konsep visual-semantik dan kemampuan kontrol robotik.

Sebagai contoh, robot perlu mengenali sampah, lalu mengambil, dan membuangnya.

Secara detail, model AI Google bernama RT-2 ini memiliki beberapa kemampuan mumpuni, di antaranya:

Memahami perintah berbasis teks maupun visual, sehingga lebih mampu beradaptasi dengan tugas-tugas baru tanpa pelatihan khusus.
RT-2 memungkinkan robot menggunakan pengetahuan dari web sehingga dapat mengambil keputusan mandiri berdasar pengetahuan tersebut.
Versi baru ini juga mampu merespons perintah pengguna dengan penalaran sederhana.

AI Multimodal Robotik

Konvergensi Cepat AI & Robotika

Google telah membuat langkah penting dalam menciptakan robot serbaguna yang bisa beradaptasi dengan berbagai situasi.

Hal ini menunjukkan komitmen Google dalam mendorong perkembangan kecerdasan buatan dan aplikasinya dalam robotika.

Bisa dikatakan saat ini Anda memasuki era baru dalam robotika dengan kombinasi visi, bahasa, dan tindakan yang diwujudkan oleh RT-2.

Apalagi saat ini hampir seluruh industri di dunia telah menggunakan bantuan AI dalam menjalankan aktivitasnya. Contohnya seperti Harvard Menggunakan Chatbot AI untuk Mendukung Pembelajaran Mahasiswa.

Maka tidak heran jika di masa depan, dunia bisnis dan digital marketing bisa berkembang lebih cepat lagi dengan implementasi dan pemanfaatan kemampuan model AI RT-2 dari Google, misalnya:

1. Otomatisasi Proses Logistik

Robot cerdas mampu menavigasi gudang, mengidentifikasi produk, hingga menyusun barang secara efisien.

2. Customer Service dan Pengalaman Pelanggan

Robot AI sudah lebih mampu memahami konteks visual dan bahasa yang digunakan sebagai asisten virtual di toko fisik, memberikan arahan atau informasi produk kepada pelanggan.

Contohnya:

3. Pembuatan Konten Visual Berbasis Data Robotik

Data visual yang dikumpulkan robot bisa diolah menjadi insight berharga untuk pembuatan konten pemasaran berbasis data.

Contohnya:

4. Peningkatan Keamanan dan Pengawasan

Robot dengan kemampuan pengenalan objek canggih bisa membantu mengawasi area kerja, mendeteksi potensi bahaya, hingga mengambil tindakan preventif. Contohnya bisa Anda baca pada Hollo.AI yang mampu menangkal deepfake yang tidak sah.

Google Robotics Transformer 2 (RT-2) bukan sekadar model AI baru, melainkan fondasi baru bagi pengembangan teknologi robot masa depan yang mampu memahami bahasa, gambar, dan konteks secara bersamaan.

Selain itu, karena mampu belajar dan beradaptasi dari data umum, bukan sekadar program khusus, robot di masa depan seperti RT-2 ini akan lebih mampu menjalankan perintah kompleks di lingkungan nyata.