Google Gemini, Platform Kecerdasan Buatan Generatif Baru

Read Time:5 Minute, 3 Second

dianrakyat.co.id Tekno – Google baru-baru ini membuat gebrakan besar dengan platform AI generatif barunya, Gemini. Apa itu Gemini? Dikutip dari Techcrunch, Gemini adalah yang terbaru dalam keluarga kecerdasan buatan yang dikembangkan oleh DeepMind, laboratorium penelitian kecerdasan buatan Google, dan Google Research. Muncul dalam tiga versi: – Gemini Ultra, model Gemini terbesar – Gemini Pro, versi model Gemini yang “lebih ringan” – Gemini Nano, model lebih kecil yang berfungsi pada perangkat seluler seperti Pixel 8 Pro. Menjadi “multimodal asli”, yaitu mampu bekerja dan menggunakan teks. Mereka melatih dan menyempurnakan berbagai audio, gambar, video, banyak kode sumber, dan teks dalam berbagai bahasa. Hal ini membedakan Gemini dari model lain, seperti model bahasa besar Google, LaMDA, yang hanya dilatih pada data teks. LaMDA tidak dapat memahami atau mereproduksi apa pun selain teks (misalnya esai, draf email, dll.), tetapi tidak demikian halnya dengan model Gemini. Kemampuan mereka dalam memahami gambar, audio, dan metode lainnya masih terbatas, namun lebih baik daripada tidak sama sekali. Apa perbedaan antara Bard dan Gemini, mereka menegaskan kembali kurangnya keterampilan branding dan gagal menjelaskan bahwa Gemini terpisah dan berbeda dari Bard. Bard hanyalah sebuah antarmuka untuk beberapa model Gemini, anggap saja sebagai aplikasi atau klien untuk Gemini dan model kecerdasan buatan (gen AI) lainnya. Gemini, di sisi lain, adalah keluarga templat yang bukan merupakan aplikasi atau antarmuka pengguna. Tidak ada pengalaman Gemini yang gratis, dan mungkin tidak akan pernah ada. Dibandingkan dengan produk OpenAI, Bard memiliki ChatGPT, aplikasi kecerdasan buatan ucapan OpenAI yang populer, dan Gemini setara dengan GPT-3.5 atau 4 model bahasa untuk ChatGPT. Imagen -2 adalah model transisi teks ke gambar yang mungkin sesuai atau tidak dengan strategi AI perusahaan secara keseluruhan. Jangan khawatir, bukan hanya Anda yang bingung dengan hal ini! Apa yang bisa dilakukan Gemini? Model Gemini sangat serbaguna sehingga pada dasarnya mereka dapat melakukan banyak tugas, mulai dari mengetik kata, mengambil foto dan video, hingga membuat karya seni. Beberapa dari kemampuan ini berhasil mencapai tahap produk (lebih lanjut tentang itu nanti), tetapi Google kecewa dengan peluncuran pertama Bard dalam waktu yang tidak terlalu lama, meskipun menjanjikan semuanya dan lebih banyak lagi. Baru-baru ini, mereka membuat heboh dengan video yang memamerkan kemampuan Gemini, yang ternyata jauh lebih rumit dan ambisius. Jelas bahwa Gemini ada dalam beberapa bentuk, tetapi dalam bentuk yang agak terbatas. Namun jika Google cukup setia pada klaimnya, Google dapat melakukannya setelah peluncuran berbagai model Gemini: Gemini Ultra Hanya dalam jumlah terbatas. “Pilih pengguna” aplikasi dan layanan Google tertentu yang memiliki akses ke Gemini Ultra, model “dasar” yang menjadi dasar model lainnya. Hal ini tidak akan berubah pada akhir tahun ini, ketika Google berencana meluncurkan model terbesarnya dalam jangkauan yang lebih luas. Sebagian besar informasi tentang Ultra berasal dari demo produk yang dijalankan oleh Google, jadi pasti ada keraguan ketika Google mengatakan bahwa Gemini Ultra dapat digunakan untuk menyelesaikan tugas fisika, menyelesaikan langkah-langkah, dan banyak lagi. tugas langkah demi langkah. – Kerjakan soal di lembar kerja selangkah demi selangkah dan soroti kesalahan dalam jawabannya. Gemini Ultra dapat digunakan untuk tugas lain, seperti mengidentifikasi makalah ilmiah yang berkaitan dengan suatu masalah, mengekstraksi informasi dari makalah tersebut, dan “memperbarui” grafik ini dengan rumus yang diperlukan untuk membuatnya kembali dalam perspektif data baru. Seperti disebutkan sebelumnya, pembuatan gambar didukung. Namun menurut pernyataan Google, fitur ini tidak akan diterapkan pada model versi produk karena program seperti ChatGPT memiliki mekanisme yang lebih kompleks dalam cara membuat gambar. Namun dibandingkan dengan program seperti ChatGPT yang menggunakan generator gambar seperti DALL-E 3.Gemini ProGemini Pro, Gemini membuat gambar “secara alami” tanpa langkah perantara apa pun. Namun, potensinya dalam situasi membingungkan bergantung pada tempat penggunaannya. Di Bard, yang awalnya merilis Gemini Pro dalam bentuk teks saja, Google mencatat bahwa model tersebut meningkatkan pemikiran, perencanaan, dan pemahaman dibandingkan dengan LaMDA. Studi independen yang dilakukan oleh para peneliti di Carnegie Mellon dan BerriAI menemukan bahwa Gemini Pro mengungguli OpenAI GPT-3.5 dalam menangani sirkuit penalaran yang lebih panjang dan kompleks, tetapi seperti semua model bahasa besar, Gemini Pro mengalami kesulitan, terutama dalam bidang matematika. berisi banyak digit, dan pengguna menemukan banyak contoh kesalahan penalaran dan kesalahan faktual. Bahkan pertanyaan sederhana seperti kapan terakhir kali seorang model memenangkan Oscar pun bisa membuat kesalahan sederhana. Google telah menjanjikan perbaikan, namun tidak jelas kapan perbaikan tersebut akan diterapkan. Gemini Pro tersedia melalui API di Vertex AI, platform pengembangan kecerdasan buatan yang dikelola sepenuhnya oleh Google. Sebagai titik akhir tambahan, Gemini Pro Vision dapat memproses teks dan gambar, seperti gambar dan video, serta menghasilkan teks dan model OpenAI GPT-4 dengan Vision. Dengan Vertex AI, pengembang dapat mengadaptasi Gemini Pro ke berbagai konteks dan proses penggunaan. pengaturan atau “pemakaman”. Gemini Pro juga dapat terhubung ke API pihak ketiga eksternal untuk melakukan tindakan tertentu Pada “awal 2024”, pelanggan Vertex akan dapat menggunakan Gemini Pro untuk menjalankan agen suara dan agen obrolan percakapan (misalnya, chatbots). Selain itu, Gemini Pro akan menjadi opsi untuk mengelola kemampuan Vertex AI dalam menghasilkan ringkasan pencarian, rekomendasi, dan respons dengan menarik informasi dari dokumen lintas modal (seperti PDF dan gambar) dari berbagai sumber (seperti OneDrive, Salesforce, dll.) . Untuk menjawab pertanyaan tersebut, Anda dapat menggunakan Gemini Pro di AI Studio, alat berbasis web Google untuk pengembang aplikasi dan platform, untuk membuat perintah dan obrolan terstruktur gratis. Pengembang dapat mengakses titik akhir Gemini Pro dan Gemini Pro Vision untuk memberikan instruksi pemodelan dan pemodelan, menyesuaikan suhu model untuk mengontrol kreativitas dan peristiwa keluaran, dan mengonfigurasi pengaturan keamanan. Sebagai versi model Gemini Pro dan Ultra yang lebih kecil dan lebih canggih, Gemini NanoGemini Nano cukup efisien untuk dijalankan langsung di (beberapa) ponsel daripada mengirim tugas ke server di suatu tempat. Hingga saat ini, Gemini Nano digunakan untuk mendukung dua fitur pada Pixel 8 Pro: Ketuk di aplikasi Perekam dan Jawaban Cerdas di aplikasi Perekam, yang memungkinkan pengguna merekam dan menyalin audio dengan mengetuk satu tombol, dan Gemini- bertenaga. ringkasan rekaman percakapan, percakapan rapat, presentasi, dan rekaman lainnya. Pengguna dapat mengakses ringkasan bahkan tanpa sinyal atau koneksi Wi-Fi. Ada yang menarik dari aplikasi AirAsia MOVE. AirAsia MOVE adalah aplikasi seluler AirAsia dengan berbagai fitur menarik yang memudahkan perencanaan perjalanan pengguna. dianrakyat.co.id.co.id 5 Juli 2024