Tekno

Meta Luncurkan Llama 3.2: Model AI Multimodal yang Bersaing dengan GPT-4o Mini

Meta, perusahaan induk Facebook, Instagram, dan WhatsApp, baru-baru ini meluncurkan model bahasa besar (LLM) terbarunya, Llama 3.2, dalam acara Meta Connect. Model AI ini hadir sebagai pesaing serius bagi GPT-4o Mini milik OpenAI yang diluncurkan pada bulan Juli.

Meta Berusaha Kejar Ketertinggalan dalam Perlombaan AI Global

Mark Zuckerberg, CEO Meta, menyatakan bahwa Llama 3.2 telah mengalami kemajuan signifikan sejak tahun 2023 dan diklaim setara dengan GPT-4o Mini dalam kemampuan mengenali gambar dan memahami visual. Ia juga menegaskan bahwa Llama 3.2 unggul dari model AI open-source lainnya seperti Gemma milik Google dan Phi 3.5-mini milik Microsoft dalam berbagai aspek, seperti mengikuti instruksi, meringkas, menggunakan alat, dan menyusun ulang perintah. "Llama terus berkembang dengan cepat, membuka banyak kemungkinan," ujar Zuckerberg.

Peluncuran Llama 3.2 mencerminkan upaya Meta untuk mengejar ketertinggalan dalam perlombaan AI global. Pasalnya, pengembang AI lainnya, seperti OpenAI dan Google, telah merilis model AI multimodal sejak tahun lalu. Llama 3.2 hadir sebagai model multimodal yang dapat memahami gambar dan teks, membuka peluang baru bagi berbagai aplikasi yang membutuhkan pemahaman visual. "Llama 3.2 adalah model multimodal sumber terbuka pertama kami," ujar Zuckerberg dalam pidato pembukaannya di Meta Connect.

Fitur Unggulan Llama 3.2:

Pemahaman Gambar

Llama 3.2 dengan parameter 11B dan 90B mampu memahami diagram dan grafik, memberikan keterangan pada gambar, dan menentukan objek dari deskripsi bahasa alami. Misalnya, pengguna dapat bertanya pada bulan mana perusahaan mengalami penjualan terbaik, dan model akan memberikan jawaban berdasarkan grafik yang tersedia. Model dengan parameter lebih besar juga dapat mengekstrak detail dari gambar untuk membuat teks.

Open Source

Seperti pendahulunya, Llama 3.2 tersedia secara open-source, memungkinkan pengembang untuk menggunakannya secara bebas dan gratis.

Ukuran Model

Llama 3.2 hadir dalam dua versi: model kecil dengan 11 miliar parameter dan model sedang dengan 90 miliar parameter. Model dengan parameter lebih tinggi umumnya lebih akurat dan mampu menangani tugas yang lebih kompleks.

Panjang Konteks

Llama 3.2 memiliki panjang konteks 128.000 token, memungkinkan pengguna untuk memasukkan teks yang cukup banyak (setara dengan ratusan halaman buku teks).

Aksesibilitas:

Model Llama 3.2 tersedia untuk diunduh di llama.com, Hugging Face, dan platform mitra Meta.