Meta baru-baru ini mengumumkan peluncuran Llama 3, model AI terbaru mereka yang menawarkan sejumlah keunggulan dibandingkan pendahulunya, Llama 2. Salah satu fitur yang menarik dari Llama 3 adalah ketersediaan dua model open source yang dapat diakses secara gratis oleh para developer, dengan parameter berbeda yaitu 8 miliar dan 70 miliar. Kedua model ini dapat diakses melalui semua penyedia cloud utama.
Perbedaan dengan Llama 2
Perbedaan paling mencolok antara Llama 2 dan Llama 3 terletak pada penskalaan. Versi terbesar Llama 2, yang dirilis tahun lalu, memiliki 70 miliar parameter. Sementara itu, versi terbesar Llama 3 yang akan datang diperkirakan akan memiliki lebih dari 400 miliar parameter.
Selain itu, Llama 2 dilatih dengan 2 triliun token, sedangkan versi terbesar Llama 3 memiliki lebih dari 15 triliun token. Ini menunjukkan peningkatan yang signifikan dalam kapasitas dan kompleksitas model.
(Tabel perbandingan Llama 3 versi 8B dan 70B. Sumber foto Website Meta)
Fokus Pengembangan
Salah satu fokus utama pengembangan Llama 3 adalah mengurangi penolakan palsu. Penolakan palsu terjadi ketika model AI menolak untuk menjawab perintah yang sebenarnya tidak berbahaya. Hal ini dapat mempengaruhi pengalaman pengguna secara negatif dan bahkan berpotensi berbahaya dalam beberapa konteks.
Meta telah mendengarkan masukan dari komunitas developer dan telah melakukan penyesuaian untuk memastikan bahwa Llama 3 memiliki kemungkinan yang lebih rendah untuk menolak menjawab perintah secara salah dibandingkan dengan Llama 2.
Evaluasi Keamanan
Meta juga telah melakukan evaluasi keamanan terhadap Llama 3 dengan menggunakan CyberSecEval, rangkaian evaluasi keamanan siber Meta. Hasil evaluasi menunjukkan bahwa Llama 3 berperilaku dalam kisaran yang sama atau lebih aman daripada model dengan kemampuan pengkodean yang setara dalam pengujian pengkodean tidak aman dan kegunaan penyerang dunia maya.
Meskipun belum ada keputusan akhir apakah model Llama 3 versi 400 miliar parameter akan dibuka sebagai open source karena masih dalam tahap pelatihan, Meta tetap mendesain Llama 3 dengan tujuan keterbukaan, inklusivitas, dan keberagaman penggunaan. Namun, risiko terkait dengan penggunaannya tetap harus diperhatikan.
Sebelum mengimplementasikan aplikasi model Llama 3, developer disarankan untuk melakukan pengujian keamanan dan penyetelan yang disesuaikan dengan aplikasi spesifik model tersebut.
Dalam kesimpulan, peluncuran Llama 3 menandai langkah maju dalam pengembangan kecerdasan buatan. Dengan penskalaan yang lebih cepat, kapasitas yang lebih besar, dan fokus pada keamanan dan keterbukaan, Llama 3 diharapkan dapat menjadi alat yang lebih berguna dan aman bagi para developer di berbagai bidang.