Meta ha anunciado el lanzamiento de Llama 3.1, una IA de código abierto que, según la compañía, es capaz de competir con modelos de IA de última generación como GPT-4o.

El modelo más potente de inteligencia artificial (IA) de código abierto creado por la empresa y entrenado por los chips informáticos del fabricante de semiconductores Nvidia.

Según Meta, hasta hoy, los grandes modelos de lenguaje de código abierto no alcanzaban el nivel de sus contrapartes de código cerrado en términos de características y rendimiento. Hoy, damos inicio a una nueva era con el código abierto liderando el camino presentando Llama 3.1 405B, que creemos que es el modelo de lenguaje a gran escala de código abierto más potente hasta la fecha. Con más de 300 millones de descargas totales de todas las versiones de Llama hasta el momento, apenas estamos comenzando.

Presentamos Llama 3.1

Llama 3.1 405B es el primer modelo de código abierto que compite con los principales modelos de IA en lo que respecta a las funciones más avanzadas de conocimientos generales, capacidad de conducción, matemáticas, uso de herramientas y traducción multilingüe. Con el lanzamiento del modelo 405B, estamos impulsando la innovación, con oportunidades de crecimiento y explotación sin precedentes. Creemos que la última generación de Llama dará rienda suelta a nuevas aplicaciones y paradigmas de modelización, incluida la generación de datos sintéticos para permitir la mejora y el entrenamiento de modelos más pequeños, así como la destilación de modelos, una capacidad que nunca se ha logrado a esta escala en código abierto.

Síntesis

  • Meta apuesta por una IA de código abierto. Te compartimos la carta de Mark Zuckerberg en la que explica por qué el código abierto es bueno para Meta, los desarrolladores y el mundo.
  • Nuestros modelos más recientes expanden la longitud de contexto a 128K, añaden soporte en ocho idiomas e incluyen el Llama 3.1 405B – el primer modelo de IA de código abierto de última generación.
  • Llama 3.1 405B es único en su clase, con una flexibilidad y un control inigualables y unas funciones de última generación que rivalizan con los mejores modelos de código cerrado. Nuestro nuevo modelo permitirá a la comunidad habilitar nuevos flujos de trabajo, como la generación de datos sintéticos y la destilación de modelos.
  • Seguimos desarrollando Llama para convertirlo en un sistema, proporcionando más componentes que funcionen con el modelo, incluido un sistema de referencia. Queremos empoderar a los desarrolladores con herramientas para crear sus propios agentes personalizados y nuevos tipos de comportamiento de los agentes. Estamos reforzando esto con nuevas herramientas de seguridad, como Llama Guard 3 y Prompt Guard, para ayudar a construir de forma responsable. También estamos lanzando una solicitud de comentarios sobre la API Llama Stack, una interfaz estándar que esperamos facilite a los proyectos de terceros el aprovechamiento de los modelos Llama.
  • El ecosistema está configurado y listo para funcionar con más de 25 socios, entre ellos AWS, NVIDIA, Databricks, Groq, Dell, Azure y Google Cloud, que ofrecen servicios desde el primer día.
  • Prueba Llama 3.1 405B en Estados Unidos en WhatsApp y meta.ai haciendo una pregunta compleja sobre matemáticas o codificación.

Por admin

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *