Meta lanza su mayor modelo de IA abierta hasta la fecha

Meta ha dado un nuevo paso en el ámbito de la inteligencia artificial con el lanzamiento de su modelo de IA más grande hasta ahora, el Llama 3.1 405B. Con 405 mil millones de parámetros, este modelo promete revolucionar el campo de la IA abierta, posicionándose como uno de los más avanzados disponibles en la actualidad.

Llama 3.1 405B: Innovación y capacidad

Los parámetros en un modelo de IA son cruciales, ya que determinan su capacidad para resolver problemas complejos. Con 405 mil millones de parámetros, Llama 3.1 405B se sitúa entre los modelos abiertos más potentes de los últimos años. Entrenado con 16,000 GPUs Nvidia H100, utiliza técnicas de desarrollo y entrenamiento avanzadas, que, según Meta, lo hacen competitivo frente a modelos propietarios como GPT-4o de OpenAI y Claude 3.5 Sonnet de Anthropic.

Meta ha hecho que Llama 3.1 405B esté disponible tanto para descarga como para uso en plataformas en la nube como AWS, Azure y Google Cloud. Además, este modelo ya se utiliza en WhatsApp y Meta.ai, proporcionando experiencias de chatbot para usuarios en Estados Unidos.

Capacidades y aplicaciones

Llama 3.1 405B no es solo grande en tamaño, sino también en funcionalidades. Este modelo generativo de IA puede realizar diversas tareas, desde codificación y resolución de problemas matemáticos hasta la síntesis de documentos en ocho idiomas, incluyendo inglés, español, alemán y francés. Aunque es exclusivamente textual y no puede analizar imágenes, su versatilidad en el manejo de texto lo hace adecuado para una amplia gama de aplicaciones, como el análisis de archivos PDF y hojas de cálculo.

Meta está explorando la multimodalidad, es decir, la capacidad de reconocer y generar contenido en distintos formatos, como imágenes y vídeos. Aunque estos modelos aún no están listos para su lanzamiento, la empresa sigue avanzando en esta dirección.

Datos y entrenamiento

Para entrenar Llama 3.1 405B, Meta utilizó un conjunto de datos compuesto por 15 billones de tokens, equivalentes a 750 mil millones de palabras. Aunque no se trata de un conjunto de datos nuevo, Meta ha refinado sus procesos de curación y filtrado para mejorar la calidad de los datos utilizados. También se ha empleado datos sintéticos generados por otros modelos de IA para ajustar y perfeccionar Llama 3.1 405B, una práctica común entre los principales proveedores de IA.

Meta ha asegurado que ha equilibrado cuidadosamente los datos de entrenamiento, aunque no ha revelado detalles específicos sobre su origen. La transparencia en los datos de entrenamiento es un tema sensible, ya que puede involucrar cuestiones de propiedad intelectual y posibles demandas legales.

Ventana de contexto y herramientas

Una característica notable de Llama 3.1 405B es su amplia ventana de contexto de 128,000 tokens, permitiendo al modelo manejar textos largos y complejos con mayor eficacia. Esto es especialmente útil para tareas como la síntesis de textos extensos y la mejora de la coherencia en diálogos de chatbot.

Meta también ha lanzado versiones actualizadas de sus modelos más pequeños, Llama 3.1 8B y Llama 3.1 70B, que comparten esta amplia ventana de contexto. Estos modelos están diseñados para aplicaciones más generales, como la generación de código y la interacción con chatbots.

Además, todos los modelos Llama 3.1 pueden utilizar herramientas y aplicaciones de terceros para realizar tareas específicas. De forma predeterminada, están entrenados para usar Brave Search para consultas recientes, la API de Wolfram Alpha para preguntas de matemáticas y ciencias, y un intérprete de Python para validar código.

Ecosistema y licencias

Meta está fomentando el uso de datos sintéticos mediante la actualización de la licencia de Llama, permitiendo a los desarrolladores utilizar los outputs de los modelos Llama 3.1 para desarrollar sus propios modelos generativos de IA. Sin embargo, hay restricciones para los desarrolladores de aplicaciones con más de 700 millones de usuarios mensuales, que deben solicitar una licencia especial.

Para apoyar el ecosistema de Llama, Meta ha lanzado nuevas herramientas de seguridad y un «sistema de referencia» para facilitar su integración en aplicaciones. La empresa también está trabajando en Llama Stack, una API para herramientas que permite ajustar modelos, generar datos sintéticos y construir aplicaciones «agentes».

Visión de futuro

Mark Zuckerberg, CEO de Meta, ha expresado su visión de democratizar el acceso a herramientas y modelos de IA, asegurando que más desarrolladores en todo el mundo puedan beneficiarse de estas tecnologías. Esta estrategia incluye ofrecer herramientas de forma gratuita para fomentar un ecosistema, añadiendo gradualmente productos y servicios adicionales.

Meta está invirtiendo grandes sumas en estos modelos, lo que le permite reducir los precios de sus competidores y expandir su versión de la IA. Según Meta, los modelos Llama han sido descargados más de 300 millones de veces, y se han creado más de 20,000 modelos derivados.

Desafíos y sostenibilidad

Entrenar modelos tan grandes como Llama 3.1 405B implica desafíos significativos, especialmente en términos de consumo energético y estabilidad de la red eléctrica. Meta está trabajando para abordar estos problemas a medida que escala el entrenamiento de modelos aún más grandes en el futuro.

En resumen, el lanzamiento de Llama 3.1 405B marca un hito importante para Meta en su objetivo de convertirse en un líder en el campo de la IA generativa. Con su enfoque en la apertura y la colaboración, la empresa está bien posicionada para influir en el futuro de esta tecnología.

Redacción de Comunicación

Fecha

julio 30, 2024

Meta lanza su mayor modelo de IA abierta hasta la fecha

Llama 3.1 405B: Innovación y capacidad

También te interesará

¿Hay potencial en la publicidad en Threads?

3 tendencias de marketing que influirán en la industria del marketing de influenciadores