Presentamos modelos de lenguaje pequeño, la solución de inteligencia artificial definitiva para la industria publicitaria

Por ejemplo, se podría utilizar un SLM dedicado para generar activos creativos dinámicos en tiempo real, centrándose únicamente en esta función específica. Esto contrasta con los LLM multimodales como Copilot de Microsoft, que están capacitados para realizar múltiples tareas, como escribir código o crear texto a imagen.

Hay un puñado de SLM en el mercado, incluidos Phi 2 y Orca 2 de Microsoft (que utiliza Llama 2 de código abierto de Meta), T5-Small y BERT de Google, y GPT-Neo, la versión minimizada de GPT de OpenAI.

Estos modelos también pueden existir localmente, como en un dispositivo móvil, lo que está impulsando el interés actual en SLM, dijo Lawrence.

Y aunque capacitar a un LLM puede llevar meses, a veces años, según Olay, puedes capacitar a un SLM en una semana.

¿Cuáles son sus casos de uso?

AT&T comenzó a utilizar SLM a finales del año pasado para tareas más simples que requieren un razonamiento menos complejo, como el resumen y la clasificación de subdocumentos en sus partes de preguntas y respuestas.

«Si bien hay ahorros de costos, el enfoque principal fue la velocidad, lo cual es importante si se usa para crear metadatos en, digamos, cientos de miles de documentos», dijo Austin.

Si bien las marcas de R/GA deben explorar los SLM para campañas orientadas al consumidor, limitadas por cuestiones de derechos de autor y privacidad, algunas marcas están utilizando esta herramienta para agilizar los procesos internos.

Por ejemplo, una marca, utilizando un chatbot basado en SML entrenado en un pequeño conjunto de activos de esa marca, simplificó su proceso legal para ayudar a otras empresas y terceros que, según Olay, no compartirían las especificaciones de la marca.

«El equipo de asuntos legales y comerciales (de Brands) recibe muchas llamadas de personas que preguntan: ‘¿Puedo usar este activo?’ ‘¿Es esta la copia correcta?'», dijo. «Entramos en un proceso para automatizar eso. Ahora, el robot puede evitar muchas de las preguntas que normalmente se hacen para hablar por teléfono legalmente».

¿Cuáles son los límites??

La tecnología está todavía en su infancia. Aunque los SLM alivian las alucinaciones hasta cierto punto, aún pueden ocurrir, aunque con más frecuencia que los LLM, dijo Olay.

Aunque los datos limitados aumentan la especificidad de los SLM, su información completa es limitada, lo que dificulta la ejecución de tareas complejas en comparación con los LLM multimodales.

«Hay muchas incógnitas sobre los SLM y dónde encajan exactamente», dijo Lawrence.

Los SLM son de código abierto, lo que plantea preocupaciones sobre la privacidad y la seguridad de los datos y puede obstaculizar su adopción generalizada.

«El uso responsable de la IA significa comprender los riesgos y navegarlos de forma segura, lo que incluye compartir sólo información que sea segura», dijo Lawrence. «El hecho de que un modelo esté personalizado para entrenarse con datos específicos no significa que no deba pasar por las mismas salvaguardas, por lo que se debe aplicar el mismo enfoque de uso responsable independientemente del tamaño del modelo».