Presentamos modelos de lenguaje pequeño, la solución de inteligencia artificial definitiva para la industria publicitaria

Las agencias y marcas, impulsadas por decisiones comerciales estratégicas de adoptar inteligencia artificial creativa, utilizan cada vez más modelos de lenguaje pequeño para soluciones más basadas en tareas.

«A medida que trabajamos con clientes, planeamos utilizar (SLM) porque el conjunto de datos (para capacitación) es más pequeño y sus tareas se definen según las necesidades de una marca en particular», dijo Michael Olaye, vicepresidente senior y director general de estrategia. e innovación en R/GA, los SLM comenzaron a probarse a principios de enero.

El interés en los SLM se disparó en noviembre pasado cuando Microsoft anunció el lanzamiento de su propio SLM, el Phi-2. En su última convocatoria de resultados, Microsoft reveló que sus clientes, incluidos Anker, Ashley, AT&T, EY y Thomson Reuters, están explorando Phi para sus aplicaciones de inteligencia artificial.

El auge de los SML representa un alejamiento de los grandes lenguajes modelo, costosos y que consumen muchos recursos, hacia alternativas más eficientes y adaptables, lo que facilita a las agencias y marcas la ejecución de iniciativas basadas en tareas.

«La clave para los anunciantes en 2024 es reconocer (los SLM) como un campo emergente de IA», dijo Cristina Lawrence, directora ejecutiva de experiencia de contenido y consumidores de Razorfish. «Si se hacen descubrimientos que revelen casos de uso valiosos, pueden mejorar la eficiencia y reducir los costos».

Esto es lo que necesita saber sobre los SLM.

¿Qué son los SLM?

Los SML son versiones simplificadas de los LLM que son más fáciles de entrenar con conjuntos de datos más ajustados, reducen las respuestas inapropiadas y brindan resultados más relevantes a un costo menor.

«Un LLM se capacita en un conjunto vasto y extenso de datos disponibles públicamente que cubren una gran cantidad de información», dijo Lawrence. «Pero especializar un modelo de IA en reconocimiento de marca o conjuntos de datos instructivos puede hacer que los modelos estén más enfocados y proporcionar una experiencia de usuario más específica. Incluso capacitar a un LLM con la potencia de procesamiento necesaria puede ser costoso, pero cuando se reduce el alcance de los datos, se vuelve más accesible para que las empresas experimenten».