2023 fue un año preocupante para muchos en nuestro planeta: guerras, violencia, desplazamientos de población, desastres, extremismo, mayores costos de vida y pobreza. Las personas que trabajan en nuestra industria tuvimos mucha suerte, algunos de nosotros nos sentimos energizados por el emocionante tornado GenerativeAI. Así como HFT transformó el vocabulario de los mercados de capitales en la década de 2000 y la digitalización transformó el vocabulario de los servicios bancarios y financieros en la década de 2010, GenAI nos ha traído un nuevo léxico de IA, aunque a un ritmo bastante rápido.
Con él, nos topamos con muchos términos que apenas se utilizan en 2022 pero que hoy tienen significados nuevos o muy diferentes. Yo y muchos otros en Servicios Financieros los usamos todos los días. Si eres uno de los pocos desafortunados, ¡aquí tienes un repaso rápido de mis tres favoritos!
Término 1: Base de datos de vectores
La llamada base de datos vectorial se ha convertido en el núcleo de muchas pilas de GenAI como una forma de mejorar la calidad de las respuestas a las preguntas. Las alternativas, como la adaptación de modelos de lenguaje grandes (LLM) sin bases de datos, son costosas y conllevan riesgos y costos de cumplimiento. Una base de datos vectorial captura información empresarial patentada, aporta rentabilidad y proporciona control comparativo. Las empresas de servicios financieros ciertamente están haciendo cola para utilizar bases de datos vectoriales.
Irónicamente, en las finanzas, los vectores han sido los componentes básicos del álgebra matricial que domina el comercio y la gestión de riesgos durante años. Este tipo de almacenamiento de datos «vectoriales» y matriciales también existe desde hace décadas, generalmente en bases de datos en columnas o como tablas o marcos de datos utilizados en lenguajes como Python (Pandas), R, MATLAB y SAS. Cuando se recuperan y utilizan, por ejemplo, como series de tiempo financieras y datos de panel, junto con técnicas como la regresión lineal y las series de tiempo, impulsan el análisis predictivo, la detección de anomalías y la econometría. También ayudan con las pruebas retrospectivas, especialmente en operaciones, gestión de carteras y estrategias de riesgo. Si bien los mercados de capitales (front y middle office) soportaron la carga del álgebra matricial, los casos de uso cada vez más centrados en el análisis, como marketing, detección de fraude y digitalización, generalmente adoptaron la ciencia de datos y los vectores en las instituciones financieras.
Por eso me fascinó cuando un antiguo colega se puso a trabajar para lanzar una «base de datos vectorial» en junio de 2021.
Resolver problemas complejos con bases de datos vectoriales. ChatGPT anterior a marzo de 2022 me llamó la atención porque resaltaba tipos de vectores muy específicos (incrustaciones de vectores) que codificaban vectores de navegación fácilmente buscables a partir de información estructurada como palabras, imágenes, etc. Los tipos de incrustación se elevaron a vehículos esenciales para gestionar el significado semántico. La mayoría de las veces, las tiendas son bases de datos vectoriales, de las cuales existen muchas en la actualidad. Ya impulsan aplicaciones de servicios financieros y mercados de capitales, en su mayoría casos de uso de procesamiento de lenguaje natural, como resumir documentos legales e informes financieros u obtener opiniones de las redes sociales y las noticias. Sin embargo, están abordando aplicaciones más complejas, aumentando los enfoques comerciales y de gestión de riesgos, por ejemplo, a menudo combinados con estadísticas y aprendizaje automático.
Por cierto, la empresa a la que se unió mi ex colega se convirtió en un unicornio GenAI, valorado en unos saludables 750 millones de dólares. ¡Buen trabajo si puedes!
Término 2: RAGalias Recuperación Agregar Generación
RAG apenas estaba en boca de nadie en la primavera de 2023, al menos RAG en el sentido de «Generación Aumentada de Recuperación». Las estadísticas de búsqueda de Google se aceleraron a partir de julio de 2023, y en el otoño/otoño, RAG estaba en todas partes, el enfoque líder sobre cómo las bases de datos vectoriales ayudan a domesticar a los «loros estocásticos» del modelo de lenguaje grande. Por un lado, RAG reúne canales para suministrar flujos de trabajo de datos empresariales y, por otro, ayuda a las empresas financieras a reducir las alucinaciones y adaptar los procesos internos (y externos) de gestión de riesgos y cumplimiento de la IA.
Hay muchos tipos de tuberías RAG y pueden parecer terriblemente complejas. Sin embargo, piense en RAG simplemente como una ruta de datos entre consultas, sus datos comerciales y modelos de lenguaje grandes. Para obtener más información y ver cómo afecta las finanzas, lea mi blog finextra o mire este excelente webcast que resume las opciones de gestión de riesgos de RAG. Si está comenzando a implementar en cualquier etapa, probablemente explorará entornos «RAG» como LangChain y LangChain.
LlamaIndex.
Periodo 3: alucinaciones
Utilicé el término «alucinaciones» en mi apartado anterior, lo planteé como un problema resuelto por RAG y, a su vez, por las bases de datos vectoriales. Con GenAI, las alucinaciones ya no son simples desencadenantes de una creatividad que estimula la mente, como en el caso de la banda Sergeant Pepper’s Lonely Hearts Club Band de The Beatles, inspirada en las drogas, o de Good Vibrations de los Beachboys. No son la protección chamánica de los sueños que practican muchos pueblos, como los chukchi del este de Siberia, ni lo son las actividades físicas que utilizan técnicas que alteran la mente, como el yoga, los masajes y el sexo tántrico. La palabra «alucinación» ahora también se aplica a los LLM que navegan por información a la que los modelos no han accedido, o información que hace un mal uso de la información existente. Se hizo muy evidente, muy rápidamente, que ChatGPT, Bard y sistemas similares tendían a producir respuestas «alucinatorias», lo que planteaba un riesgo cuando se producían acciones mal informadas.
Aquí está el recorrido. El inversor en IA Marc Andreessen sugiere que, si bien la mayoría de las personas ven las alucinaciones como un error, pueden ser útiles como funcionarios cuando la IA se utiliza como creadores, sugerentes e inventores. Como ayuda para la lluvia de ideas, los inventos inventados pueden estimular la creatividad humana. Por ejemplo, Andreessen destaca cómo los abogados están utilizando las sugerencias «sembradas» de AI durante la preparación de casos para imaginar nuevas estrategias legales. En los servicios financieros, los operadores de Wall Street están utilizando inteligencia artificial creativa y bases de datos vectoriales para encontrar oportunidades comerciales cuando las masas hacen zag.
Independientemente de lo que pienses sobre GenAI, ¡definitivamente nos ha traído un léxico nuevo y maravilloso!