Hace dos semanas, en la Product Conf, Oji nos dio una de las charlas más completas que he oído recientemente sobre la evolución y el futuro de la inteligencia artificial (IA). Su presentación comenzó con un repaso exhaustivo de los últimos 10-15 años de desarrollo en IA, haciendo especial mención al influyente paper "Attention Is All You Need". Este documento marcó un hito en la historia de la IA al introducir el mecanismo de atención, que ha revolucionado la complejidad de estos modelos en muchos campos.
Algunos de los casos de uso que comentó y que más me llamaron la atención fueron la identificación de patrones de proteínas a través de redes neuronales, simulaciones para comprender mejor la fusión nuclear o incluso qué tipo de desenlaces pueden tener distintas decisiones en la guerra. Todo esto ilustra cómo la IA puede integrarse en áreas que parecían inalcanzables hace unos años. Estos temas, aunque distantes del uso cotidiano de la generación de texto, muestran el vasto potencial de la IA y su capacidad para transformar múltiples industrias.
A partir de ahí, la conversación se centró en cómo integrar la inteligencia artificial dentro de los productos. Es un tema que se ha tratado mucho en redes sociales, por lo que me gustaría compartir los dos enfoques que más valor me han aportado a la hora de entender cómo la inteligencia artificial va a cambiar cómo hacemos productos digitales.
IA en el core del producto vs. IA en el edge del producto
Uno de los temas clave en la implementación de la IA en productos digitales es decidir si la IA se integrará en el núcleo (core) del producto o en la periferia (edge). La diferencia principal radica en cómo se incorpora la IA en la estructura y funcionalidad del producto. Al integrar la IA en el núcleo del producto, te expones a modificar cómo los usuarios interactúan con funcionalidades que ya estaban en su día a día. Por otro lado, si integras la IA de forma periférica, la experiencia se vuelve mediocre. Introduces latencias innecesarias, se producen errores y, por lo general, el producto se ve inmaduro.
No todo con IA es mejor.
Integración en el Edge: Notion
Un ejemplo de integración en el edge es Notion. Notion ha implementado un prompt dentro de su producto, permitiendo a los usuarios pedirle tareas directamente. Cuando lo vi por primera vez, me pareció súper potente. Poder acceder a todo el contenido de tu espacio para poder preguntar y crear otros artefactos parecía magia.
Sin embargo, este enfoque ha demostrado ser problemático. Al introducir un prompt intermediario entre el usuario y el producto, la experiencia del usuario se ralentiza. Esto se debe a que cada solicitud debe esperar una respuesta de OpenAI, lo que añade latencia y puede frustrar a los usuarios. Este método de integración puede ser útil para ciertas aplicaciones, pero no proporciona la experiencia fluida y rápida que los usuarios esperan.
Además, muchas de las funcionalidades se han vuelto peores. El formateo del texto, que a través de atajos está muy logrado, a través de esta IA se vuelve lento. La generación de contenido también se ha visto afectada, apareciendo párrafos repetidos y no es capaz de encontrar información que para un usuario resultaría obvia. En resumen, no ha sido una buena decisión.
Integración en el Core: Typeform
En contraste, Typeform ha hecho un buen trabajo a la hora de integrar la IA en el núcleo del producto. Typeform ha pasado de ser un producto basado en formularios a uno basado en chat, una transformación profunda que ha redefinido su identidad. Este cambio no solo afectó la interfaz del usuario, sino que también requirió una reestructuración significativa del equipo de desarrollo. El seguimiento del código, la operatividad de los modelos de IA y la adaptación a nuevas metodologías de desarrollo fueron claves para el éxito de esta integración.
Al integrar la IA en el núcleo del producto, Typeform logró una experiencia de usuario mucho más fluida y optimizada. Esta integración profunda permite que la IA funcione de manera más eficiente y efectiva, proporcionando respuestas rápidas y precisas sin la latencia asociada con las solicitudes externas.
Modelos doctores vs. modelos mayordomos
El siguiente tema a abordar es la diferencia entre el uso de grandes modelos de IA y modelos más sencillos, y cómo esta elección impacta la eficiencia y los costes. El artículo de Samuel Gil de esta semana aborda el tema de forma más completa, pero creo que es importante incluir en el análisis esta diferencia. Hay dos opciones: crear modelos que utilicen toda la información disponible a nivel global (OpenAI y Gemini) para poder dar respuestas completas a cualquier tipo de problema, o crear modelos más específicos y livianos que sean muy buenos haciendo una cosa específica.
Modelos mayordomos: Eficiencia y aplicabilidad
Los modelos sencillos tienen la ventaja de ser más eficientes y de menor latencia. Estos modelos pueden implementarse fácilmente en dispositivos como iPhones, lo que permite respuestas rápidas y un uso efectivo de los recursos. Estos modelos no necesitan tener una complejidad muy elevada para ser efectivos. Pueden manejar personalizaciones y responder a tareas técnicas de manera eficiente, lo que los hace ideales para aplicaciones contextuales donde la velocidad y la eficiencia son cruciales. Además, por ser ligeros, pueden ejecutarse directamente en dispositivos móviles.
Modelos doctores: Especificidad y actualización
Por otro lado, los modelos avanzados, como ChatGPT y Gemini, son comparables a tener múltiples programas con información muy específica y actualizada. El problema que tienen estos modelos, aunque extremadamente potentes, es que son costosos de entrenar y mantener. Además, no siempre tienen toda la información necesaria para tareas sencillas, lo que puede limitar su aplicabilidad en ciertas situaciones. La alta especificidad y actualización de estos modelos los hace ideales para tareas complejas que requieren un conocimiento amplio de diversos temas.
La inteligencia artificial está transformando de manera radical la forma en que desarrollamos y utilizamos productos digitales. La decisión entre integrar la IA en el núcleo del producto o en su periferia tiene implicaciones profundas en la experiencia del usuario y en la eficacia del producto. Ejemplos como Notion y Typeform ilustran los desafíos y beneficios de cada enfoque.
Además, la elección entre utilizar grandes modelos de IA o modelos más específicos y ligeros impacta significativamente la eficiencia y los costos. Ambos enfoques tienen sus ventajas y desventajas, y la clave está en encontrar el equilibrio adecuado para las necesidades específicas del producto y sus usuarios.
En última instancia, la integración exitosa de la IA requiere una comprensión profunda de las capacidades y limitaciones de los modelos disponibles, así como una planificación cuidadosa para asegurar que la tecnología se alinee con los objetivos del producto y las expectativas de los usuarios. La IA no es una solución mágica para todos los problemas, pero cuando se implementa correctamente, tiene el potencial de revolucionar industrias enteras y mejorar significativamente la forma en que interactuamos con la tecnología.