Sacándole el jugo a la inteligencia articial
Una guía básica, con ejemplos prácticos, para incrementar tu productividad y facilitar tus tareas diarias usando modelos de inteligencia artificial
Crecimiento en breve:
Aprovechar la IA en nuestra vida diaria, desde la creación de contenido hasta la automatización de tareas, es cada vez más sencillo gracias a los denominados modelos de lenguaje de gran tamaño (LLM por sus siglas en inglés).
Los LLM son modelos de aprendizaje automático capaces de entender y generar texto, audio e imágenes con alta precisión, lo que los convierte en herramientas poderosas para la traducción, la creación de contenido, la investigación, la programación y la atención al cliente, entre otras.
El secreto para sacar el máximo provecho de los LLM es el prompt o tarea que les asignas; te compartimos detalles sobre la ingeniería de prompts y consejos prácticos para estructurarlos de la mejor manera.
Anuncios parroquiales:
Esta entrada hace parte de nuestra serie sobre emprendimiento y liderazgo y está basada en diversos artículos académicos, así como en nuestra experiencia utilizando distintas herramientas de inteligencia artificial.
El acceso completo a esta publicación, como a todas las de los jueves y sábados, está reservado para miembros pagos. Si quieres acceder a la totalidad de esta entrada, así como a nuestro archivo de publicaciones (entre otros beneficios), te invitamos a hacerte miembro pago:
Ahora sí, a lo que vinimos:
Como ya lo hemos comentado en varias entradas, como en el bono del sábado pasado, la inteligencia artificial (IA) está transformando nuestro mundo a pasos agigantados, y los modelos de lenguaje de gran tamaño (LLM por sus siglas en inglés) están liderando esta revolución.
Desde la automatización de tareas hasta la creación de contenido innovador, la IA está abriendo un nuevo horizonte de posibilidades. Por ello, en esta entrada vamos a explorar el panorama actual de los LLM, analizar los cuatro modelos más populares (Gemini, ChatGPT, Claude y Llama) y discutir cómo podemos sacarles el máximo provecho en nuestro día a día.
Los gigantes del LLM: un análisis comparativo
Los LLM son modelos de aprendizaje automático capaces de entender y generar texto con una precisión asombrosa (para mayor contexto sobre la teoría y nacimiento de la llamada inteligencia artificial generativa y los fundamentos técnicos de este tipo de modelos puedes leer nuestro bonus sobre IA). A medida que estos modelos se vuelven cada vez más sofisticados, también se multiplican sus aplicaciones en diversos campos.
Y, aunque en principio la tecnología que los soporta parecía reservada para un par de grandes actores de la industria (léase Google y Microsoft, aunque este último a través de OpenAI), lo cierto es que, para el bienestar de todos, en lo que vamos de 2024 ya son varios los competidores que, como veremos, han logrado desafiar esta aparente supremacía.
Por simplicidad, a continuación daremos un vistazo a los cuatro principales LLM en el mercado, destacando sus ventajas y desventajas. Aún más, para aquellos que prefieren una evaluación objetiva y resumida, antes de entrar en el detalle, abajo encontrarán una tabla que condensa los resultados en diferentes pruebas de conocimiento y razonamiento para las últimas versiones (a la fecha de publicación de esta entrada) de los cuatro modelos analizados: ChatGPT, Claude, Gemini y Llama.

Ahora sí, con esto como punto de referencia, exploremos un poco más a fondo los pros y los contra de cada uno de estos modelos.
Gemini (Google): el gigante multi-modal
Gemini, desarrollado por Google, es uno de los LLM más poderosos del mercado. Su principal fortaleza radica en su capacidad multi-modal, es decir, que puede procesar y generar no sólo texto, sino también imágenes, audio y video. A esto se suma que ofrece la ventana de contexto más grande en el mercado que, en términos prácticos, representa la cantidad de información que el modelo puede incorporar en su proceso de generación de contenido.
Gemini se integra de forma nativa con otros servicios de Google, como la búsqueda, el asistente, el traductor, su plataforma para generar código de programación, el correo electrónico, entre otras, lo que le permite ofrecer una experiencia de usuario más completa.
Desempeño: Gemini destaca por su precisión en tareas de traducción, generación de código y escritura creativa. En pruebas de la comunidad, como el ELO arena, Gemini ha demostrado un desempeño superior a otros LLM en tareas que requieren razonamiento lógico y capacidad de resolución de problemas.
Comparación: en áreas específicas, como la capacidad de procesar información compleja o multimedia, Gemini 1.5 Pro sobresale por su límite de ventana de contexto de 1.5 millones de tókens y su capacidad para procesar información visual. Para más información sobre la capacidad, los invitamos a consultar la documentación oficial del modelo.
Ventajas: Gemini se distingue por su precisión, su velocidad de procesamiento, su capacidad de razonamiento y su integración con otros servicios de Google.
Desventajas: la principal limitación de Gemini es su dependencia a una conexión a Internet, lo que dificulta su uso en entornos sin conexión. Además, han sido varios los episodios en los que este modelo se ha visto envuelto en polémica por faltar a la verdad cuando se le pregunta por eventos históricos (y generar imágenes sobre ellos, como una famosa representación de los Padres de la Independencia de los Estados Unidos con otra raza o género al que tenían), aunque la empresa ha señalado estar trabajando arduamente para intentar minimizar este tipo de “alucinaciones”, otro ejemplo son las recomendaciones, a veces descabelladas, al buscar directamente en google.
ChatGPT (OpenAI): el líder en accesibilidad
ChatGPT, desarrollado por OpenAI y soportado por Microsoft, es uno de los LLM más conocidos y accesibles del mercado y, hay que decirlo, el primero en haber desplazado significativamente la frontera de conocimiento en este campo. Su interfaz fácil de usar y su capacidad para generar texto creativo lo han convertido en una herramienta popular para diversos fines.
Desempeño: ChatGPT destaca por su capacidad para generar texto creativo, como historias, poemas y guiones. En pruebas estandarizadas, ChatGPT ha demostrado un desempeño sólido, especialmente en tareas que requieren la comprensión y la generación de lenguaje natural, especialmente en texto (en imágenes aún tiene problemas, pero su modelo hermano Dall-E suele ser nuestra herramienta favorita para estos fines). Hay que notar que en las pruebas libres de la comunidad, como las de ELO arena, ha logrado mantenerse como líder indiscutido durante el último año (aunque cada vez con menor margen).
Comparación: en escenarios en donde la flexibilidad y el ajuste fino son cruciales, ChatGPT-4o ofrece una gran capacidad de personalización, lo que lo convierte en una opción ideal para crear asistentes de IA con conocimientos específicos. Por ejemplo, un asistente agrícola con conocimiento de plantas y plagas locales podría beneficiarse de la capacidad de ajuste de ChatGPT-4o.
Ventajas: ChatGPT ofrece una amplia gama de aplicaciones, desde la creación de contenido hasta la traducción de idiomas, sobresaliendo en múltiples áreas respecto de sus competidores. Además tiene una robusta oferta de “GPTs”, que son aplicaciones de usuarios perfeccionadas para el ambiente de ChatGPT y que mejoran dramáticamente la experiencia en la plataforma.
Desventajas: a pesar de su capacidad para generar texto creativo, ChatGPT también tiene sus limitaciones. Como aún suele ser la regla con este tipo de modelos, es suceptible a generar información inexacta o sesgada. Además, no tiene acceso a información en tiempo real, lo que limita su capacidad para responder a preguntas sobre eventos actuales.
Claude (Anthropic): el modelo de seguridad
Claude, desarrollado por Anthropic, se caracteriza por su enfoque en la seguridad y la ética. Tan es así que, dicen por ahí que Anthropic tenía un modelo superior en conocimiento y razonamiento a la versión inicial que le permitió a ChatGPT saltar a la fama, pero retrasó su publicación hasta no haber pasado todos sus filtros éticos y de seguridad.
Dicho esto, este LLM se destaca por su capacidad de razonamiento y, desde su última actualización, por su habilidad para generar texto escrito y código de alta calidad.
Desempeño: Claude se destaca por su seguridad, su capacidad de razonamiento y su generación de código de alta calidad. En pruebas estandarizadas, Claude ha demostrado un desempeño sólido en tareas que requieren precisión y comprensión de contexto.
Comparación: Claude 3 es una excelente opción para tareas que requieren complejidad y alto rendimiento, como la revisión de notas médicas para detectar inconsistencias con protocolos y tratamientos recomendados. Su enfoque en seguridad también lo convierte en una opción ideal para aplicaciones que interactúan con poblaciones vulnerables, como personas con discapacidades.
Ventajas: Claude se distingue por su seguridad, su capacidad de razonamiento, su generación de código de alta calidad y la capacidad de entablar un diálogo más natural/humano.
Desventajas: Claude tiene una disponibilidad de consultas limitada y fue entrenado a partir de una base de datos más reducida.
Llama (Meta): el LLM open source
Llama, desarrollado por Meta, es un LLM de código abierto que permite a los desarrolladores personalizar y adaptarlo a diferentes tareas. Esta característica lo convierte en una herramienta muy flexible y versátil.
Desempeño: Llama destaca por su capacidad de personalización, su flexibilidad y su adaptabilidad a diferentes tareas.
Comparación: si necesitas un control total sobre el modelo y deseas una comprensión profunda de su funcionamiento, Llama 4 (próximo a salir) es la mejor opción debido a su API de código abierto que permite modificaciones personalizadas.
Ventajas: Llama es una herramienta ideal para la investigación y el desarrollo de aplicaciones específicas. Además, el modelo es relativamente eficiente, requerimiento de bajo poder computacional para ser operado, lo que reduce dramáticamente su costo de implementación local. Como ya lo comentamos, su carácter open source facilita su accesibilidad y permite a los desarrolladores crear nuevas herramientas e innovaciones soportadas en este ambiente.
Desventajas: Llama aún requiere de más investigación y desarrollo, pues en algunos casos puede carecer de entrenamiento específico para ciertas tareas, pues el conjunto de datos sobre los que se entrena es mucho más reducido que el de sus competidores.
Ejemplos de uso práctico: encontrando el mejor LLM para cada ocasión
Partiendo de esta caracterización, a continuación les compartimos unos ejemplos prácticos sobre cómo usamos nosotros la inteligencia artificial generativa en nuestras tareas diarias, con el ánimo de darles inspiración sobre cómo explotar su potencial: