Inteligencia artificial para tu negocio parte 2
Un vistazo al estado del arte de la inteligencia artificial y cómo sacarle el máximo provecho para automatizar tareas y ser más eficiente
Antes de empezar:
Todo nuestro contenido es de libre acceso al público. La mejor forma de reconocer nuestro trabajo es ayudándonos a crecer esta comunidad, así como dándoles un “me gusta” y compartiendo nuestras publicaciones.
Si crees que el contenido y el esfuerzo lo valen, puedes invitarnos a un café a través de una suscripción paga mensual (que puedes cancelar en cualquier momento). ¡Mil gracias por tu apoyo!
Versiones en audio y video de la entrada:
La entrada:
En junio del año pasado hicimos una primera entrada explicando cómo sacarle el jugo a la inteligencia artificial en su trabajo o empresa, haciendo en el proceso un barrido de los modelos más poderosos disponibles en su momento. Pues bien, luego de un año de trabajar con inteligencia artificial y aplicándola para compañías con distintos enfoques, con Carlos nos pareció pertinente escribir una segunda entrega de esta serie de aplicaciones prácticas de la inteligencia artificial. También podríamos decir que una entrada intermedia al respecto fue nuestro bonus sobre el futuro de la inteligencia artificial.
Nuestro objetivo es mostrar todas las aplicaciones que Carlos y yo le damos ChatGPT, Claude y Gemini en nuestro día a día y profundizar en las capacidades de cada herramienta y las posibilidades que traen consigo los nuevos modelos que se anunciaron en la última semana de febrero: Claude 3.7 Sonnet y ChatGPT 4.5
Como resumen de la entrada anterior, no olviden que la clave para tener buenos resultados con la IA es un buen prompt, es decir, saber pedir bien lo que uno necesita. Y no me cansaré de recomendar la guía original de Google para Gemini, que aplica para cualquier modelo de IA.
Finalmente, si tienen experiencia con tecnología les recomiendo pegar una revisada a el prompt de sistema de V0 de Vercel. Que puede ser un gran referente de como controlar el comportamiento de los modelos.
Mi experiencia con algunos modelos
A nivel profesional, hasta ahora he probado Gemini, ChatGPT y Claude. Dado que en la primera entrada expliqué el detalle de quién las creó y las fortalezas y debilidades de cada una, en esta segunda entrada quiero entrar más a explicar cómo uso cada una:
ChatGPT de OpenAI
En parte porque fueron los primeros y también por la usabilidad y portabilidad de la aplicación, con ChatGPT es con el único que, aparte de utilizar el API para acceder al modelo en las soluciones que he creado con Dapta, tengo la suscripción Plus —que vale ~20 dólares. De entrada puedo decirles que vale cada centavo que le invierto: al menos al día tengo unas 5 conversaciones generales con ChatGPT ya sea sobre temas técnicos, dudas generales o ideas de cómo resolver algo.
De las mayores ventajas es que recuerda lo que hemos hablado, por lo que no tengo que volver a darle contexto sobre temas de mi trabajo o sobre mi capacidad. Por ejemplo, ya sabe que soy programador y tengo fondo tecnológico entonces en la mayoría de soluciones que me propone incluye código o soluciones más técnicas y profundas.
Mis casos de uso principales con ChatGPT son: ideas para resolver un problema de programación, discusiones para arquitecturas de código, revisión de errores, revisión de tildes y comas en escritura (como este artículo), generación de imágenes para artículos y presentaciones.
Como nota final, si tienen alguna de las versiones pagas también recomiendo probar “deep research”, lanzado en febrero y que se enfoca en investigar y resumir temas complejos de manera autónoma.
Gemini de Google
Debo admitir que Gemini lo he utilizado principalmente para temas de mi trabajo; no tengo muy claras sus capacidades de memoria y para resolver problemas del día a día. La gran fortaleza que veo es en transformación de datos. De lejos en temperatura 0 es el mejor modelo que he visto para generación de archivos de tipo JSON o resúmenes de largos archivos o textos. Dada la diferencia sustancial que hay en capacidad de tokens de parámetro, o en otras palabras, el tamaño de la solicitud que uno le hace al modelo, es la mejor herramienta que hay hoy en día para calificaciones de texto y transformación de data no estructurada a datos estructurados como CSV y JSON.
Claude de Anthropic
Respecto a Claude para lo que más lo uso es creatividad. Por ejemplo, para escritura de copies y textos específicos me suelo decantar por Claude por encima de ChatGPT. En las llamadas que hacemos con Dapta recomiendo Claude para casos de uso de ventas y llamadas en frío, contrario al uso de GPT 4o para asegurar que los agentes de IA cumplen con las instrucciones solicitadas.
Para continuar quiero mostrarles algunos ejemplos prácticos para que se inclinen y vean el potencial de algunas de las alternativas actuales del estado del arte de la IA más allá de sólo texto.
Demostraciones y ejemplos prácticos
Demo de Imágenes:
Para este demo pongo a prueba el conocimiento, sesgo y detalle en la generación. Este es el prompt que utilizo: “Genera una imagen realista de un paisaje de la Sierra Nevada de Santa Marta en Colombia”:
Dejo a criterio de ustedes cuál podría funcionar mejor para sus casos de uso.
Demo de voz:
Respecto a la voz, el mejor generador de voces actualmente es Elevenlabs. En su página web pueden encontrar bastantes ejemplos e inclusive crear audios con su propia voz. Y aunque aún sigue siendo muy caro, el modelo real-time de OpenAI también empieza a mostrar muy buenos resultados en voz a voz.
Demo de canvas
Uno de los casos de uso que más me gusta es probar código sin depender de herramientas locales en el PC y, en otras palabras, sin requerimiento previo de saber programar. Con canvas de OpenAI ya se puede generar código y probarlo directamente en el navegador. Acá les dejo un ejemplo creado con un par de prompts y la imagen del resultado.
Los nuevos vecinos del barrio: GPT-4.5 y Claude 3.7 Sonnet
Como lo mencioné en mi última entrada sobre reflexiones del futuro de la inteligencia artificial, varios protagonistas de la industria, como Dario Amodei, CEO de Anthropic, enfatizan la capacidad incremental de los modelos; de su habilidad para mejorar notablemente en poco tiempo.
El mejor ejemplo de esto son los modelos que fueron publicados en la última semana de febrero por OpenAI y Claude: GPT 4.5 y Claude 3.7, respectivamente.
Aunque aún me faltan más semanas de interacción para entenderlos al detalle, estos modelos son el resultado de incrementar no sólo la cantidad de datos con los que se entrenan sino, más notable aún, el tiempo que “piensan” la respuesta. Ello ha redundado en un comportamiento más humano, más natural. Hasta ahora es relativamente fácil identificar contenido completamente generado por IA, como posts de LinkedIn e imágenes, pero creo que esta nueva generación de modelos llevará a resultados más orgánicos, si se quiere, humanos.
Epílogo: navegando la ola tempranamente
Si aún estás pensando en utilizar la IA para alguna tarea o proceso dentro de tu negocio, esta es tu señal para hacerlo —tu llamado a la acción. Puede que los modelos aún fallen, “alucinen”. Puede que la calidad aún no esté en su punto, pero si desde ya empiezas a cambiar la forma en la que atacas los problemas e integras la IA en tu día a día, vas un paso adelante.
Puede que hoy aún no esté en su punto, pero si ya has dado pasos en el camino el día de mañana puede salir un nuevo modelo o nueva herramienta que de verdad resuelva con 100% de calidad tu problema.
Lo he visto en voz, lo he visto en texto y creo que lo veremos en muchos y distintos mercados. Cada día serán más los casos de uso que se resuelvan… y con la misma o mayor calidad que como los resolvemos nosotros mismos.
Si quieren que toquemos otros temas específicos de tecnología o economía, no duden en dejarnos comentarios para poder crear más contenido de valor para su crecimiento y el nuestro.
¡Por una vida más consciente y feliz!
Daniel
*Esta entrada hace parte de nuestro pilar sobre emprendimiento y liderazgo y está basada en mi experiencia trabajando con inteligencia artificial y algunos artículos al respecto.