Probando algunas IA para la generación de código

Funcionan pero no tanto

Durante los pasados días he retomado mi proyecto de librería para un lector barato de rfid con el que estoy haciendo pruebas. Se puede conseguir por menos de 50 € en aliexpress y un centenar de etiquetas por muy pocos euros. Se trata de un lector chino que trabaja en UHF, lo que permite leer múltiples etiquetas al mismo tiempo.

Lamentablemente no había ningún drive para linux, el fabricante sólo proporciona el driver en C# para windows junto con una aplicación de ejemplo. Así que me ha tocado hacer mi versión multplataforma en Python.

Está todavía incompleta pero ayer me tocaba hacer la tarea que menos me gusta: los tests unitarios para el código, así que decidir intentar ver qué tal se comportaban algunas de esas IA que prometen tanto para ayudar eliminar a los desarrolladores.

Estos han sido los resultados:

  • GitHub copilot: un auténtico desastre, ni un test que siquiera se pudiera ejecutar
  • Claude.ai (versión Sonnet 4): generó muchísimos tests, 100% coverage una pinta estupenda. Sin embargo al menos 12 no pasaban. Con más de una hora de tiras y afloja consiguió arreglar la mayoría
  • ChatGPT (versión 5 thinking): no conseguía arreglar los tests que había hecho Claude, al final con mucha conversación, y yendo uno a uno , dio pistas que ayudaron a arreglar los que estaban pendientes.
  • Chat.z.ai (versión GLM-4.5): La gran sorpresa: al precio de 0 € dio mejores soluciones que chatGPT 4, y casi tan buenas como chatGPT 5. En teoría era el mejor modelo chino (por encima de, en este orden: Alibaba’s Qwen3, Moonshot AI’s K2 y Deepseek r1). Me sorprendió por la calidad de las respuestas y fue capaz de solucionar problemas que GitHub copilot ni olió, Claude enredó y chatGPT igualó, y en su versión gratuita. Gratamente sorprendido por este LLM.

La conclusión:

  • Si eres un junior y usas estas herramientas te vas a meter en un buen follón del que no vas a saber salir. Si eres senior, en algunos casos te van a ahorrar tiempo (Claude generó 53 tests en 2 minutos) pero en otros te va a tocar pelear mucho para resolver lo que dejan mal, o tener los conocimientos necesarios para arreglarlo por tu cuenta porque se pierden en las complejidades.
  • De momento, no merece la pena pagar port Copilot, Claude o ChatGPT mientras los chinos sigan sacando mes tras mes cosas tan potentes como Chat.z a coste 0. Y, si no quieres mandar tus promts a China, con la posibilidad de ejecutarlo en tu ordenador usando ollama o LM Studio si tienes una tarjeta nvidia con memoria suficiente, porque son modelos libres.

Por cierto, después de probar VSCode, Windsurf y Cursor, he abandonado esa plataforma y estoy disfrutando como un niño pequeño con Zed. Tiene la velocidad y usabilidad del viejo amigo Sublime Text pero con muchos plugins y asistentes de IA incluidos (me toca ver si lo puedo enchufar a Chat.z.ai)

IA  rfid  python